بررسی رابطه میان مؤلفههای برنامه درسی پنهان با ابعاد گرایش به تفکر انتقادی دانشجویان
هدف پژوهش حاضر بررسی رابطه بین مؤلفههای برنامه درسی پنهان با ابعاد مقیاس گرایش به تفکر انتقادی دانشجویان بود. روش پژوهش توصیفی از نوع همبستگی بود. نمونهها بالغ بر 381 نفر از دانشجویان دانشگاه شاهد بودند. از دو مقیاس سنجش ابعاد برنامه درسی پنهان دانشگاهی و نیز مقیاس استاندارد گرایش به تفکر انتقادی کالیفرنیا (2001) استفادهشد. روایی مقیاس سنجش ابعاد برنامه درسی پنهان دانشگاهی حسب تأیید تعدادی از متخصصان موضوعی و پایایی آن نیز در آلفای کرونباخ در دو جنبه؛ مثبت و منفی برابر با 88/0 و 86/0 بود. مقیاس گرایش به تفکر انتقادی کالیفرنیا دارای روایی متناسب بود و در آلفای کرونباخ، پایایی آن برابر با 90/0 محاسبهشد. یافتهها حاکی از آن است که1. بین مجموع مؤلفههای برنامه درسی پنهان با ابعاد هفتگانه گرایش به تفکر انتقادی دانشجویان دانشگاه شاهد، همبستگی معنادار وجوددارد (برخی از ابعاد مثبت و منفی برنامه درسی پنهان با ابعادی خاص یا کل گرایش به تفکر انتقادی دانشجویان، همبستگی مثبت یا منفی معنادار داشت). 2. همبستگی بین کل مؤلفههای مثبت برنامه درسی پنهان با بعد گرایش به فراخاندیشی، مستقیم و معنادار بود.3. همبستگی بین کل مؤلفههای منفی برنامه درسی پنهان با ابعاد تحلیلگری، کنجکاوی، بلوغ در قضاوت، جستوجوگری حقایق، فراخاندیشی و نیز کل ابعاد گرایش به تفکر انتقادی دانشجویان، معکوس و معنادار بود.4. مدلهای رگرسیونی در قالب معادله چهارمتغیری جهت تحلیل سهم نسبی مؤلفههای برنامه درسی پنهان در پیشبینی گرایش به تفکر انتقادی دانشجویان (کل) نشانداد که مؤلفههای؛ «جنبه منفی محتوای دروس رشته تحصیلی» (174/0- =b)، «جنبه منفی ارزشیابی پیشرفت تحصیلی» (149/0- =b)، «جنبه مثبت محتوای دروس رشته تحصیلی» (142/0- =b) و «جنبه مثبت روش تدریس استادان» (100/0=b) درمجموع 2/30 درصد از کل واریانس گرایش به تفکر انتقادی دانشجویان را به نحو خاص خود، اعم از رابطه معنادار منفی(معکوس) یا مثبت (همسو) تبییننمودهاند (21/20=F ؛ 000/0=sig).
همبستگی تحلیل استنادی کمی و عقیده کاوی بافتارهای استنادی
هدف: تحلیل استنادی محتوا-محور، از جمله عقیدهکاوی بافتارهای استنادی، میتواند به بخشی از چالشهای تحلیل استنادی کمی پاسخ گوید. برای دستیابی به شواهد پژوهشی بیشتر، همبستگی میان نتایج دو رویکرد تحلیل استنادی کمی و عقیدهکاوانه بررسی شده است.
روششناسی: نمونهای از مقالات پزشکی به روش تحلیل استنادی با رویکرد کمی و عقیدهکاوی مطالعه شد. اطلاعات کتابشناختی و بافتارهای استنادی از پایگاه پابمد و «کولیل» استخراج و در نرمافزار «نایم» پردازش شدند. نمرههای عقیده به کمک «سنتیوردز» تعیین شد. دادهها با کمک همبستگی اسپیرمن تحلیل شدند.
یافتهها: بافتارهای استنادی دارای واژههای عقیدهای بسیاری هستند. شمار استناد با فراوانی مطلق بافتارهای استنادی عقیدهمند رابطهای قوی و مستقیم، اما با فراوانی نسبی آنها همبستگی متوسط و معکوس دارد. با افزایش استناد، فراوانی نسبی بافتارهای مثبت ثابت میماند، اما بر فراوانی نسبی بافتارهای منفی یا خنثی افزوده میشود. همچنین، شاخص استناد رابطهای معکوس با میانگین نمرات عقیدهای دارد.
نتیجهگیری: با افزایش شمار استنادها، شمار نسبی بافتارهای عقیدهمند کاسته میشود. در قطبیتها، بر شمار نسبی بافتارهای عقیدهای منفی و خنثی افزوده میشود. این یافته، لزوم تحلیلهای محتوا-محور برای تصحیح رویکرد کمی را تایید میکند.
کلیدواژهها
عنوان مقاله [English]
Correlation between Quantitative Citation Analysis and Opinion Mining of Citation Contexts
نویسندگان [English]
- Khadijeh Jokar 1
- Maryam Yaghtin 1
- Hajar Sotudeh 2
- mahdieh mirzabeigi 2
Purpose: The challenges of quantitative citation analysis are believed to be partially answered by the content-based approach, including citance opinion mining. To provide further research evidence, the present study investigated the correlation between the results of these two approaches.
Methodology: Using citation analysis method with the quantitative and opinion mining approaches, this communication explored a sample of medical papers. Bibliographic, citance and opinion data were extracted from PubMed, CoLil and SentiWords, respectively. The citances were processed using KNIME. The data were analyzed by Spearman Correlation.
Findings: The citances carried numerous opinionated words. The citation counts were directly correlated to the absolute frequency of the opinionated citances, but indirectly correlated to their relative frequency. Furthermore, they had an insignificant correlation with the relative frequency of positive contexts, while displaying significant direct relationships with negative and neutral ones. Moreover, they are indirectly associated with the average opinion scores.
Conclusion: As citation counts increase, the cited papers witness a reduction in their opinionated contexts’ relative numbers, while experiencing an increase in their negative and neutral ones’. Consequently, it is necessary to apply the content-based citation analysis to adjust the results of the quantitative approach.
همبستگی ارز چیست؟
اگر شما در حال معامله با چند جفت ارز به طور همزمان می باشید و هیچ درکی از همبستگی جفت ارزها ندارید، در حقیقت قدم در راه نابودی خود گذاشته اید.
در این مقاله شما می آموزید که همبستگی ارز چیست و چگونه از آن استفاده کنید تا یک معامله گر باهوش شوید و تصمیمات صحیح بگیرید.
همبستگی ارز چیست؟
در دنیای مالی همبستگی یک وسیله ی آماری می باشد که نشان می دهد چگونه اوراق بهادار در ارتباط با یکدیگر حرکت می کنند .
قدرت ارز یک کشور یا منطقه بستگی به شرایط اقتصادی آن منطقه دارد. بنابراین اقتصاد قوی، یک ارز را قدرتمند و اقتصاد ضعیف یک کشور، آن ارز را تضعیف می کند. در همین حال اقتصاد کشورهای مختلف همبستگی منفی یا معکوس به یک دیگر متصل هستند و این موضوع ارزهای مختلف را به نحوی به یکدیگر مرتبط می کند.
برای مثال قاره اروپا، انگلیس و کشورهای اتحادیه اروپا به یکدیگر متکی هستند، زیرا آنها کالاها و خدمات مختلفی را با یکدیگر مبادله می کنند. به همین دلیل ارزش پوند انگلیس تحت تاثیر هر گونه تغییر در اقتصاد سایر کشورهای اتحادیه اروپا است.
همین رابطه را می توان در اقتصادهای سرتاسر جهان مشاهده کرد و این همان چیزی است که همبستگی ارزهای مختلف در بازار فارکس را ایجاد می کند.
مبحث همبستگی جفت ارزها در فارکس مبحثی است بسیار مهم که شاید کمتر به آن توجه می شود. برای یک تریدر حرفه ای بودن لازم است که، معامله گر همواره تاثیرپذیری خود را از نوسانات مداوم بازار بررسی کند به خصوص اگر در بازار فارکس (Forex Market) فعالیت داشته باشد.
از آنجا که در بازار فارکس ارزها بصورت جفت قیمت گذاری میشوند، هیچ جفت واحدی مستقل از بقیه جفت ارزها معامله نمیشود. هنگامی که از همبستگی میان جفت ارزها آگاه شوید میتوانید به طور کامل از عوامل تاثیرگذار بر مجموع معاملات خود اطلاع داشته باشید.
بنابراین همبستگی ارز یا Currency Correlation به ما می گوید که آیا دو جفت ارز هم جهت، خلاف جهت یا کاملا بصورت تصادفی نسبت به یکدیگر در طی یک بازهی زمانی حرکت می کنند یا نه.
اگر شما می خواهید فقط بر روی یک جفت ارز معامله کنید که هیچ ،در غیر این صورت اگر می خواهید چند جفت ارز را با هم معامله کنید خیلی مهم است که بدانید چگونه جفت ارز های مختلف در ارتباط با یکدیگر حرکت می کنند.
ضریب همبستگی یا کورولیشن یک ابزار آماری است و فرمول ریاضی مخصوص به خود را دارد. این ضریب نشان می دهد که دو سری از اعداد با چه ارتباطی نسبت به یکدیگر تغییر کرده اند.
برای مثال ممکن است یک تحلیلگر بخواهد رابطه بین میزان صادرات یک کشور و ارزش ارز آن کشور در برابر دلار را بسنجد. در این حالت داده های هر دو متغیر در بازه های زمانی مساوی (مثلا فصلی یا سالیانه) با استفاده از فرمول ضریب همبستگی با یکدیگر مقایسه می شوند.
فرمول ضریب همبستگی به گونه ای طراحی شده است که نتیجه آن عددی بین 1- و 1+ بدست می آید.
ضریب همبستگی (0)
ضریب همبستگی 0 به معنی عدم همبستگی است و یعنی هیچ رابطه ای بین حرکت جفت ارزها با یکدیگر وجود ندارد.
ضریب همبستگی مثبت (1+ تا 0)
وقتی ضریب همبستگی یک متغیری (در فارکس جفت ارز) عددی بین 0 تا1+ باشد یعنی تغییرات جفت ارزها در یک جهت مثبت رخ می دهد.
به طور مثال اگر ضریب همبستگی جفت ارز دوم 0.8+ نسبت به جفت ارز اول باشد و جفت ارز اول در جهت مثبت حرکت کند، جفت ارز دوم به اندازه 0.8+ نسبت به جفت ارز اول در جهت مثبت حرکت خواهد کرد. در این حالت همبستگی 1+ به معنی همبستگی مثبت کامل است، یعنی اگر یک جفت ارز 1٪ رشد کند، جفت ارز دیگر نیز 1٪ رشد خواهد کرد.
ضریب همبستگی مثبت (0 تا 1-)
وقتی ضریب همبستگی یک متغیری(در فارکس جفت ارز) عددی بین 1- تا 0 باشد، یعنی تغییرات جفت ارزها در یک جهت منفی رخ می دهد.
به طور مثال اگر ضریب همبسنگی جفت ارز دوم 0.8- نسبت به جفت ارز اول باشد و جفت ارز اول در جهت مثبت حرکت کند، جفت ارز دوم به اندازه 0.8- یا 80% نسبت به جفت ارز اول در جهت معکوس حرکت خواهد کرد. در این حالت همبستگی 1- به معنی همبستگی منفی کامل است، یعنی اگر یک جفت ارز 1٪ رشد کند جفت ارز دیگر 1٪ تضعیف خواهد شد.
از جدول زیر میتوانید به عنوان یک راهنما برای تفسیر مقادیر ضرایب همبستگی مختلف استفاده کنید.
فرمول محاسبه ضریب همبستگی ارزها
یک تریدر فارکس نیازی به دانستن فرمول محاسبه ضریب همبستگی ارزها در فارکس ندارد و علت آن هم وجود جداول ضریب همبستگی در مراجع مختلف است. اما جهت اطلاعات بیشتر فرمول به صورت زیر میباشد:
در حالی که این فرمول پیچیده به نظر می رسد مفهوم کلی این است که نقاط داده را از دو جفت x و y می گیرد و سپس آنها را با میانگین خوانده شده در این جفت ها مقایسه می کند. قسمت بالای معادله، کوواریانس و قسمت پایینی انحراف استاندارد است.
به عنوان مثال نقاط داده را قیمت های پایانی برای هر روز یا ساعت در نظر بگیرید. قیمت پایانی x (و y) با میانگین قیمت بسته شدن x (و y) مقایسه می شود ، بنابراین یک معامله گر می تواند مقادیر پایانی و میانگین را در فرمول وارد کند تا نحوه حرکت جفت ها با هم را استخراج کند.
برای به دست آوردن میانگین نیاز به ردیابی چندین قیمت بسته شدن در برنامه ای مانند صفحه گسترده Microsoft Excel است. پس از ثبت چندین قیمت بسته شدن ، می توان میانگین را تعیین کرد که با ورود قیمت های جدید به طور مداوم به روز می شود. این مقدار به همراه مقادیر جدید برای x به فرمول وصل می شود.
دلایل استفاده از جعبه ابزار معاملات به شرح زیر است :
1- حذف کردن معاملاتی که معکوس یکدیگر هستند :
استفاده از همبستگی به شما کمک می کند که از معاملاتی که اثر یکدیگر را خنثی می کنند دوری کنید .به طور مثال ما می دانیم که EUR/USD و USD/CHF به صورت 100% در خلاف جهت همدیگر حرکت می کنند، بازکردن یک موقعیت خرید در EUR/USD و همچنین خرید USD/CHF بیهوده و گاهی سنگین خواهد بود. افزون بر اینکه باید دو بار اسپرد بپردازید، هر حرکتی در قیمت،یکی از جفت ها را بالا برده و جفت ارز دیگر را پایین می آورد.
2- سود های افزایشی یا ضررهای افزایشی :
شما این فرصت را دارید که به منظور به حداکثر رساندن سود، یک موقعیت را دوبرابر کنید. به طور مثال دو جفت ارز GBP/USD و EUR/USD را در نظر بگیرید. این دو جفت ارز دارای همبستگی مثبت قوی می باشند که در آن GBP/USD قدم به قدم EUR/USD را دنبال میکند. باز کردن یک موقعیت خرید در هر دو جفت ارز مثل این است که EUR/USD را معامله کنید و معامله ی خود را دو برابر کنید.
در این حالت شما در واقع دارید از اهرم استفاده می کنید. اگر در جهت مناسب حرکت کند سودهای بالایی کسب می شود و اگر در جهت مخالف حرکت کند ضرر بسیاری متحمل خواهید شد.
3- توزیع ریسک :
فهم اینکه همبستگی و ارتباط بین ارزها وجود دارد به شما اجازه می دهد که از جفت ارزهای متفاوت استفاده کرده و قدرت دید شما را افزایش می دهد . به جای اینکه همیشه بر روی یک جفت ارز معامله کنید، شما می توانید ریسک خود را بین دو جفت ارز که در یک جهت حرکت می کنند تقسیم کنید .
جفت ارز هایی که همبستگی قوی تا بسیار قوی دارند ( بین 0.7 ) را انتخاب کنید . به عنوان مثال EUR/USDوGBP/USD تمایل دارند که با هم حرکت کنند ، همبستگی ناقص بین این دو جفت ارز به شما این اجازه را می دهد که ریسک خود را کاهش دهید.
فرض کنیم که شما معتقدید که ارزش USD افزایش می یابد، به جای باز کردن دو موقعیت فروش در EUR/USD شما می توانید یک معامله فروش در EUR/USD و یک فروش دیگر در GBP/USD داشته باشید که می تواند در برابر برخی ریسک ها به عنوان سپر عمل کند و به معاملات کلی شما تنوع ببخشد.
در مواقعی که دلار آمریکا ارزش خود را از دست می دهد ممکن است که یورو خیلی کمتر از پوند تحت تاثیر قرار گیرد.
4- محافظت از سرمایه :
حفاظت از سرمایه می تواند منجر به واقعی کردن سودهای کوچکتر شود، همچنین می تواند ضررها را به حداقل برساند. اگر شما همبستگی منفی یا معکوس یک موقعیت خرید در EUR/USD باز کرده اید و این معامله در خلاف جهت مورد نظر شما حرکت کند یک موقعیت خرید کوچک در جفتی که در خلاف جهت EUR/USD حرکت می کند مثل USD/CHF باز کنید.با این کار بیشتر ضرر شما جبران می شود!
نکته قابل تامل این است که همبستگی هر زمانی ممکن است که تضعیف یا تقویت شود، بنابراین لازم است که از همبستگی به روز استفاده شود.
5- تایید شکست مقاومتها و مشخص کردن شکست های غیرواقعی :
شما می توانید از همبستگی ارز برای تایید سیگنال های ورود و خروج معاملات خود استفاده کنید. به عنوان نمونه فرض کنید EUR/USD ظاهرا در حال حاضر دارای یک سطح حمایتی مهم می باشد .شما واکنش قیمت را مشاهده می کنید و به دنبال فروش در قسمت پایین رو برای شکست قیمت هستید .از آنجایی که شما می دانید EUR/USD با GBP/USD به صورت مثبت و با USD/CHF و USD/JPY به صورت منفی همبستگی دارند بررسی می کنید که آیا سه جفت ارز دیگر به اندازه ی EUR/USD حرکت می کنند یا خیر .
شما متوجه می شوید که GBP/USD در یک موقعیت سطح حمایت مهمی قرار گرفته است و هر دوی USD/CHF و USD/JPY در سطوح مقاومت کلیدی ای قرار دارند، این به شما می گوید که حرکت اخیر مربوط به دلار آمریکا بوده و شکست قیمت محتملی برای EUR/USD تایید میکند، زیرا سه جفت ارز دیگر به صورت مشابه حرکت می کنند.
بنابراین تصمیم می گیرید که وقتی قیمت شکسته شد معامله کنید.
تغییر در همبستگی ارزها
جدول همبستگی ارزها تنها یک راهنما جهت یافتن همبستگی های قوی مثبت و منفی بین ارزها می باشد. اما این ارتباط می تواند در طول زمان تغییر کند.
اگر به تصاویر توجه کنید مشاهده می کنید که با تغییر تایم فریم، ضریب همبستگی جفت ارزها نیز تغییر می کنند. این چیزی است که شما بایستی همیشه هنگام بکارگیری همبستگی ارزها در استراتژی خود به آن توجه کنید.
جدول بالا همبستگی ارزها را در تایم فریم 5 دقیقه ای نشان می دهد. در این تایم فریم، جفت ارزهای USD/JPY و USD/HKD دارای همبستگی معکوس قوی هستند و در جهت خلاف یکدیگر حر کت می کنند.
جدول بالا همبستگی ارزها را در تایم فریم روزانه نشان می دهد. در این جدول مشاهده می کنیم که جفت ارزها غیر از دقایقی که در طول روز رفتار متضاد داشته اند دارای همبستگی مثبت نیز هستند.
بنابراین در این شرایط اگر شما در طول روز از ضریب همبستگی جفت ارزها در تایم فریم 5 دقیقه ای استفاده می کردید احتمالا همه موقعیت های معاملاتی برخلاف شما حرکت می کردند.
همچنین این مسئله مهمی است که شما از بروزترین جدول همبستگی ارزها استفاده کنید تا بر اساس داده های قدیمی و منسوخ تصمیم گیری نکنید. جهت مشاهده همبستگی جفت ارزها می توانید از سایت myfxbook.com استفاده کنید.
بیت کوین (Bitcoin) در حال بهبود ، آیا قیمت بیت کوین (BTC) با سایز ممپول (Mempool) همبستگی معکوس دارد؟
پس از صعود بیت کوین از سطح ۳۷۷۵ دلار به ۶،۴۵۰ دلار ، قیمت بیت کوین (Bitcoin (BTC در دامنه فشرده ای قرار گرفت و شاهد تلاش قیمت برای صعود به بالاتر از سطح مقاومت ۶،۴۰۰ و ۶،۸۵۰ دلار بوده ایم. با وجود پولبک (pullback) فعلی قیمت ، شاخص های تکنیکال مانند مدل سهام به جریان (Stock-to-Flow) و رشد مداوم هش ریت شبکه نشان می دهند که سرمایه گذاران اعتماد به نفس کمی برای فعالیت در بازار به دست آورده اند.
یکی دیگر از فاکتورهایی که مورد توجه قرار گرفته است سایز ممپول (mempool) بیت کوین (Bitcoin) است که می تواند اطلاعاتی از نحوه واکنش خریداران و فروشندگان در این مواقع نامشخص ارائه دهد.
بررسی هفتگی بازار کریپتوکارنسی. منبع: Coin360
ممپول (Mempool) یا مموری پول (memory pool) در واقع اتاق انتظاری برای تمامی تراکنش های تایید نشده بیت کوین (Bitcoin) است تا زمانی که تمام تاییدیه ها برای انجام تراکنش ها صادر شوند. هرچه سایز ممپول بیشتر باشد ، تأیید تراکنش ها بیشتر طول می کشد زیرا بلاک های بیشتری باید تأیید شوند (همچنین نیروی بیشتری نیز لازم خواهد بود).
اگر به دلیل اندازه غیر نرمال تراکنش های در انتظار تأیید ، فشردگی (jam) در مموری پول (memory pool) اتفاق بیفتد ، احتمال بالا رفتن کارمزد (Fee) تراکنش برای تسریع انجام آن بیشتر خواهد بود.
چند روز پس از آن که قیمت بیت کوین (Bitcoin) به آرامی از اوج تاریخی خود در ۲۰،۰۰۰ دلار عبور کرد سایز ممپول (Mempool) بیت کوین (Bitcoin) در ژانویه ۲۰۱۸ به رکورد بالای بیش از ۱۳۰ مگابایت در هر بلاک رسید .
سایز ممپول (Mempool) بیت کوین (Bitcoin) (مگابایت / بلاک) از ژوئن ۲۰۱۶ تا مارس ۲۰۲۰٫ منبع: Blockchain.com
این نمودار می تواند رابطه بین تعداد تراکنش های در انتظار تأیید و حرکت قیمت بیت کوین (Bitcoin) را نشان دهد. طبق این نمودار ، این رابطه در زمان اصلاحات قیمت معكوس خواهد بود مانند آنچه در حال حاضر سرمایه گذاران با آن روبرو هستند.
در سال ۲۰۲۰ شاهد رابطه معکوس سایز ممپول (mempool) و قیمت بیت کوین (Bitcoin) بوده ایم
با در نظر گرفتن دوره ای از ۱۹ فوریه تا ۱۳ مارس ، زمانی که قیمت بیت کوین ۶۰ درصد سقوط کرده بود ، متوجه می شویم که همبستگی بین سایز ممپول (Mempool) بیت کوین (Bitcoin) و قیمت آن در این دوره ، منفی ۴۱٫۲ درصد است. با توجه به اینکه این همبستگی برای کل سال ۲۰۲۰ به میزان ۳۴/۲ درصد است ، این رابطه بسیار قابل توجه است.
همبستگی ۱۰۰ درصد به این معنی است که قیمت بیت کوین (Bitcoin) و سایز ممپول (mempool) کاملاً در یک راستا حرکت می کنند ، در حالی که همبستگی منفی ۱۰۰ درصد به این معنی است که آنها با یکدیگر رابطه معکوس دارند. همبستگی ۰ درصد نیز به این معنی است که این متغیرها به هیچ وجه با یکدیگر مرتبط نیستند.
مفاهیم بنیادی کوواریانس و همبستگی در یادگیری ماشین
اغلب داده کاوی به یکپارچه سازی داده ها یعنی ادغام داده ها از چندین منبع داده ای نیاز دارد. یکپارچه سازی دقیق می تواند به کاهش و اجتناب از افزونگی و ناسازگاری ها در مجموعه داده ای کمک کند. همچنین باعث بهبود دقت و سرعت فرآیندهای بعدی داده کاوی می شود.
افزونگی چیست؟
افزونگی یکی دیگر از موضوعات مهم در یکپارچه سازی داده است. یک صفت خاصه (مانند درآمد سالیانه) ممکن است افزونه تلقی شود اگر بتوانیم با کمک مقادیر دیگر صفات خاصه آن را به دست آوریم (جدول شماره 1) ناسازگاری ها در صفات خاصه یا نام گذاری ابعاد نیز باعث افزونگی در مجموعه داده ای می شود.
جدول 1
در این جدول مشاهده می کنید که به راحتی می توان با ستون های یک تا سه اطلاعات ستون چهارم را به دست آورد ( درآمد به ازای ساعت * میزان ساعت کارکرد در روز * تعداد روز های حضور در طول یک ماه * 12 = درآمد سالیانه). بنابراین وجود ستون چهارم اشتباه و افزونه است.
هبستگی چیست؟
یک رابطه همبستگی (correlation) میان دو ستون A و B را می توان با کمک آزمون همبستگی کشف نمود. در صورتیکه همبستگی کم باشد، می گوییم رابطه خطی (linear relationship) وجود ندارد. درصورتیکه دو ستون همبستگی داشته باشند عموما به این معناست وجود هر دو لازم نیست و در کنار یکدیگر لزوما باعث بهبود مدل یادگیری نمی شوند ( با این حال مطلب گفته شده به تعداد نمونه هایی که بررسی می کنید و نوع صورت مسئله خیلی بستگی دارد که بیشتر این موارد به تجربه و مباحث پیشرفته ختم می شود.)
مثالی که از همبستگی می توان زد به این شکل است که فرض کنید همبستگی منفی یا معکوس با یک جمعیت 1500 نفری از زن و مرد روبه رو هستیم، که هر یک از آن ها علاقه ی خود را برای مطالب تخیلی و غیر تخیلی بیان نموده اند. بنابراین دارای دو صفت خاصه ( ستون ) جنسیت با دو مقدار مرد یا زن و علاقه افراد با دو مقدار تخیلی و غیر تخیلی هستیم.
محاسبه همبستگی و نمایش آن در نمودار پراکنشی روش مفیدی برای تشخیص خوشه ها، داده های پرت و همچنین مشاهده ی همبستگی احتمالی میان داده ها است. دو صفت خاصه ی X و Y هنگامی همبسته هستند که بتوان رابطه ای میان آن ها پیدا کرد. ممکن است دو صفت خاصه دارای همبستگی نباشد و یا دارای همبستگی مثبت یا منفی باشند.
برای درک این موضوع ابتدا باید کوواریانس را به خوبی یاد بگیریم.
نمونه ای از نمودار پراکنشی یا نقطه ای
کوواریانس چیست؟
در تئوری آمار و احتمال، همبستگی و کوواریانس دو سنجه مشابهی هستند که برای ارزشیابی تغییرات دو صفت خاصه با یکدیگر از آن ها استفاده می شود.فرض کنید مجموعه داده ای ما دارای دو صفت خاصه ی عددی A و B با مقادیر مشاهده شده ی < (a1, b1). (an, bn) >می باشد. مقادیر میانگین برای دو صفت خاصه همچنین به عنوان مقادیر مورد انتظار نیز شناخته می شوند. جدول و نمودار 2 را به عنوان مثال در نظر بگیرید.
جدول و نمودار 2
اکنون کاملا واضح است که نقاط قرار گرفته در نمودار متناظر با اعداد داخل جدول است. اکنون با رسم یک خط می خواهیم مشخص کنیم مدل رفتار این نقاط خطی یا غیر خطی است.
نمودار 3) مدل رفتاری داده داده ها
اکنون با رسم این نمودار کاملا متوجه شدیم که رفتار داده های ما خطی است. به راحتی برای ما قابل درک است که اگر محور x رشد کند، محور y نیز رشد می کند بنابراین می گوییم این دو محور تمایل به رفتار مشابه دارند. پس می توان این مفهوم را تلقی کرد که رشد دو محور ما را به هدف total یا جمعی می رساند. فرض کنید محور x نرخ رشد جمعیت و محور y میزان تورم را نمایش می دهد. نتیجه این دو محور اگر تمایل به رفتار مشابه داشته باشد، می گوییم رشد جمعیت باعث رشد تورم می شود.
در این حالت می گوییم این دو صفت خاصه رابطه خطی مثبت دارند.
این چیزی است که به آن کوواریانس می گوییم.
کوواریانس چیست؟ در کوواریانس بررسی می کنیم که اگر متغیری تغییر کند باقی متغیرها چه رفتاری نشان می دهند. بنابراین کوواریانس رابطه ای میان دو متغیر را بررسی می کند. دقت کنید که کوواریانس تنها در مورد رفتار ( جهت ) حرکت دو صفت خاصه صحبت می کند نه در باره میزان قدرت حرکت آن دو. اگر نمودار هیچ الگویی نداشته باشد می گوییم کواریانس نزدیک به صفر است.
نمودار 4) درک مفهوم کوواریانس مثبت
کوواریانس مثبت: اگر نمودار خطی ما رفتاری به شکل نمودار 4 داشته باشد می گوییم کوواریانس مثبت است. یا به عبارتی اگر نتیجه کوواریانس ما مثبت باشد، چنین نموداری را می توانیم متصور شویم که به این منظور تلقی می شود اگر محور x رشد کند، محور y نیز رشد می کند و اگر محور x افت کند، محور y نیز افت می کند.
کوواریانس منفی: اگر نمودار خطی ما رفتاری به شکل نمودار 5 داشته باشد می گوییم کوواریانس منفی است. یا به عبارتی اگر نتیجه کوواریانس ما منفی باشد، چنین نموداری را می توانیم متصور شویم که به این منظور تلفی می شود اگر محور x کاهش پیدا کند، محور y رشد می کند و اگر محور x رشد کند، محور y کاهش میابد.
کوواریانس صفر: اگر نمودار ما به شکل پخش یا به اصطلاح مانند تیرهای شاتگان روی صفحه باشد به دلیل اینکه هیچ نمودار خطی نمی توان رسم کرد، گفته می شود کوواریانس نزدیک به صفر است.
اکنون به فرمول محاسباتی کوواریانس می رسیم:
فرمول های کوواریانس
نکته ای که در فرمول بالا وجود دارد رنگ آبی و رنگ قرمز است که هر دو آن ها میانگین هستند. در جایی که منظور جمعیت باشد میو (سمبل رنگ آبی) نوشته می شود و جایی که نمونه باشد xبار (سمبل رنگ قرمز) نوشته می شود.
حال مثال زیر را در نظر بگیرید:
جدول 6) مثالی از محاسبه کوواریانس
جدول 7) محاسبه نتیجه کوواریانس
اکنون دیدی که مقدار کوواریانس ما 106.93 شد. در کوواریانس خود عدد معنایی ندارد و چیزی که برای ما مهم است تنها علامت عدد است تا بگوییم اگر عدد مثبت است بنابراین نمودار خطی ما مثبت است و اگر عدد علامت عدد منفی است گفته می شود که نمودار خطی ما منفی است.
بنابراین نتیجه زیر را به راحتی متصور می شویم:
نمودار 8) محاسبه نتیجه کوواریانس
تا اینجای کار کاملا مفهوم همبستگی و کوواریانس را به خوبی درک کرده اید. اما کوواریانس به تنهایی کافی نیست به این دلیل که قدرت رابطه میان صفات خاصه را نمایش نمی دهد. برای محاسبه قدرت رابطه میان دو صفت خاصه باید از رابطه Pearson's Product Moment Coeficient یا ضریب همبستگی برای داده های عددی را محاسبه کرد.
نتیجه گیری:
جمع بندی واریانس و کوواریانس:
واریانس و انحراف استاندارد سنجه های پراکندگی داده ها هستند. آن ها چگونگی توزیع داده ها را نشان می دهند. مقدار کم انحراف استاندارد نشان می دهد که داده های مشاهده شده بسیار به میانگین نزدیک هستند، در حالیکه مقدار بزرگ برای انحراف استاندارد نشان دهنده این است که داده ها در محدوده بزرگی از مقادیر پخش شده اند. بنابراین انحراف استاندارد شاخص خوبی برای بیان پراکندگی مجموعه داده ها محسوب می شود. در پایگاه داده های بزرگ محاسبه واریانس و انحراف استاندارد مقیاس پذیر است.
در کوواریانس بررسی می کنیم که اگر یکی از مقادیر صفت خاصه ای تغییر کند باقی صفات خاصه چه رفتاری نشان می دهند. بنابراین کوواریانس رابطه ای میان دو متغیر را بررسی می کند. دقت کنید که کوواریانس تنها در مورد رفتار ( جهت ) حرکت دو صفت خاصه صحبت می کند نه در باره میزان قدرت حرکت آن دو. اگر نمودار هیچ الگویی نداشته باشد می گوییم کواریانس نزدیک به صفر است.
اگر مثالی از جبر خطی تا کنون می خواستید، مفهوم کوواریانس از بهترین توصیفات جبر خطی است.
دیدگاه شما