ضریب همبستگی پیرسون (Pearson correlation coefficient) یک روش مبتنی بر آمار پارامتریک است که شدت و جهت رابطه دو متغیر را نشان میدهد. این روش هم مثل سایر روشهای همبستگی روابط بین متغیرها را دو به دو در نظر میگیرد. یعنی در صورتی که رابطه بین دو متغیر A و B را با حضور یا بدون حضور متغیری مانند C ارزیابی کنیم، همچنان میزان این رابطه یکسان به دست میآید. این روش که توسط کارل پیرسون (Karl Pearson) بر اساس ایدهٔ اولیهٔ فرانسیس گالتون (Sir Francis Galton) تدوین شد، مبتنی بر مفروضات آمار پارامتریک است.
در زمان بررسی همبستگی بین دو متغیر، اگر هر دو متغیر مورد نظر در مقیاس نسبی و فاصلهای باشند، از ضریب همبستگی پیرسون استفاده میشود. در صورتی که ضریب همبستگی جامعه ρ و ضریب همبستگی نمونهای به حجم n از جامعه r باشد، ممکن است r به صورت تصادفی و اتفاقی به دست آمده باشد. برای این منظور، آزمون معنیداری ضریب همبستگی مورد استفاده قرار میگیرد. با استفاده از این آزمون، بررسی میکنیم که آیا دو متغیر تصادفی و مستقل هستند یا خیر. به بیان دیگر، بررسی میکنیم که آیا ضریب همبستگی جامعه صفر است یا خیر.
این ضریب میزان همبستگی بین دو متغیر فاصلهای یا نسبی را محاسبه میکند که مقدار آن بین ۱+ و ۱- متغیر است. در صورتی که مقدار به دست آمده مثبت باشد، به این معنی است که تغییرات دو متغیر به صورت هم جهت اتفاق میافتد. به عبارت دیگر، با افزایش در هر متغیر، متغیر دیگر نیز افزایش مییابد. در مقابل، اگر مقدار r منفی شد، به این معنی است که دو متغیر در جهت عکس هم عمل میکنند.
به عبارت دیگر، با افزایش مقدار یک متغیر، مقادیر متغیر دیگر کاهش مییابد و بر عکس. از سوی دیگر، اگر مقدار به دست آمده صفر باشد، نشان میدهد که هیچ رابطهای بین دو متغیر وجود ندارد و اگر ۱+ باشد، همبستگی مثبت کامل و اگر ۱- باشد، همبستگی کامل و منفی است.
محاسبه ضریب همبستگی پیرسون
ضریب همبستگی پیرسون میان دو متغیر تصادفی برابر با کوواریانس آنها تقسیم بر انحراف معیار آنها تعریف میشود.
در مورد یک جامعهٔ آماری، ضریب همبستگی جامعه به صورت زیر تعریف میشود:

که در این معادله، cov کوواریانس، σx انحراف معیار متغیر X، µx میانگین متغیر X و E امید ریاضی است. منظور از امید ریاضی مقدارِ قابل انتظاری از یک متغیر تصادفیِ گسسته است که برابر است با مجموع حاصلضرب احتمالِ وقوع هر یک از حالات ممکن در مقدار آن حالت.
برای یک نمونه آماری با n زوج داده (Xi, Yi)، ضریب همبستگی پیرسون به صورت زیر تعریف میشود:

فرمول زیر نیز معادل تعریف فوق است:

که در آن، کمیتها به شکل زیر تعریف شدهاند:

همان طور که پیش از این گفته شد، ضریب همبستگی پیرسون بین -1 و 1 تغییر میکند. اگر r=1 باشد، نشان دهنده رابطه مستقیم کامل بین دو متغیر است. رابطه مستقیم یا مثبت نشان میدهد که اگر یکی از متغیرها افزایش (کاهش) یابد، دیگری نیز افزایش (کاهش) مییابد.
در صورتی که r= -1 باشد، آن گاه رابطه معکوس کاملی بین دو متغیر وجود دارد. رابطه معکوس یا منفی حاکی از آن است که اگر یک متغیر افزایش یابد، متغیر دیگر کاهش مییابد و بر عکس.
زمانی که ضریب همبستگی برابر صفر باشد، حاکی از آن است که بین دو متغیر رابطه خطی وجود ندارد.
چند نکته مهم در مورد ضریب همبستگی پیرسون
- صفر بودن ضریب همبستگی تنها نشان دهنده عدم وجود رابطه خطی بین دو متغیر است اما نمیتواند مستقل بودن دو متغیر را نیز نشان دهد. زمانی که ضریب همبستگی پیرسون بین دو متغیر برابر با صفر باشد، این متغیرها فقط در صورتی مستقل از یکدیگر هستند که توزیع متغیرها نرمال باشد.
- همبستگی بین دو متغیر تنها نشان میدهد که افزایش یا کاهش یک متغیر چه تاثیری بر افزایش یا کاهش متغیر دیگر دارد اما این همبستگی لزوما نشان دهنده رابطه عِلّی بین متغیرها نیست. به عنوان مثال، اگر در یک تحقیق، دو متغیر قد و تحصیلات همبستگی مثبت بالایی نسبت به هم داشته باشند، نمیتوانیم نتیجه بگیریم که افراد با قد بلندتر دارای تحصیلات بیشتری هستند. بنابراین، لازم است تا بین مفاهیم همبستگی و رابطه علّت و معلولی تفاوت قائل شویم. به عبارت دیگر، ممکن است دو متغیر همبستگی داشته باشند اما لازم نیست که یکی از متغیرها علت و دیگری معلول باشد. علاوه بر این، عوامل متعدد دیگری هم میتوانند بر ضریب همبستگی اثر گذارند.
سوالات متداول
تعریف ضریب همبستگی پیرسون چیست؟
ضریب همبستگی پیرسون (r) رایج ترین روش برای اندازه گیری همبستگی خطی است. عددی بین 1- و 1 که قدرت و جهت رابطه بین دو متغیر را اندازه گیری می کند.
فرمول پیرسون r چه کاربردی دارد؟
از ضرایب همبستگی برای سنجش میزان قوی بودن رابطه بین دو متغیر استفاده می شود. انواع مختلفی از ضریب همبستگی وجود دارد، اما محبوب ترین آنها ضریب پیرسون است. همبستگی پیرسون (همچنین R پیرسون نامیده می شود) یک ضریب همبستگی است که معمولاً در رگرسیون خطی استفاده می شود.
چه زمانی از ضریب همبستگی پیرسون استفاده می شود؟
زمانی باید از ضریب همبستگی پیرسون استفاده کنید که رابطه خطی است، هر دو متغیر کمی هستند و به طور معمول توزیع می شوند.