تفاوت بین همبستگی و رگرسیون خطی چیست؟

  • 2021-10-21

هنگام بررسی رابطه بین دو یا چند متغیر عددی ، مهم است که تفاوت بین همبستگی و رگرسیون را بدانید. شباهت ها/تفاوت ها و مزایای/مضرات این ابزارها در اینجا به همراه نمونه هایی از هر یک مورد بحث قرار گرفته است.

همبستگی جهت و قدرت رابطه بین دو متغیر عددی ، x و y را تعیین می کند و همیشه بی ن-1. 0 و 1. 0 قرار دارد. رگرسیون خطی ساده از طریق معادله فرم y = a + bx ، x را به y مربوط می کند.

شباهت های کلیدی

  • هر دو جهت و قدرت رابطه بین دو متغیر عددی را تعیین می کنند.
  • هنگامی که همبستگی (R) منفی باشد ، شیب رگرسیون (B) منفی خواهد بود.
  • وقتی همبستگی مثبت باشد ، شیب رگرسیون مثبت خواهد بود.
  • همبستگی مربع (R2 یا R2) در رگرسیون خطی ساده معنای خاصی دارد. این نشان دهنده نسبت تنوع در Y توضیح داده شده توسط x است.

تفاوت های کلیدی

  • رگرسیون تلاش می کند تا مشخص کند که چگونه X باعث تغییر Y می شود و در صورت تعویض X و Y ، نتایج تجزیه و تحلیل تغییر می کند. با همبستگی ، متغیرهای X و Y قابل تعویض هستند.
  • رگرسیون فرض می کند x بدون خطایی مانند مقدار دوز یا تنظیم دما ثابت است. با همبستگی ، x و y به طور معمول هر دو متغیر تصادفی*مانند قد و وزن یا فشار خون و ضربان قلب هستند.
  • همبستگی یک آمار واحد است ، در حالی که رگرسیون یک معادله کامل را تولید می کند.

*متغیر X را می توان با همبستگی ثابت کرد ، اما فواصل اطمینان و تست های آماری دیگر مناسب نیستند. به طور معمول ، هنگام رفع X از رگرسیون استفاده می شود.

در مورد همبستگی در مقابل تحلیل رگرسیون با این فیلم توسط 365 Data Science اطلاعات بیشتری کسب کنید

مزیت اصلی همبستگی

همبستگی خلاصه ای مختصر تر (یک ارزش) از رابطه بین دو متغیر نسبت به رگرسیون است. در نتیجه ، بسیاری از همبستگی های زوج را می توان همزمان با هم در یک جدول مشاهده کرد.

مزیت اصلی رگرسیون

رگرسیون یک تجزیه و تحلیل دقیق تر را ارائه می دهد که شامل معادله ای است که می تواند برای پیش بینی و/یا بهینه سازی استفاده شود.

نمونه همبستگی

به عنوان نمونه ، بیایید آموزش Prism را در مورد ماتریس همبستگی که شامل یک مجموعه داده خودرو با هزینه در USD ، MPG ، اسب بخار و وزن در پوند به عنوان متغیرها است ، طی کنیم. به جای اینکه فقط به همبستگی بین یک x و یک y نگاه کنیم ، می توانیم با استفاده از ماتریس همبستگی Prism ، همه همبستگی های زوج را ایجاد کنیم. اگر به Prism دسترسی ندارید ، آزمایش 30 روزه رایگان را در اینجا بارگیری کنید. این مراحل منشور است:

  1. منشور را باز کنید و چندین متغیر را از صفحه سمت چپ انتخاب کنید.
  2. شروع را با داده های نمونه انتخاب کنید تا یک آموزش را دنبال کنید و ماتریس همبستگی را انتخاب کنید.
  3. روی ایجاد کلیک کنید.
  4. روی تجزیه و تحلیل کلیک کنید.
  5. Select Multiple variable analyses >ماتریس همبستگی.
  6. دو بار OK را کلیک کنید.
  7. در پنل سمت چپ ، بر روی نمودار با عنوان Pearson R: همبستگی داده 1 دوبار کلیک کنید.

ماتریس همبستگی منشور تمام همبستگی های زوجی را برای این مجموعه از متغیرها نشان می دهد.

  • جعبه های قرمز متغیرهایی را نشان می دهند که رابطه منفی دارند.
  • جعبه های آبی متغیرهایی را نشان می دهند که رابطه مثبت دارند
  • هرچه جعبه تیره تر باشد ، همبستگی با منفی یا مثبت 1 نزدیک تر است.
  • جعبه های مورب آبی تیره را نادیده بگیرید زیرا همیشه همبستگی 1. 00 دارند.

یافته های کلیدی:

  • اسب بخار و MPG رابطه منفی قوی دارند (R = -0. 74) ، اتومبیل های اسب بخار بالاتر دارای MPG کمتری هستند.
  • اسب بخار و هزینه دارای رابطه مثبت قوی (88/0 = r) ، ماشین های اسب بخار بالاتر هزینه بیشتری دارند.

توجه داشته باشید که ماتریس متقارن است. به عنوان مثال ، همبستگی بین "وزن در پوند" و "هزینه در USD" در گوشه پایین سمت چپ (0. 52) همان همبستگی بین "هزینه در USD" و "وزن در پوند" در گوشه بالا سمت راست است (0. 52). این واقعیت را تقویت می کند که X و Y با توجه به همبستگی قابل تعویض هستند. همبستگی در طول مورب همیشه 1. 00 خواهد بود و یک متغیر همیشه با خودش کاملاً ارتباط دارد.

هنگام تفسیر همبستگی ها ، باید از چهار توضیح احتمالی برای یک همبستگی قوی آگاه باشید:

  • تغییرات در متغیر X باعث تغییر مقدار متغیر Y می شود.
  • تغییرات در متغیر Y باعث تغییر مقدار متغیر X می شود.
  • تغییرات در متغیر دیگر بر X و Y تأثیر می گذارد.
  • X و Y به هیچ وجه با هم ارتباط ندارند ، و شما فقط اتفاق افتادید که چنین همبستگی محکمی را مشاهده کنید. مقدار P احتمال بروز این امر را تعیین می کند.

نمونه رگرسیون

قدرت پرتوهای UV براساس عرض جغرافیایی متفاوت است. هرچه عرض جغرافیایی بیشتر باشد ، قرار گرفتن در معرض خورشید کمتر ، که مربوط به خطر ابتلا به سرطان پوست پایین تر است. بنابراین در جایی که زندگی می کنید می تواند در خطر سرطان پوست شما تأثیر بگذارد. دو متغیر ، میزان مرگ و میر سرطان و عرض جغرافیایی ، در جدول XY Prism وارد شدند. نمودار منشور (سمت راست) رابطه بین میزان مرگ و میر سرطان پوست (Y) و عرض جغرافیایی در مرکز حالت (X) را نشان می دهد. منطقی است که همبستگی بین این متغیرها را محاسبه کنیم ، اما با برداشتن آن یک قدم جلوتر ، اجازه دهید تجزیه و تحلیل رگرسیون را انجام دهیم و یک معادله پیش بینی کنیم.

رابطه بین x و y توسط خط رگرسیون متناسب در نمودار با معادله خلاصه می شود: میزان مرگ و میر = 389. 2 - 5. 98*عرض جغرافیایی. بر اساس شی ب-5. 98 ، هر 1 درجه افزایش در عرض جغرافیایی باعث کاهش مرگ و میر ناشی از سرطان پوست تقریباً 6 در 10 میلیون نفر می شود.

از آنجا که تجزیه و تحلیل رگرسیون یک معادله را تولید می کند ، برخلاف همبستگی ، می توان از آن برای پیش بینی استفاده کرد. به عنوان مثال ، انتظار می رود یک شهر در Latitude 40 389. 2 - 5. 98*40 = 150 مرگ در هر 10 میلیون به دلیل سرطان پوست هر سال داشته باشد. رگرسیون همچنین امکان تفسیر ضرایب مدل را فراهم می کند:

    : افزایش هر درجه در عرض جغرافیایی مرگ و میر را با 5. 98 مرگ و میر در هر 10 میلیون کاهش می دهد.: در عرض جغرافیایی 0 درجه (استوا) ، مدل 389. 2 مرگ در هر 10 میلیون را پیش بینی می کند. اگرچه ، از آنجا که هیچ داده ای در رهگیری وجود ندارد ، این پیش بینی به شدت به رابطه حفظ فرم خطی آن به 0 متکی است.

خلاصه و اطلاعات اضافی

به طور خلاصه ، همبستگی و رگرسیون شباهت های زیادی و برخی تفاوت های مهم دارند. رگرسیون در درجه اول برای ساخت مدل ها/معادلات برای پیش بینی پاسخ کلیدی ، Y ، از مجموعه ای از متغیرهای پیش بینی کننده (X) استفاده می شود. همبستگی در درجه اول برای خلاصه کردن سریع و مختصر جهت و قدرت روابط بین مجموعه ای از 2 یا بیشتر متغیرهای عددی استفاده می شود.

در جدول زیر شباهت ها و تفاوت های کلیدی بین همبستگی و رگرسیون خلاصه شده است.

موضوع

همبستگی

پسرفت

برای یک خلاصه سریع و ساده از جهت و قدرت روابط زوج بین دو یا چند متغیر عددی.

برای پیش بینی ، بهینه سازی یا توضیح یک پاسخ عددی y از x ، یک متغیر عددی که برای تأثیرگذاری در Y انجام می شود.

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.