ضریب تعیین (R۲ (R-squared correlation میزان ارتباط خطی بین دو متغیر را اندازه گیری می کند. R۲ نسبت تغییرات متغیر وابسته را که می توان به متغیر مستقل نسبت داد اندازه گیری می کند. در تعاریف موجود به R۲، ضریب تعیین یا ضریب تشخیص نیز گفته می شود. به بیان ساده می توان گفت ضریب تعیین نشان می دهد که چند درصد تغییرات متغیر های وابسته در یک مدل رگرسیونی با متغیر مستقل تبیین می شود. به عبارت دیگر، ضریب تشخیص یا (R۲) نشان می دهد که چه میزان یا مقدار از تغییرات متغیر وابسته مساله تحت تاثیر متغیر مستقل مساله بوده است. همچنین تا چه حدی مابقی تغییرات متغیر وابسته مساله مربوط به سایر عوامل موجود در مساله است.
همبستگی قدرت رابطه بین یک متغیر مستقل و وابسته را توضیح می دهد، ضریب تعیین یا ضریب تشخیص بیانگر این است که تا چه اندازه واریانس یک متغیر واریانس متغیر دوم را توضیح می دهد. ضریب تعیین نمی تواند تعیین نماید که آیا مدل برازش شده دارای شیب است یا نه و به همین دلیل باید نمودارهای باقیمانده را مورد ارزیابی قرارداد.
همان طور که بیان شد ضریب تعیین یا ضریب تشخیص نشان دهنده نسبت کل تغییر متغیر وابسته (حول میانگین خود) که بوسیله واریانس متغیرهای مستقل در رگرسیون توضیح داده می شود است. فرمول این شاخص به صورت زیر است:
R۲ مقداری بین ۰ و ۱۰۰٪ به دست می آید که عدد ۰٪ نشان می دهد که مدل هیچ ارتباطی با متغییر های وابسته و مستقل را در اطراف میانگین آن نشان نمی دهد و عدد ۱۰۰٪ نشان می دهد که مدل همه تغییرپذیری داده های پاسخ در اطراف میانگین آن را تبیین می نماید.
در مورد ارزیابی دو مدل، با ضرایب تعیین تقریبا یکسان، مدلی انتخاب میشود که خطای استاندارد مقادیر خطا (باقیمانده) کمتری داشته باشد.
مقدار تعدیل شده ضریب تعیین، میزان R2 را با توجه به متغیرهای مستقل اضافه شده به خط رگرسیون و با توجه به عرض از مبداهای جدید ، تعدیل و اصلاح می نماید .هرچه تفاوت بین R2 و R2 تعدیل شده کمتر باشدنشان میدهد که متغیرهای مستقل که به مدل اضافه شده اند به درستی انتخاب شده اند. فرمول این ضریب به صورت زیر است:
همانطور که در فرمول مشاهده میشود، وقتی تعداد مشاهدات (N) کم و تعداد پیش بینیها (متغیرهای مستقل P) زیاد باشد، تفاوت بین ضریب تعیین و ضریب تعیین تعدیل شده بسیار زیاد خواهد بود زیرا نسبت (N-P-1)/(N-1) بزرگتر از ۱ خواهد شد. همچنین هنگامی که تعداد مشاهدات در مقایسه با تعداد پیش بینیها بسیار زیاد باشد، مقدار ضریب تعیین به ضریب تعیین اصلاح شده نزدیک و نزدیکتر میشود، زیرا نسبت (N-P-1)/(N-1) به ۱ نزدیک می شود.
تفاوت مهم میان ضریب تعیین و ضریب تعیین تعدیل شده این است که R۲ بر این فرض است که هرمتغیر مستقل مشاهده شده در مدل، در تغییرات متغیر وابسته نقش دارد. بنابراین درصد نشان داده شده ضریب تشخیص براساس تاثیر همه متغیرهای مستقل بر متغیر وابسته است. در صورتی که درصد نشان داده شده توسط R۲ تعدیل شده فقط حاصل از تاثیر واقعی متغیرهای مستقل مدل بر وابسته است نه همه متغیرهای مستقل. می توان گقت R۲ تعدیل شده قابل اطمینان تر است.
در نرم افزار SMARTPLS می توان شاخص R۲ را محاسبه کرد. این شاخص به عنوان یکی از شاخص های برازش مدل در تحلیل مدل معادلات ساختاری استفاده می شود. پس از اجرای مدل با دستور PLS ALGORITHM یک پنجره باز می شود. در میان شاخص های QUALITY CRITERIA، گزینه اول R SQUARE است.
با کلیک بر روی گزینه R SQUARE یک پنجره دیگر باز می شود. این پنجره سه ستون دارد. MATRIX، R SQUARE و R SQUARE ADJUSTED. ستون ماتریکس بیانگر ماتریس و یا جدول عددی مقادیر ضریب تشخیص متغیرهای وابسته مدل است. R SQUARE نمودار ضریب تعیین است و R SQUARE ADJUSTED مقدار ضریب تعیین تعدیل شده است.
در ادامه نمودارهای این دو شاخص نشان داده شده است:
در این نمودارها اگر مقدار ضریب ها مناسب نباشد، نمودار به صورت قرمز نشان داده می شود.
در نرم افزار EVIEWS می توان شاخص R۲ را محاسبه کرد. پس از اجرای مدل رگرسیونی در میان خروجی های تعیین صحت مدل، اولین معیارها، شاخص ضریب تعیین و ضریب تعیین تعدیل شده هستند.
Chicco, Davide; Warrens, Matthijs J.; Jurman, Giuseppe (2021). “The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation
برای آموزش محاسبه ضریب تعیین روی فایل زیر کلیک کنید.