عامل تورم واریانس VIF

عامل تورم واریانس VIF

عامل تورم واریانس(variance inflation factor) شدت همخطی چندگانه را در تحلیل رگرسیون کمترین مربعات معمولی ارزیابی می کند. به بیان ساده شاخص VIF نشان می دهد که یک متغیر تا چه اندازه تحت تاثیر دیگر متغیرها رفتارش تغییر می کند.  شاخص VIF نشان می دهد چه مقدار از تغییرات مربوط به ضرایب برآورد شده بابت همخطی افزایش یافته است. شدت همخطی چندگانه  را با بررسی بزرگی مقدار  VIF می توان تحلیل نمود.

از نظر ریاضی، ضریب تورم واریانس برای متغیر مدل رگرسیونی، نسبت واریانس کلی مدل به واریانس مدل با یک متغیر مستقل است. یک مدل رگرسیون چندگانه در شرایطی استفاده می‌شود که فرد می‌خواهد تأثیر چندین متغیر را بر یک نتیجه بررسی کند.در اینجا، تاثیر متغیرهای مستقل بر متغیرهای وابسته شناسایی می شود. متغیرهای مستقل ورودی های مدل را تشکیل می دهند. وجود همبستگی متقابل بالا بین متغیرها باعث می شود که استقلال کمتری داشته باشند. بنابراین، همبستگی بین متغیرها در مدل رگرسیون چندگانه مشکلاتی را در آزمون متغیرها ایجاد می کند. تعیین اینکه ترکیب متغیرهای مستقل چقدر بر متغیر وابسته یا نتیجه مدل رگرسیون تأثیر می گذارد دشوار می شود.

مفهوم شاخص VIF

عامل تورم واریانس VIF یک روش آماری است که در آزمون یک مدل رگرسیون، صحت نتایج را مشخص می کند. این شاخص نحوه تغییر رفتار یک متغیر مستقل به دلیل همبستگی با سایر متغیرهای مستقل را آزمایش می کند. بنابراین با شناسایی شدت همبستگی، سازگاری مدل را تسهیل می کند. در صورت وجود عامل تورم واریانس بالا، حتی تغییرات کوچک در داده ها یا در ساختار مدل رگرسیون می تواند منجر به تغییرات بزرگ و گاهی اوقات نامنظم در ضرایب متغیرها شود.

همبستگی زیاد بین متغیرها ممکن است نتایجی را ایجاد کند که از نظر آماری معنی دار نیستند. همچنین ممکن است به شمارش مضاعف متغیرها منجر شود.  VIF در تکنیک های اقتصادسنجی و معادلات ساختاری حداقل مربعات جزئی استفاده زیادی دارد.

محاسبه عامل تورم واریانس VIF

معمولا این شاخص  در نرم افزارهای برپایه رگرسیون محاسبه می شود. نیازی به محاسبه دستی این شاخص نیست. اما برای اطلاعات بیشتر فرمول این شاخص معرفی شده است. فرمول عامل تورم واریانس VIFبه صورت زیر است:

فرمول شاخص VIF
فرمول شاخص VIF

در این فرمول، شاخص R²  که بیانگر ضریب تعیین متغیر است استفاده می شود. شاخص تورم واریانس بالای ۱۰ نشان دهنده وضعیت هم خطی بحرانی و مقدار نزدیک به ۱ نشان دهنده وضعیت مطلوب است. حد قابل قبول شاخص VIF زیر عدد ۵ است.  اگر آماره آزمون VIFبه یک نزدیک بود نشان دهنده عدم وجود همخطی است. به عنوان یک قاعده تجربی مقدار VIF بزرگتر از ۵ باشد همخطی  چندگانه بالا است.

کسل و همکاران (۱۹۹۹)، بیان کردند که  مقدار ضریب  VIF  متغیر اگر بیشتر از ۵ باشد باید از مدل حذف گردد. هایر و همکاران (۲۰۱۱)، نشان دادند که سطح قابل قبول VIF برای هر سازه ترکیبی باید کمتر از عدد ۵ باشد که این مقدار مورد تائید  و قبول اکثر محققین این حوزه است.

محاسبه شاخص VIF در نرم افزار SMARTPLS

عامل تورم واریانس VIF در نرم افزار SMART PLS3 به صورت خروجی های تحلیل PLS نشان داده می شود.  این شاخص به عنوان شاخص برازش مدل ترکیبی در مدل معادلات ساختاری حداقل مربعات جزئی استفاده می شود.  همان طور که بیان شد، این شاخص نشان می دهد که متغیرهای وارد شده در مدل، تا چه میزان با یکدیگر همخطی دارند. با اجرای دستور PLS Algorithm، یک پنجره باز می شود. در پایین صفحه در میان شاخص های کیفیت،   Collinearity Statistics نشان داده شده است. در شکل مشخص است.

آموزش محاسبه شاخص VIF گام اول
آموزش محاسبه شاخص VIF گام اول

با کلیک بر روی Collinearity Statistics، یک پنجره باز می شود. دو ستون مشخص شده است. Outer VIF values و Inner VIF values. این دو شاخص بیانگر VIF بیرونی متغیرها و VIF درون مدلی متغیرها هستند. در شکل نشان داده شده است.

آموزش محاسبه شاخص VIF گام دوم
آموزش محاسبه شاخص VIF گام دوم

همان طور که در شکل مشخص است، VIF بیرونی برای تمامی متغیرهای وارد شده مشخص شده است. سبز بودن این مقادیر عددی نشان می دهد که این شاخص ها قابل قبول هستند. همچنین VIF درونی نیز برای متغیرهای مدل در کنار هم در شکل زیر نشان داده شده است.

آموزش محاسبه شاخص VIFگام سوم
آموزش محاسبه شاخص VIFگام سوم

در این بخش نیز سبز بودن مقادیر VIF بیانگر مقدار قابل قبول آن در مدل است.

محاسبه شاخص VIF در نرم افزار EVIEWS

در نرم افزار EVIEWS پس از برآورد مدل، برای تعیین عامل تورم واریانس VIF  از آزمون VIF استفاده می شود. مسیر مورد استفاده برای آزمون VIF به این صورت است:

View/Coefficient Diagnostics/Variance Inflation Factors

پنجره ای ظاهر می شود که که ستون  Centered VIF مقادیر متمرکز عامل تورم واریانس را نشان می دهد. اگر در مدل تخمین زده شده،ضریب تعیین مدل یعنی شاخص R²  مقدار عددی بالایی (نزدیک به یک) داشته باشد ولی متغییرهای مدل معنادار نباشند،احتمالا متغییرها دارای هم خطی هستند.

شاخص VIF در نرم افزار ایویوز
شاخص VIF در نرم افزار ایویوز

رفع همخطی در ایویوز

برای رفع مشکل هم خطی تکنیک های متعددی مورد استفاده قرار می گیرد:

۱-اولین روش رفع همخطی در ایویوز بیشتر کردن تعداد نمونه است.

۲-دومین روش این است که از متغیر هایی که دچار همخطی هستند Log یا Ln یا از داده ها معکوس گرفته شود.

۳- روش بعدی حذف کردن یکی از متغیر هایی است که ایجاد هم خطی با متغیر مستقل دیگر می کند.

۴-روش هم تحت عنوان تکنیک رگرسیون مرزی می باشد نیز استفاده می شود.

موارد نادیده گرفتن همخطی

در موارد زیر می توان اثر هم خطی بین متغیرها را نادیده گرفت:

۱-زمانی که VIF  بالای به دست آمده بین متغییر های کنترلی بالا باشد.

۲-زمانی که متغیر موهومی دارای VIF بزرگی باشد.

۳-اگر هدف از برآورد مدل رگرسیونی، پیش بینی باشد.

۴-اگر تمام نتایج مدل بدون اشکال باشد و فقط VIF بزرگ باشد.

منبع

 James, Gareth; Witten, Daniela; Hastie, Trevor; Tibshirani, Robert (2017). An Introduction to Statistical Learning (۸th ed.). Springer Science+Business Media New York

برای آموزش بیشتر شاخص VIF بر روی لینک زیر کلیک نمایید.

آموزش محاسبه عامل تورم واریانس VIF

ارسال نظر

آدرس ایمیل شما منتشر نخواهد شد.

مدیر آماری