عامل تورم واریانس(variance inflation factor) شدت همخطی چندگانه را در تحلیل رگرسیون کمترین مربعات معمولی ارزیابی می کند. به بیان ساده شاخص VIF نشان می دهد که یک متغیر تا چه اندازه تحت تاثیر دیگر متغیرها رفتارش تغییر می کند. شاخص VIF نشان می دهد چه مقدار از تغییرات مربوط به ضرایب برآورد شده بابت همخطی افزایش یافته است. شدت همخطی چندگانه را با بررسی بزرگی مقدار VIF می توان تحلیل نمود.
از نظر ریاضی، ضریب تورم واریانس برای متغیر مدل رگرسیونی، نسبت واریانس کلی مدل به واریانس مدل با یک متغیر مستقل است. یک مدل رگرسیون چندگانه در شرایطی استفاده میشود که فرد میخواهد تأثیر چندین متغیر را بر یک نتیجه بررسی کند.در اینجا، تاثیر متغیرهای مستقل بر متغیرهای وابسته شناسایی می شود. متغیرهای مستقل ورودی های مدل را تشکیل می دهند. وجود همبستگی متقابل بالا بین متغیرها باعث می شود که استقلال کمتری داشته باشند. بنابراین، همبستگی بین متغیرها در مدل رگرسیون چندگانه مشکلاتی را در آزمون متغیرها ایجاد می کند. تعیین اینکه ترکیب متغیرهای مستقل چقدر بر متغیر وابسته یا نتیجه مدل رگرسیون تأثیر می گذارد دشوار می شود.
عامل تورم واریانس VIF یک روش آماری است که در آزمون یک مدل رگرسیون، صحت نتایج را مشخص می کند. این شاخص نحوه تغییر رفتار یک متغیر مستقل به دلیل همبستگی با سایر متغیرهای مستقل را آزمایش می کند. بنابراین با شناسایی شدت همبستگی، سازگاری مدل را تسهیل می کند. در صورت وجود عامل تورم واریانس بالا، حتی تغییرات کوچک در داده ها یا در ساختار مدل رگرسیون می تواند منجر به تغییرات بزرگ و گاهی اوقات نامنظم در ضرایب متغیرها شود.
همبستگی زیاد بین متغیرها ممکن است نتایجی را ایجاد کند که از نظر آماری معنی دار نیستند. همچنین ممکن است به شمارش مضاعف متغیرها منجر شود. VIF در تکنیک های اقتصادسنجی و معادلات ساختاری حداقل مربعات جزئی استفاده زیادی دارد.
معمولا این شاخص در نرم افزارهای برپایه رگرسیون محاسبه می شود. نیازی به محاسبه دستی این شاخص نیست. اما برای اطلاعات بیشتر فرمول این شاخص معرفی شده است. فرمول عامل تورم واریانس VIFبه صورت زیر است:
در این فرمول، شاخص R² که بیانگر ضریب تعیین متغیر است استفاده می شود. شاخص تورم واریانس بالای ۱۰ نشان دهنده وضعیت هم خطی بحرانی و مقدار نزدیک به ۱ نشان دهنده وضعیت مطلوب است. حد قابل قبول شاخص VIF زیر عدد ۵ است. اگر آماره آزمون VIFبه یک نزدیک بود نشان دهنده عدم وجود همخطی است. به عنوان یک قاعده تجربی مقدار VIF بزرگتر از ۵ باشد همخطی چندگانه بالا است.
کسل و همکاران (۱۹۹۹)، بیان کردند که مقدار ضریب VIF متغیر اگر بیشتر از ۵ باشد باید از مدل حذف گردد. هایر و همکاران (۲۰۱۱)، نشان دادند که سطح قابل قبول VIF برای هر سازه ترکیبی باید کمتر از عدد ۵ باشد که این مقدار مورد تائید و قبول اکثر محققین این حوزه است.
عامل تورم واریانس VIF در نرم افزار SMART PLS3 به صورت خروجی های تحلیل PLS نشان داده می شود. این شاخص به عنوان شاخص برازش مدل ترکیبی در مدل معادلات ساختاری حداقل مربعات جزئی استفاده می شود. همان طور که بیان شد، این شاخص نشان می دهد که متغیرهای وارد شده در مدل، تا چه میزان با یکدیگر همخطی دارند. با اجرای دستور PLS Algorithm، یک پنجره باز می شود. در پایین صفحه در میان شاخص های کیفیت، Collinearity Statistics نشان داده شده است. در شکل مشخص است.
با کلیک بر روی Collinearity Statistics، یک پنجره باز می شود. دو ستون مشخص شده است. Outer VIF values و Inner VIF values. این دو شاخص بیانگر VIF بیرونی متغیرها و VIF درون مدلی متغیرها هستند. در شکل نشان داده شده است.
همان طور که در شکل مشخص است، VIF بیرونی برای تمامی متغیرهای وارد شده مشخص شده است. سبز بودن این مقادیر عددی نشان می دهد که این شاخص ها قابل قبول هستند. همچنین VIF درونی نیز برای متغیرهای مدل در کنار هم در شکل زیر نشان داده شده است.
در این بخش نیز سبز بودن مقادیر VIF بیانگر مقدار قابل قبول آن در مدل است.
در نرم افزار EVIEWS پس از برآورد مدل، برای تعیین عامل تورم واریانس VIF از آزمون VIF استفاده می شود. مسیر مورد استفاده برای آزمون VIF به این صورت است:
View/Coefficient Diagnostics/Variance Inflation Factors
پنجره ای ظاهر می شود که که ستون Centered VIF مقادیر متمرکز عامل تورم واریانس را نشان می دهد. اگر در مدل تخمین زده شده،ضریب تعیین مدل یعنی شاخص R² مقدار عددی بالایی (نزدیک به یک) داشته باشد ولی متغییرهای مدل معنادار نباشند،احتمالا متغییرها دارای هم خطی هستند.
برای رفع مشکل هم خطی تکنیک های متعددی مورد استفاده قرار می گیرد:
۱-اولین روش رفع همخطی در ایویوز بیشتر کردن تعداد نمونه است.
۲-دومین روش این است که از متغیر هایی که دچار همخطی هستند Log یا Ln یا از داده ها معکوس گرفته شود.
۳- روش بعدی حذف کردن یکی از متغیر هایی است که ایجاد هم خطی با متغیر مستقل دیگر می کند.
۴-روش هم تحت عنوان تکنیک رگرسیون مرزی می باشد نیز استفاده می شود.
در موارد زیر می توان اثر هم خطی بین متغیرها را نادیده گرفت:
۱-زمانی که VIF بالای به دست آمده بین متغییر های کنترلی بالا باشد.
۲-زمانی که متغیر موهومی دارای VIF بزرگی باشد.
۳-اگر هدف از برآورد مدل رگرسیونی، پیش بینی باشد.
۴-اگر تمام نتایج مدل بدون اشکال باشد و فقط VIF بزرگ باشد.
James, Gareth; Witten, Daniela; Hastie, Trevor; Tibshirani, Robert (2017). An Introduction to Statistical Learning (۸th ed.). Springer Science+Business Media New York
برای آموزش بیشتر شاخص VIF بر روی لینک زیر کلیک نمایید.