برآوردگر ۲SLS یا حداقل مربعات دو مرحله ای (Two-Stage Least Squares) یک تکنیک رگرسیونی برای تخمین مدل های معادلات همزمان براساس متغیر ابزاری است. ۲SLS از یک رویکرد معادله واحد استفاده می کند. به این معنی که هر معادله در مدل معادلات همزمان به طور جداگانه یا یک به یک تخمین زده می شود. توجه به این نکته ضروری است که ۲SLS برای تخمین مدل های Overidentified استفاده می شود.
رگرسیون حداقل مربعات دو مرحلهای یا برآوردگر ۲SLS از متغیرهای ابزاری استفاده میکند که با عبارتهای خطا همبستگی ندارند تا مقادیر تخمینی پیشبینیکننده(های) مشکلساز را محاسبه کند (مرحله اول)، و سپس از آن مقادیر محاسبهشده برای تخمین مدل رگرسیون خطی متغیر وابسته استفاده میکند. (مرحله دوم). از آنجایی که مقادیر محاسبه شده بر اساس متغیرهایی هستند که با خطاها همبستگی ندارند، نتایج مدل برآوردگر ۲SLS بهینه است.
برآوردگر ۲SLS برخی از ویژگی های روش های برآورد حداقل مربعات غیرمستقیم (ILS) و متغیر ابزاری (IV) را ترکیب می کند. مشابه ILS، ما معادلات کاهش شکل رگرسیورهای درون زا را در ۲SLS تخمین می زنیم. از نتایج معادلات با فرم کاهش یافته به عنوان ابزاری برای تخمین پارامترهای ساختاری مدل معادلات همزمان استفاده می شود.
مشخصات هر مدل معادله همزمان در برآوردگر ۲SLS معمولاً بر اساس ملاحظات تئوری اقتصادی و اطلاعات پیشینی است. متغیرهای درون زا و برون زا بر اساس زمینه های نظری تعیین می شوند. این نیز تعداد معادلات و متغیرهای هر معادله را تعیین می کند.
فرض کنید می خواهیم ضرایب مدل خطی را تخمین بزنیم
Yi=β۰+β۱X۱i+⋯+βpXpi+ϵi
اما برخی از متغیرهای Xji با عبارت خطا در ارتباط هستند. همانطور که قبلاً دیدیم، تخمین OLS این معادله مغرضانه و ناسازگار خواهد بود.
فرض کنید مجموعه ای از q>p داریم
متغیرهای ابزاری، Z1i،…،Zqi، که هر کدام شرایط زیر را برآورده می کنند:
مرحله اول: Z بر X تأثیر می گذارد
استقلال: Z با ϵ همبستگی ندارد
محدودیت طرد: Z فقط Y را از طریق تأثیرش بر X تحت تأثیر قرار می دهد.
تحت این شرایط، هر متغیر X برون زا (یعنی هر متغیری که با عبارت خطا همبستگی ندارد) را می توان در Z گنجاند. سپس ما فقط به حداقل یک ابزار اضافی برای هر متغیر درون زا نیاز داریم. به دلایلی که لحظه ای مشخص می شود، ابزارهایی را که خود متغیر نیستند، سازهای حذف شده می نامیم.
برآوردگر حداقل مربعات دو مرحله ای یا برآوردگر ۲SLS β به روش زیر است:
هر Xj را روی Z رگرسیون کنید
و مقادیر پیش بینی شده را ذخیره کنید، X̂ j اگر Xj در Zو گنجانده شود، X̂ j=Xj خواهیم داشت
تخمین β از طریق تخمین OLS مدل رگرسیون
Yi=β۰+β۱X̂ ۱i+⋯+βpX̂ pi+ϵi.
این بدیهی است که پیادهسازی برآوردگر ۲SLSآسان است و به ما اجازه میدهد تا متغیرهای کمکی برونزا، متغیرهای درونزای متعدد، و ابزارهای بیشتری را نسبت به متغیرهای درونزا (که به آن محدودیتهای شناسایی بیش از حد نیز میگویند) وارد کنیم.
واقعیت جالب: اجازه دهید X N×p باشد
ماتریس متغیرهای کمکی و Z N×q باشد
ماتریس ابزارها، برآوردگر متغیرهای ابزاری را در برآوردگر ۲SLS می توان در یک مرحله از طریق معادله گرین (۲۰۰۳، ۷۸) محاسبه کرد.
β̂ ۲SLS(Y,X,Z)=[X⊤Z(Z⊤Z)−۱Z⊤X]−۱X⊤Z(Z⊤Z)−۱Z⊤Y.
این برآوردگر GLS با Ω=[Z(Z⊤Z)-1Z⊤]-۱ است.
با این حال، در عمل، شما مستقیماً حداقل مربعات دو مرحلهای برآوردگر ۲SLS یا فرمول GLS را اجرا نمیکنید—شما متغیرهای کمکی و ابزارها را به رایانه میدهید و اجازه میدهید کار را برای شما انجام دهد.
Angrist, J. D., & Imbens, G. W. (1995). Two-stage least squares estimation of average causal effects in models with variable treatment intensity. Journal of the American Statistical Association, 90(۴۳۰), ۴۳۱-۴۴۲.
Greene, William H. 2003. Econometric Analysis. ۵th ed. Prentice Hall.