رگرسیون لجستیک باینری

رگرسیون لجستیک باینری

رگرسیون لجستیک باینری

رگرسیون لجستیک باینری (Binary Logistic Regression)، تعیین رابطه متغیرهای مستقل با یک متغیر وابسته دوگانه (دوجوابی، صفر و یکی) است. تکنیک رگرسیون برای ارزیابی قدرت رابطه بین یک متغیر(های) وابسته و مستقل استفاده می شود. این به پیش بینی مقدار یک متغیر وابسته از یک یا چند متغیر مستقل کمک می کند. تحلیل رگرسیون به پیش بینی میزان واریانس در یک پاسخ واحد (متغیر وابسته) توسط مجموعه ای از متغیرهای مستقل کمک می کند. این تکنیک در نرم افزار SPSS انجام می شود.

تحلیل رگرسیون خطی مستلزم آن است که متغیر نتیجه/معیار به عنوان یک متغیر پیوسته اندازه گیری شود. با این حال، ممکن است شرایطی وجود داشته باشد که محقق بخواهد نتیجه ای را پیش بینی کند که دوگانه/دودویی است.

در چنین شرایطی، محقق می تواند از رگرسیون لجستیک باینری برای ارزیابی تأثیر یکی از متغیرهای پیش بینی کننده بیشتر بر نتایج استفاده کند. تحلیل رگرسیون لجستیک روشی برای تعیین رابطه دلیل و نتیجه متغیر(های) مستقل با متغیر وابسته است.

رگرسیون لجستیک باینری عضویت گروه را پیش بینی می کند

از آنجایی که رگرسیون لجستیک باینری احتمال موفقیت را نسبت به احتمال شکست محاسبه می کند، نتایج تحلیل به شکل نسبت شانس است.
رگرسیون لجستیک تأثیر چندین متغیر مستقل ارائه شده به طور همزمان برای پیش بینی عضویت یکی از دو دسته متغیر وابسته را تعیین می کند.
در رگرسیون لجستیک باینری، نتیجه مورد انتظار با ۱ نشان داده می شود در حالی که دیگری با ۰ کد می شود.

نمونه هایی از رگرسیون لجستیک باینری

یک فروشگاه مایل است عواملی را که منجر به بازگشت / عدم بازگشت مشتری می شود ارزیابی کند.
یک کالج می خواهد پذیرش (پذیرش/عدم پذیرش) یک دانش آموز را بر اساس نتایج آزمون سن، نمره، استعداد ارزیابی کند.
بر اساس زمان سپری شده در حوزه انتخابیه، که قبلا انتخاب شده بود، برنده یا شکست یک نامزد خاص در انتخابات را ارزیابی کنید. از مسائل حل شده
یک محقق منابع انسانی می‌خواهد بررسی کند که چگونه عواملی مانند تجربه، سال‌های تحصیل، حقوق قبلی، رتبه دانشگاه بر انتخاب یک نامزد در مصاحبه شغلی تأثیر می‌گذارند.
یک محقق می‌خواهد انتخاب بانک (دولتی یا خصوصی) را بر اساس متغیرهای مستقلی که شامل فناوری، نرخ بهره، خدمات ارزش افزوده، ریسک‌های درک شده، شهرت و غیره است، پیش‌بینی کند.

تمام مثال ها که نتیجه بود یا نبود، موفقیت یا شکست و هر نتیجه دوتایی را پیش بینی می کند رگرسیون لجستیک باینری است.

مفروضات لجستیک باینری

رگرسیون لجستیک یک رابطه خطی بین متغیرهای وابسته و مستقل را فرض نمی کند.
متغیرهای مستقل نیازی به فاصله زمانی، توزیع نرمال، خطی و یا واریانس مساوی در هر گروه ندارند.
همسانی مورد نیاز نیست. اصطلاحات خطا (باقی مانده) نیازی به توزیع عادی ندارند.
متغیر وابسته در رگرسیون لجستیک در مقیاس فاصله ای یا نسبتی اندازه گیری نمی شود. متغیر وابسته باید برای رگرسیون لجستیک باینری دوگانه (۲ دسته) باشد.
دسته ها (گروه ها) به عنوان یک متغیر وابسته باید متقابلاً منحصر به فرد و جامع باشند. یک مورد فقط می تواند در یک گروه باشد و هر مورد باید عضو یکی از گروه ها باشد.
نمونه‌های بزرگ‌تری نسبت به رگرسیون خطی مورد نیاز است زیرا حداکثر ضرایب با استفاده از روش ML تخمین‌های نمونه بزرگی هستند. حداقل ۵۰ مورد برای هر پیش بینی توصیه می شود.
استاردیونت و همکاران (۲۰۱۳)، حداقل نمونه ۱۰ مشاهده برای هر متغیر مستقل را در مدل پیشنهاد می کنند، اما احتیاط می کنند که در صورت امکان، ۲۰ مشاهده برای هر متغیر باید جستجو شود.
لبانک و همکاران (۲۰۰۰)، حداقل ۳۰ مشاهده در هر متغیر مستقل را پیشنهاد می کنند.

انجام لجستیک باینری در SPSS

گام اول رگرسیون لجستیک باینری در SPSS این گونه است:

 Analyze -> Regression -> Binary Logistic

 در مرحله بعد، کادر گفتگوی رگرسیون لجستیک ظاهر می شود.

در مرحله سوم برای انجام رگرسیون لجستیک باینری انتخاب ترجیحی متغیر  (دوگانه) را در جعبه وابسته اضافه کنید و متغیرهای مستقل را در کادر فهرست متغیرها اضافه کنید.

مرحله ۴: بعد، گزینه‌ها، بررسی، Hosmer-Lemeshow goodness-of-fit و CI برای exp(B) را انتخاب کنید.

مرحله ۵: در نهایت برای به دست آوردن نتایج رگرسیون لجستیک باینریدکمه Continue و سپس OK را فشار دهید.

تفسیر نتایج

آزمون های Omnibus در رگرسیون لجستیک باینری ضرایب مدل برای آزمایش برازش مدل استفاده می شود. اگر مدل معنی دار باشد، این نشان می دهد که در مقایسه با مدل تهی، بهبود قابل توجهی در برازش وجود دارد، بنابراین، مدل برازش خوبی را نشان می دهد.

آزمون Hosmer and Lemeshow در رگرسیون لجستیک باینری نیز آزمونی از برازش مدل است. اگر مقدار معنی داری کمتر از ۰.۰۵ باشد، آماره Hosmer-Lemeshow برازش ضعیف را نشان می دهد. در اینجا، مدل به اندازه کافی با داده ها مطابقت دارد. از این رو، تفاوتی بین مدل مشاهده شده و پیش بینی شده وجود ندارد.

خلاصه مدل Psuedo R-Square را  در رگرسیون لجستیک باینری نشان می دهد. Psuedo به این معنی است که از نظر فنی تغییرات را توضیح نمی دهد. اما می توان از آنها به عنوان تغییرات تقریبی در متغیر معیار استفاده کرد.
به طور معمول از Nagelkerke’s R2 استفاده می شود، این یک نسخه تنظیم شده از Cox & Snell R-square است که مقیاس آمار را برای پوشش کامل دامنه از ۰ تا ۱ تنظیم می کند.

منبع

onlinelibrary.wiley.com/doi/book

 

ارسال نظر

آدرس ایمیل شما منتشر نخواهد شد.

مدیر آماری