رگرسیون لجستیک باینری (Binary Logistic Regression)، تعیین رابطه متغیرهای مستقل با یک متغیر وابسته دوگانه (دوجوابی، صفر و یکی) است. تکنیک رگرسیون برای ارزیابی قدرت رابطه بین یک متغیر(های) وابسته و مستقل استفاده می شود. این به پیش بینی مقدار یک متغیر وابسته از یک یا چند متغیر مستقل کمک می کند. تحلیل رگرسیون به پیش بینی میزان واریانس در یک پاسخ واحد (متغیر وابسته) توسط مجموعه ای از متغیرهای مستقل کمک می کند. این تکنیک در نرم افزار SPSS انجام می شود.
تحلیل رگرسیون خطی مستلزم آن است که متغیر نتیجه/معیار به عنوان یک متغیر پیوسته اندازه گیری شود. با این حال، ممکن است شرایطی وجود داشته باشد که محقق بخواهد نتیجه ای را پیش بینی کند که دوگانه/دودویی است.
در چنین شرایطی، محقق می تواند از رگرسیون لجستیک باینری برای ارزیابی تأثیر یکی از متغیرهای پیش بینی کننده بیشتر بر نتایج استفاده کند. تحلیل رگرسیون لجستیک روشی برای تعیین رابطه دلیل و نتیجه متغیر(های) مستقل با متغیر وابسته است.
رگرسیون لجستیک باینری عضویت گروه را پیش بینی می کند
از آنجایی که رگرسیون لجستیک باینری احتمال موفقیت را نسبت به احتمال شکست محاسبه می کند، نتایج تحلیل به شکل نسبت شانس است.
رگرسیون لجستیک تأثیر چندین متغیر مستقل ارائه شده به طور همزمان برای پیش بینی عضویت یکی از دو دسته متغیر وابسته را تعیین می کند.
در رگرسیون لجستیک باینری، نتیجه مورد انتظار با ۱ نشان داده می شود در حالی که دیگری با ۰ کد می شود.
یک فروشگاه مایل است عواملی را که منجر به بازگشت / عدم بازگشت مشتری می شود ارزیابی کند.
یک کالج می خواهد پذیرش (پذیرش/عدم پذیرش) یک دانش آموز را بر اساس نتایج آزمون سن، نمره، استعداد ارزیابی کند.
بر اساس زمان سپری شده در حوزه انتخابیه، که قبلا انتخاب شده بود، برنده یا شکست یک نامزد خاص در انتخابات را ارزیابی کنید. از مسائل حل شده
یک محقق منابع انسانی میخواهد بررسی کند که چگونه عواملی مانند تجربه، سالهای تحصیل، حقوق قبلی، رتبه دانشگاه بر انتخاب یک نامزد در مصاحبه شغلی تأثیر میگذارند.
یک محقق میخواهد انتخاب بانک (دولتی یا خصوصی) را بر اساس متغیرهای مستقلی که شامل فناوری، نرخ بهره، خدمات ارزش افزوده، ریسکهای درک شده، شهرت و غیره است، پیشبینی کند.
تمام مثال ها که نتیجه بود یا نبود، موفقیت یا شکست و هر نتیجه دوتایی را پیش بینی می کند رگرسیون لجستیک باینری است.
رگرسیون لجستیک یک رابطه خطی بین متغیرهای وابسته و مستقل را فرض نمی کند.
متغیرهای مستقل نیازی به فاصله زمانی، توزیع نرمال، خطی و یا واریانس مساوی در هر گروه ندارند.
همسانی مورد نیاز نیست. اصطلاحات خطا (باقی مانده) نیازی به توزیع عادی ندارند.
متغیر وابسته در رگرسیون لجستیک در مقیاس فاصله ای یا نسبتی اندازه گیری نمی شود. متغیر وابسته باید برای رگرسیون لجستیک باینری دوگانه (۲ دسته) باشد.
دسته ها (گروه ها) به عنوان یک متغیر وابسته باید متقابلاً منحصر به فرد و جامع باشند. یک مورد فقط می تواند در یک گروه باشد و هر مورد باید عضو یکی از گروه ها باشد.
نمونههای بزرگتری نسبت به رگرسیون خطی مورد نیاز است زیرا حداکثر ضرایب با استفاده از روش ML تخمینهای نمونه بزرگی هستند. حداقل ۵۰ مورد برای هر پیش بینی توصیه می شود.
استاردیونت و همکاران (۲۰۱۳)، حداقل نمونه ۱۰ مشاهده برای هر متغیر مستقل را در مدل پیشنهاد می کنند، اما احتیاط می کنند که در صورت امکان، ۲۰ مشاهده برای هر متغیر باید جستجو شود.
لبانک و همکاران (۲۰۰۰)، حداقل ۳۰ مشاهده در هر متغیر مستقل را پیشنهاد می کنند.
گام اول رگرسیون لجستیک باینری در SPSS این گونه است:
Analyze -> Regression -> Binary Logistic
در مرحله بعد، کادر گفتگوی رگرسیون لجستیک ظاهر می شود.
در مرحله سوم برای انجام رگرسیون لجستیک باینری انتخاب ترجیحی متغیر (دوگانه) را در جعبه وابسته اضافه کنید و متغیرهای مستقل را در کادر فهرست متغیرها اضافه کنید.
مرحله ۴: بعد، گزینهها، بررسی، Hosmer-Lemeshow goodness-of-fit و CI برای exp(B) را انتخاب کنید.
مرحله ۵: در نهایت برای به دست آوردن نتایج رگرسیون لجستیک باینریدکمه Continue و سپس OK را فشار دهید.
آزمون های Omnibus در رگرسیون لجستیک باینری ضرایب مدل برای آزمایش برازش مدل استفاده می شود. اگر مدل معنی دار باشد، این نشان می دهد که در مقایسه با مدل تهی، بهبود قابل توجهی در برازش وجود دارد، بنابراین، مدل برازش خوبی را نشان می دهد.
آزمون Hosmer and Lemeshow در رگرسیون لجستیک باینری نیز آزمونی از برازش مدل است. اگر مقدار معنی داری کمتر از ۰.۰۵ باشد، آماره Hosmer-Lemeshow برازش ضعیف را نشان می دهد. در اینجا، مدل به اندازه کافی با داده ها مطابقت دارد. از این رو، تفاوتی بین مدل مشاهده شده و پیش بینی شده وجود ندارد.
خلاصه مدل Psuedo R-Square را در رگرسیون لجستیک باینری نشان می دهد. Psuedo به این معنی است که از نظر فنی تغییرات را توضیح نمی دهد. اما می توان از آنها به عنوان تغییرات تقریبی در متغیر معیار استفاده کرد.
به طور معمول از Nagelkerke’s R2 استفاده می شود، این یک نسخه تنظیم شده از Cox & Snell R-square است که مقیاس آمار را برای پوشش کامل دامنه از ۰ تا ۱ تنظیم می کند.
onlinelibrary.wiley.com/doi/book