رگرسیون پواسن

رگرسیون پواسن

رگرسیون پواسن

رگرسیون پواسن (Poisson Regression) یک روش آماری است که برای مدل‌سازی داده‌های شمارشی (count data) استفاده می‌شود، یعنی داده‌هایی که مقادیرشان اعداد صحیح غیرمنفی هستند و معمولاً از شمارش رخدادها در یک بازه زمانی یا فضایی به دست می‌آیند. در رگرسیون پواسن، متغیر وابسته (Y) شمارش رخدادها است و متغیرهای مستقل (X1,X2,…​,…) می‌توانند پیوسته یا دسته‌بندی‌شده باشند. هدف این مدل پیش‌بینی مقدار مورد انتظار (λ) متغیر وابسته است.

نحوه برآورد پارامترهای مدل رگرسیون پواسن، براساس روش برآوردیابی «حداکثر درستنمایی» (Maximum Likelihood) صورت می‌گیرد. البته متاسفانه فرم بسته‌ای برای برآوردگر حداکثر درستنمایی در این حالت وجود ندارد و مجبور هستیم که به روش‌های عددی رجوع کنیم. برای مثال روش ریشه‌یابی نیوتن-رافسون (Newtown-Raphosn)، با توجه به مقعر بودن (Concave) تابع درستنمایی رگرسیون پواسون موثر است.

انجام رگرسیون پواسن در SPSS

برای انجام رگرسیون پواسن در نرم‌افزار SPSS، مراحل زیر را دنبال کنید:

۱. آماده‌سازی داده‌ها برای رگرسیون پواسن

اطمینان حاصل کنید که داده‌ها به‌درستی در SPSS وارد شده‌اند:

متغیر وابسته (Dependent Variable): یک متغیر شمارشی (count data) است که شامل اعداد صحیح غیرمنفی (مثلاً تعداد رخدادها) باشد.

متغیرهای مستقل (Independent Variables): می‌توانند پیوسته یا دسته‌بندی‌شده باشند.

۲. دسترسی به مدل رگرسیون پواسن

از منوی اصلی SPSS، به مسیر زیر بروید:
Analyze > Generalized Linear Models > Generalized Linear Models (GZLM)…

۳. تنظیمات مدل

در پنجره Generalized Linear Models:

Dependent Variable: متغیر وابسته (شمارشی) خود را انتخاب کنید.

Distribution: توزیع را روی Poisson قرار دهید.

Link Function: لینک مناسب را انتخاب کنید (به‌طور پیش‌فرض Log استفاده می‌شود).

در بخش Predictors:

متغیرهای مستقل را انتخاب و مشخص کنید که این متغیرها پیوسته (Continuous) یا دسته‌ای (Categorical) هستند.

اگر داده‌ها وزن (weight) دارند یا زمان‌بندی خاصی مدنظر است (مانند نرخ رخداد در یک بازه زمانی)، می‌توانید از گزینه Offset استفاده کنید.

۴. تنظیمات پیشرفته (اختیاری) برای رگرسیون پواسن

در تب‌های دیگر، می‌توانید تنظیمات اضافی انجام دهید:

Model: تعریف تعامل (interaction) بین متغیرها.

Statistics: انتخاب خروجی‌های آماری مانند ضرایب رگرسیون، Wald Chi-Square، یا پارامترهای پیش‌بینی.

Plots: برای ترسیم نمودارهای پیش‌بینی.

Save: ذخیره مقادیر پیش‌بینی‌شده یا باقی‌مانده‌ها.

۵. اجرای مدل

روی دکمه OK کلیک کنید تا SPSS مدل را اجرا کند.

۶. تحلیل خروجی

پس از اجرای مدل، خروجی‌های زیر تولید می‌شوند:

Model Information: اطلاعات کلی درباره مدل.

Goodness of Fit: بررسی برازش مدل (شاخص‌هایی مانند AIC و Deviance).

Parameter Estimates: ضرایب (β) برای متغیرهای مستقل همراه با مقدار سطح معنی داری (Sig).

Predicted Values: مقدار پیش‌بینی‌شده برای متغیر وابسته.

۷. بررسی برازش مدل

Goodness of Fit: اگر مقدار Deviance/df نزدیک به ۱ باشد، مدل به‌خوبی داده‌ها را برازش داده است.

اگر واریانس بیش از حد باشد (Overdispersion)، ممکن است به مدل جایگزین مانند رگرسیون دوجمله‌ای منفی (Negative Binomial Regression) نیاز باشد.

نکته:

برای تحلیل دقیق‌تر، بهتر است به نمودارهای باقی‌مانده‌ها و تست‌های فرضیات مدل توجه کنید تا از مناسب بودن مدل اطمینان حاصل شود.

منبع

www.sciencedirect.com

ارسال نظر

آدرس ایمیل شما منتشر نخواهد شد.

مدیر آماری