رگرسیون پواسن (Poisson Regression) یک روش آماری است که برای مدلسازی دادههای شمارشی (count data) استفاده میشود، یعنی دادههایی که مقادیرشان اعداد صحیح غیرمنفی هستند و معمولاً از شمارش رخدادها در یک بازه زمانی یا فضایی به دست میآیند. در رگرسیون پواسن، متغیر وابسته (Y) شمارش رخدادها است و متغیرهای مستقل (X1,X2,…,…) میتوانند پیوسته یا دستهبندیشده باشند. هدف این مدل پیشبینی مقدار مورد انتظار (λ) متغیر وابسته است.
نحوه برآورد پارامترهای مدل رگرسیون پواسن، براساس روش برآوردیابی «حداکثر درستنمایی» (Maximum Likelihood) صورت میگیرد. البته متاسفانه فرم بستهای برای برآوردگر حداکثر درستنمایی در این حالت وجود ندارد و مجبور هستیم که به روشهای عددی رجوع کنیم. برای مثال روش ریشهیابی نیوتن-رافسون (Newtown-Raphosn)، با توجه به مقعر بودن (Concave) تابع درستنمایی رگرسیون پواسون موثر است.
برای انجام رگرسیون پواسن در نرمافزار SPSS، مراحل زیر را دنبال کنید:
اطمینان حاصل کنید که دادهها بهدرستی در SPSS وارد شدهاند:
متغیر وابسته (Dependent Variable): یک متغیر شمارشی (count data) است که شامل اعداد صحیح غیرمنفی (مثلاً تعداد رخدادها) باشد.
متغیرهای مستقل (Independent Variables): میتوانند پیوسته یا دستهبندیشده باشند.
از منوی اصلی SPSS، به مسیر زیر بروید:
Analyze > Generalized Linear Models > Generalized Linear Models (GZLM)…
در پنجره Generalized Linear Models:
Dependent Variable: متغیر وابسته (شمارشی) خود را انتخاب کنید.
Distribution: توزیع را روی Poisson قرار دهید.
Link Function: لینک مناسب را انتخاب کنید (بهطور پیشفرض Log استفاده میشود).
در بخش Predictors:
متغیرهای مستقل را انتخاب و مشخص کنید که این متغیرها پیوسته (Continuous) یا دستهای (Categorical) هستند.
اگر دادهها وزن (weight) دارند یا زمانبندی خاصی مدنظر است (مانند نرخ رخداد در یک بازه زمانی)، میتوانید از گزینه Offset استفاده کنید.
در تبهای دیگر، میتوانید تنظیمات اضافی انجام دهید:
Model: تعریف تعامل (interaction) بین متغیرها.
Statistics: انتخاب خروجیهای آماری مانند ضرایب رگرسیون، Wald Chi-Square، یا پارامترهای پیشبینی.
Plots: برای ترسیم نمودارهای پیشبینی.
Save: ذخیره مقادیر پیشبینیشده یا باقیماندهها.
روی دکمه OK کلیک کنید تا SPSS مدل را اجرا کند.
پس از اجرای مدل، خروجیهای زیر تولید میشوند:
Model Information: اطلاعات کلی درباره مدل.
Goodness of Fit: بررسی برازش مدل (شاخصهایی مانند AIC و Deviance).
Parameter Estimates: ضرایب (β) برای متغیرهای مستقل همراه با مقدار سطح معنی داری (Sig).
Predicted Values: مقدار پیشبینیشده برای متغیر وابسته.
Goodness of Fit: اگر مقدار Deviance/df نزدیک به ۱ باشد، مدل بهخوبی دادهها را برازش داده است.
اگر واریانس بیش از حد باشد (Overdispersion)، ممکن است به مدل جایگزین مانند رگرسیون دوجملهای منفی (Negative Binomial Regression) نیاز باشد.
برای تحلیل دقیقتر، بهتر است به نمودارهای باقیماندهها و تستهای فرضیات مدل توجه کنید تا از مناسب بودن مدل اطمینان حاصل شود.