آمار استنباطی (Inferential Statistics)، روشهای متعددی است که در آنها میتوان از اطلاعات نمونه مورد مطالعه برای جامعه مورد نظر استفاده کرد. در حالی که آمار توصیفی ویژگی های یک مجموعه داده را خلاصه می کند، آمار استنباطی به شما کمک می کند تا به نتیجه گیری برسید و بر اساس داده های خود پیش بینی کنید.
هنگامی که دادهها را از یک نمونه براساس تکنیک های نمونه گیری جمعآوری کردید، میتوانید از آمار استنباطی برای درک جمعیت بزرگتری که نمونه از آن گرفته شده است استفاده کنید. آمار استنباطی با تجزیه و تحلیل نمونههای بهدستآمده از دادههای جمعیت، به ایجاد درک خوب از دادههای جمعیت کمک میکند. با استفاده از آزمون ها و ابزارهای تحلیلی مختلف به تعمیم جمعیت کمک می کند. برای انتخاب نمونههای تصادفی که جامعه را به طور دقیق نشان میدهند، از تکنیکهای نمونهگیری زیادی استفاده میشود. برخی از روش های مهم عبارتند از: نمونه گیری تصادفی ساده، نمونه گیری چندمرحله ای، نمونه گیری خوشه ای و روش های نمونه گیری سیستماتیک.
آمار استنباطی را می توان به عنوان حوزه ای از آمار تعریف کرد که از ابزارهای تحلیلی برای نتیجه گیری در مورد یک جامعه با بررسی نمونه های تصادفی استفاده می کند. هدف آمار استنباطی ایجاد تعمیم در مورد یک جمعیت است. در آمار استنباطی، آماری از داده های نمونه گرفته می شود (مثلاً میانگین نمونه) که برای استنباط در مورد پارامتر جمعیت (مثلاً میانگین جامعه) استفاده می شود. آمار استنباطی دو کاربرد عمده دارد:
تخمین زدن در مورد جمعیت (به عنوان مثال، میانگین نمره SAT همه دانش آموزان کلاس یازدهم در ایالات متحده).
آزمایش فرضیه ها برای نتیجه گیری در مورد جمعیت ها (به عنوان مثال، رابطه بین نمرات SAT و درآمد خانواده).
آمار توصیفی به شما امکان می دهد یک مجموعه داده را توصیف کنید، در حالی که آمار استنباطی به شما امکان می دهد بر اساس یک مجموعه داده استنتاج کنید.
با استفاده از آمار توصیفی، می توانید مشخصات داده های خود را گزارش کنید:
توزیع مربوط به فراوانی هر مقدار است.
گرایش مرکزی به میانگین مقادیر مربوط می شود.
تنوع به میزان پراکندگی مقادیر مربوط می شود.
در آمار توصیفی، هیچ عدم قطعیتی وجود ندارد – آمار دقیقاً داده هایی را که شما جمع آوری کرده اید توصیف می کند. اگر دادهها را از کل جمعیت جمعآوری کنید، میتوانید مستقیماً این آمار توصیفی را با آمارهای سایر جمعیتها مقایسه کنید.
بیشتر اوقات، شما فقط میتوانید دادهها را از نمونهها به دست آورید، زیرا جمعآوری دادهها از کل جمعیتی که به آنها علاقه دارید بسیار دشوار یا گران است. در حالی که آمار توصیفی فقط می تواند ویژگی های یک نمونه را خلاصه کند، آمار استنباطی از نمونه شما برای حدس های معقول در مورد جمعیت بزرگتر استفاده می کند.
با آمار استنباطی، استفاده از روشهای نمونهگیری تصادفی و بیطرف مهم است. اگر نمونه شما نماینده جامعه شما نیست، نمی توانید استنباط آماری معتبر داشته باشید یا تعمیم دهید.
از آنجایی که اندازه یک نمونه همیشه کوچکتر از اندازه جامعه است، برخی از جامعه توسط داده های نمونه گرفته نمی شوند. در آمار استنباطی این خطای نمونهگیری را ایجاد میکند، که تفاوت بین مقادیر واقعی جامعه (که پارامترها نامیده میشوند) و مقادیر نمونه اندازهگیری شده (به نام آمار) است.
هر زمان که از نمونه استفاده می کنید، خطای نمونه گیری رخ می دهد، حتی اگر نمونه شما تصادفی و بی طرفانه باشد. به همین دلیل، همیشه در آماراستنباطی مقداری عدم قطعیت وجود دارد. اما استفاده از روش های نمونه گیری احتمالی این عدم قطعیت را کاهش می دهد.
در آمار استنباطی ویژگی های نمونه ها و جمعیت ها با اعدادی به نام آمار و پارامترها توصیف می شود:
آمار معیاری است که نمونه را توصیف می کند (به عنوان مثال، میانگین نمونه).
پارامتر معیاری است که کل جمعیت را توصیف می کند (به عنوان مثال، میانگین جمعیت).
خطای نمونه گیری تفاوت بین یک پارامتر و یک آمار مربوطه است. از آنجایی که در بیشتر موارد پارامتر جمعیت واقعی را نمی دانید، می توانید از آمار استنباطی برای تخمین این پارامترها به گونه ای استفاده کنید که خطای نمونه گیری را در نظر بگیرد.
دو نوع تخمین مهم در آماراستنباطی وجود دارد که می توانید در مورد جمعیت انجام دهید: تخمین نقطه ای و تخمین فاصله ای.
تخمین نقطه ای یک تخمین مقدار واحد از یک پارامتر است. به عنوان مثال، میانگین نمونه، تخمین نقطه ای از میانگین جمعیت است.
تخمین بازه ای محدوده ای از مقادیر را به شما می دهد که انتظار می رود پارامتر در آن قرار داشته باشد. فاصله اطمینان رایج ترین نوع تخمین فاصله است.
هر دو نوع تخمین برای جمع آوری یک ایده واضح از جایی که یک پارامتر احتمالاً در آن قرار دارد، مهم هستند.
یک بازه اطمینان از تغییرپذیری حول یک آمار برای بدست آوردن تخمین فاصله ای برای یک پارامتر استفاده می کند. فواصل اطمینان برای تخمین پارامترها مفید هستند زیرا خطای نمونه برداری را در نظر می گیرند.
در حالی که یک تخمین نقطه ای مقدار دقیقی را برای پارامتری که به آن علاقه دارید به شما می دهد، یک فاصله اطمینان عدم قطعیت تخمین نقطه را به شما می گوید. آنها بهتر است در ترکیب با یکدیگر استفاده شوند.
هر بازه اطمینان با سطح اطمینان همراه است. سطح اطمینان احتمال (در درصد) بازه حاوی تخمین پارامتر را در صورت تکرار مجدد مطالعه به شما می گوید. فاصله اطمینان ۹۵٪ به این معنی است که اگر مطالعه خود را با یک نمونه جدید دقیقاً به همان روش ۱۰۰ بار تکرار کنید، می توانید انتظار داشته باشید که تخمین شما در محدوده مقادیر مشخص شده ۹۵ بار باشد.
اگرچه می توانید بگویید که تخمین شما در یک بازه زمانی مشخص خواهد بود، اما نمی توانید با اطمینان بگویید که پارامتر جمعیت واقعی خواهد بود. این به این دلیل است که شما نمی توانید ارزش واقعی پارامتر جمعیت را بدون جمع آوری داده ها از جمعیت کامل بدانید.
با این حال، با نمونه گیری تصادفی و حجم نمونه مناسب، به طور منطقی می توانید انتظار داشته باشید که فاصله اطمینان شما در درصد معینی از زمان شامل پارامتر باشد.
آزمون فرضیه نوعی آمار استنباطی است که برای آزمون مفروضات و نتیجه گیری در مورد جامعه از داده های نمونه موجود استفاده می شود. این شامل تنظیم یک فرضیه صفر و یک فرضیه جایگزین و به دنبال آن انجام یک آزمون آماری معناداری است. نتیجه گیری بر اساس مقدار آماره آزمون، مقدار بحرانی و فواصل اطمینان حاصل می شود. آزمون فرضیه می تواند دم چپ، راست و دو دم باشد. در زیر آزمونهای فرضیههای مهمی که در آمار استنباطی استفاده میشوند، ارائه شدهاند.
تحلیل رگرسیون برای تعیین کمیت چگونگی تغییر یک متغیر نسبت به متغیر دیگر استفاده می شود. انواع مختلفی از رگرسیون های موجود مانند رگرسیون خطی ساده، خطی چندگانه، اسمی، لجستیک و رگرسیون ترتیبی وجود دارد. رایج ترین رگرسیون مورد استفاده در آمار استنباطی رگرسیون خطی است. رگرسیون خطی اثر تغییر واحد متغیر مستقل در متغیر وابسته را بررسی می کند.
آماراستنباطی بسیار مفید و مقرون به صرفه است زیرا میتواند بدون جمعآوری دادههای کامل استنباطهایی در مورد جمعیت انجام دهد. برخی از نمونه های آمار استنباطی در زیر آورده شده است:
فرض کنید میانگین نمرات ۱۰۰ دانش آموز در یک کشور خاص مشخص است. با استفاده از این اطلاعات نمونه می توان میانگین نمرات دانش آموزان کشور را با استفاده از آماراستنباطی تقریب زد.
فرض کنید یک مربی میخواهد بفهمد دانشآموختگان سال دوم دانشگاه او میتوانند بدون توقف چند تا چرخ معمولی انجام دهند. از یک نمونه از چند دانش آموز خواسته می شود تا چرخ های چرخ دستی را انجام دهند و میانگین محاسبه می شود. آمار استنباطی از این دادهها برای نتیجهگیری در مورد اینکه چه تعداد دانشآموز دومی میتوانند به طور متوسط انجام دهند، استفاده میکند.