حجم نمونه معادلات ساختاری براساس تعداد سوالات یا گویه های پرسشنامه مشخص می شود و حداقل تعداد ان ۲۰۰ است. طبق نظر کلاین (۲۰۱۱) حجم نمونه معمولی در مطالعاتی که از معادلات ساختاری استفاده می شود حدود ۲۰۰ مورد است. با این حال، اندازه نمونه ۲۰۰ مورد ممکن است در هنگام تجزیه و تحلیل یک مدل پیچیده بسیار کوچک باشد. تعداد دقیق حجم نمونه به پیچیدگی مدل و همچنین به بسیاری از عوامل دیگر (به عنوان مثال، نرمال بودن داده ها، الگوهای از دست رفته) بستگی دارد.
برآورد حجم نمونه در تحلیلهاى چندمتغیره ماهیتآ پیچیده تر از تحلیل تک متغیره یا دومتغیره است. چنین وضعیتى به دلیل تعدد پارامترهایى است که پژوهشگر به دنبال برآورد آنهاست. به عبارت دیگر، وجود انواع متغیرهاى کمى و کیفى در یک تحلیل چندمتغیره و شکلهاى توزیع متفاوت براى آنها در جمعیت آمارى شرایط استفاده از توزیع نرمال براى برآورد پارامترها را پیچیده تر مىکند. به طور معمول، چنین وضعیتى نیاز بیشتر تحلیلهاى چندمتغیره به حجم نمونه ار طلب مىکند.
مدلسازی معادلات ساختاری همانند هر تکنیک آماری دیگر، به پژوهشگران تاکید میکند تا حجم نمونه را در مقابل سابقه مدل و خصوصیات دادهها مورد ملاحظه قرار دهند. مخصوصاً حجم نمونه مورد نیاز باید بهوسیله تحلیل توان بر اساس قسمتی از مدل با بزرگترین تعداد پیشبینها تعیین شود. از آن جایی که حجم نمونه پیشنهادی در مدلسازی معادلات ساختاری ضرورتاً بر اساس خصوصیات رگرسیون حداقل مربعات جزئی پایهگذاری شده است، پژوهشگران میتوانند به قواعد سرانگشتی متمایز بیشتری همانند آنهایی که به وسیله کوهن (۱۹۹۲) ارائه شده است، رجوع کنند.
هرچند برآورد حجم حداکثر نمونه به لحاظ کاربردى ساده تر است اما موضوع بسیار اساسى به لحاظ روش شناسى این است که چنانچه بتوان برآورد پارامترهاى مورد نظر در یک پژوهش را با حجم نمونه کمترى که از هر واحد نمونه اخذ شده دادههاى دقیقترى گردآورى شده است پژوهشگر را به نتایج واقعىتر خواهد رساند در مقایسه با موقعیتى که به دلیل بالا بودن حجم نمونه و اندک بودن نیروى انسانى با تجربه و قابل اعتماد نمىتوان به دادهها و بنابراین برآوردهاى انجام شده اطمینان زیادى داشت.
از آنجا که روششناسی مدلیابی معادلات ساختاری، تا حدود زیادی با برخی از جنبههای رگرسیون چند متغیری شباهت دارد، میتوان از اصول تعیین حجم نمونه در تحلیل رگرسیون چند متغیری برای تعیین حجم نمونه در مدلیابی معادلات ساختاری استفاده نمود. در تحلیل رگرسیون چند متغیری نسبت تعداد نمونه (مشاهدات) به متغیرهای مستقل نباید از ۵ کمتر باشد. در غیر این صورت نتایج حاصل از معادله رگرسیون چندان تعمیمپذیر نخواهد بود. نسبت محافظهکارانهتر ۱۰ مشاهده به ازای هر متغیر مستقل را هالینسکی و فلورت (۱۹۷۰) و میلر و کانس (۱۹۷۳) پیشنهاد نمودهاند. از دیدگاه جیمز استیونس (۱۹۹۵) و کلاین (۱۹۹۰) حتی در نظر گرفتن ۱۵ مشاهده به ازای هر متغیر پیشبین در تحلیل رگرسیون چند گانه با روش معمولی کمترین مجذورات استاندارد، یک قاعده سر انگشتی خوب به حساب میآید. پس به طور کلی در روششناسی مدلیابی معادلات ساختاری تعیین حجم نمونه میتواند بین ۵ تا ۱۵ مشاهده به ازای هر متغیر اندازهگیری شده تعیین شود:
۵Q < n < ۱۵Q
که در آن Q تعداد متغیرهای مشاهده شده یا تعداد گویهها (سوالات) پرسشنامه و n حجم نمونه است. لازم به تذکر است تاکید همیشه بر این است کف نمونه نباید از ۲۰۰ نفر کمتر باشد.
نکته حائز اهمیت در این باره آن است که تعداد عاملها و تعداد معرفها در مدل تدوین شده کاملا مشخص است. این در حالى است که میزانهاى اشتراک هریک از معرفها در مدلهاى عاملى را قبل از انجام مطالعه نهایى مشخص نبوده و تنها مىتوان براساس مطالعات پیشین بر مبناى مدلهاى عاملى یکسان و یا دادههاى حاصل از مطالعات مقدماتى این میزانهاى اشتراک را برآورد کرد. برآوردى که لزومآ با نتایج نهایى تحقق یکسان نخواهد بود. به این ترتیب چنانچه محقق بخواهد اطمینان بالاترى نسبت به حجم نمونه خود براى آزمون مدل با توان کافى داشته باشد مناسب است که میزانهاى اشتراک را حداکثر در سطح متوسطى برآورد کند.
اصل کلى حاکم بر رابطه نرمال بودن چندمتغیره و حجم نمونه آن است که هرچه انحراف از نرمال بودن چندمتغیره بیشتر شود. نسبت پاسخگویانى که براى برآورد هر پارامتر مورد نیاز است افزایش مىیابد نسبت مورد پذیرش براى به حداقل رساندن خطاهاى برآورد پارامترها آن است که در صورت نقض نرمال بودن چندمتغیره براى برآورد هر پارامتر آزاد در مدل، به حداقل ۱۵ نمونه نیاز است. اهمیت بالا رفتن حجم هنمون در هنگامى که پیش فرض نرمال بودن چندمتغیره نقض می شود در کاهش خطاى نمونه گیرى به اندازه اى است که بتوان به نتایج حاصل از برآورد پارامترها اطمینان کرد.
به طور کلی برای تعیین نمونه از فرمول کوکران یا جدول مورگان استفاده می شود. این نکته مهم است که مقایسه تکنیک های نمونه گیری و استفاده همزمان از دو تکنیک نمونه گیری در یک پژوهش، مناسب نیست.