X
تبلیغات
رایتل

چگونه حجم نمونه لازم برای مطالعه را محاسبه کنیم؟

شنبه 22 خرداد 1395 ساعت 15:03

محاسبه حجم نمونه (Sample Size Calculation)

همانطور که می دانید، یکی از قسمت هایی که در طراحی مطالعه و در نتیجه نوشتن پروپوزال در رشته های پزشکی و دندانپزشکی و سایر حیطه های مربوط به سلامت، چالش برانگیز و البته بسیار مهم است، تعیین حجم نمونه مورد نیاز برای نیل به هدفی خاص در مطالعه است.

احتمالاً مستحضر هستید که مقادیر  p یا همان p values و فواصل اطمینان (confidence intervals) قویاً به اندازه حجم نمونه مورد مطالعه وابسته است و به طور کلی حجم نمونه بالا موجب می شود که فواصل اطمینان باریک تر شده و مقادیر p کوچکتر گردند. بنابراین پاسخ به این سوال که بزرگی حجم نمونه باید چه اندازه باشد، حائز اهمیت است. این درحالی است که در عمل تعیین دقیق اندازه نمونه مورد نیاز اغلب مورد غفلت قرار می گیرد. متنی که پیش روی شماست دستورالعمل های آسانی برای انتخاب مناسب تر اندازه نمونه مورد مطالعه ارائه می دهد.  مطالعات تحقیقاتی با اهداف متنوعی انجام می شوند. مطالعات بررسی تفاوت یا تشابه بین دوگروه از نظر یک عامل خطر یا رژیم درمانی خاص و مطالعات تخمین یک مقدار مانند شیوع یک بیماری در یک جمعیت خاص اهداف متفاوتی را در نظر دارند. شاید رایج ترین هدف، بررسی تفاوت بین دو گروه باشد و به همین دلیل این سناریو به عنوان پایه ای برای ادامه مطلب خواهد بود. اگرچه ایده های زمینه ای شرح داده شده قابل استفاده در تمامی شرایط است.


قدرت مطالعه (Power)
تفاوت بین دو گروه در یک مطالعه به وسیله تخمین اثر، فاصله اطمینان مناسب و مقدار p بیان می شود. فاصله اطمینان نشانگر گستره احتمالی مقادیر برای تأثیر واقعی در جمعیت است، درحالی که مقدار P تعیین کننده احتمال شانسی بودن اثر مشاهده شده در نمونه است. مقداری مرتبط با این موارد، قدرت آماری مطالعه است. به بیان ساده، قدرت مطالعه عبارت است از احتمال شناسایی صحیح یک تفاوت بین دو گروه مورد مطالعه که در واقعیت نیز این تفاوت در جمعیتی که نمونه ها از آن گرفته شده اند، وجود دارد.


عوامل مؤثر بر محاسبه حجم نمونه
سه عامل اصلی وجود دارد که در محاسبه حجم نمونه باید به آن ها توجه کرد: مقدار P، قدرت و اثر (جدول زیر). انتخاب هریک از این عوامل در اندازه نهایی نمونه تأثیرگذار بوده و مهارت ترکیب مقادیر واقع بینانه برای هریک از این عوامل در به دست آوردن حجم نمونه مناسب مهم خواهد بود. عملاً برای مقدار P و قدرت مطالعه انتخاب های مرسومی وجود دارد؛ مقدار P برای قابل توجه بودن (significance) معمولاً 0.05 تعیین می شود و قدرت مطالعه به طور عمومی بین 80 تا 95 درصد خواهد بود.

عاملی که باقی می ماند و باید به آن توجه داشت، مقدار اثری است که قرار است شناسایی شود. اگرچه، همیشه تخمین این مقدار مستقیماً امکانپذیر نیست. این عامل بسیار اساسی بوده، اثر کوچکتر نیازمند نمونه بزرگتر است و برعکس برای بررسی اثر بزرگتر اندازه نمونه کوچکتر کافی است و باید توجه شود که این مقدار دقیق انتخاب شود. اندازه اثر بر اساس قضاوت بالینی استوار است.

پس از تعیین این عوامل می توان با استفاده از جدول ها و فرمول های موجود حجم نمونه مورد نیاز را محاسبه کرد. عواقب خاص و طراحی های مطالعه پیچیده تر نیازمند اطلاعات بیشتر بوده و بهتر است محاسبه حجم نمونه آن ها به متخصصین این امر سپرده شود. اگرچه روش های مخصوص برای دو موقعیت رایج در زیر شرح داده شده است.


محاسبه حجم نمونه برای بررسی تفاوت در میانگین (در دو گروه با اندازه مساوی)
تفاوت هدف (target difference) مقدار تفاوت بین میانگین دوگروه است که به دنبال آزمون آن هستیم. اگر انحراف معیار برای یک متغیر کمی عدد بزرگتری باشد، احتمال اینکه تفاوت میانگین آن متغیر بین دو گروه مهم باشد کمتر از زمانی است که انحراف معیار عدد کوچکتری باشد. بنابراین تفاوت هدف (target difference) به وسیله انحراف معیار (standard deviation) بیان شده و تفاوت استاندارد شده (standardized difference) نامیده می شود:

در عمل دانستن دقیق انحراف معیار غیر محتمل است، اما تخمین آن از مطالعات مشابه در جمعیت های قابل مقایسه یا شاید با استفاده از یک مطالعه پیلوت امکانپذیر است. تخمین محافظه کارانه تر این مقدار در مرحله طراحی ممکن است منجر به مطالعه ای با قدرت پایین گردد، در نتیجه تخمین واقع بینانه این مقدار بسیار مهم است.

به عنوان مثال اگر در نتایج مطالعات دیگر، نتایج پیلوت و یا مشاهده بالینی خود شاهد تفاوت میانگینی به اندازه 14 (تفاوت هدف) بین دو گروه هستیم و انحراف معیار این متغیر برابر با 18 باشد، تفاوت استاندارد شده با استفاده از فرمول ذکر شده برابر خواهد بود با 0.78.

فرمول ها و مقادیر جدول بندی شده متعددی برای محاسبه اندازه نمونه مورد نیاز در چنین مواقعی در دسترس است، اما رویکردی آسان به وسیله Altman به صورت یک نرموگرام تهیه شده است (شکل زیر).

در این شکل، محور سمت چپ نشانگر تفاوت استاندارد شده و محور سمت راست قدرت مطالعه را نشان می دهد. با کشیدن خط راست بین دو محور، اندازه کلی حجم نمونه مورد نیاز تعیین می گردد. بخش بالایی نرموگرام مربوط به مقدار P برابر با 0.05 و بخش پایینی آن مربوط به مقدار P برابر با 0.01 است.
در مثالی که ذکر شد، با توجه به تفاوت استاندارد شده 0.78، برای شناسایی این تفاوت با قدرت آماری 95 درصد و با استفاده از سطح معنی داری 0.05، اندازه کل نمونه مورد نیاز تقریباً برابر خواهد بود با 86 (43 نمونه در هر گروه).


محاسبه حجم نمونه برای تفاوت نسبت ها (در دو گروه با اندازه مساوی)
رویکرد مشابهی را می تون برای محاسبه اندازه نمونه مورد نیاز برای مقایسه نسبت ها در دو گروه با اندازه مساوی به کار برد. در چنین مواقعی تفاوت استاندارد به وسیله فرمول زیر محاسبه می گردد:

که در آن p1 و p2 نسبت ها در دوگروه هستند و pبار میانگین این دو مقدار است. پس از محاسبه تفاوت استاندارد، نرموگرام Altman را می توان دقیقاً به همان شکل مشابه برای تعیین اندازه نمونه مورد نیاز به کار برد.

به عنوان مثال اگر میزان مورتالیته در دو روش درمانی برابر با 0.6 و 0.4 باشد، تفاوت استاندارد شده برابر خواهد بود با 0.4. در نتیجه با استفاده از نرموگرام آلتمن، حجم نمونه مورد نیاز برای شناسایی این مقدار تفاوت (0.2) با قدرت آماری 90 درصد و با در نظر گیری سطح معنی داری 0.05 برابر خواهد بود با 260 نفر (130 نفر در هرگروه).

با استفاده از این نرموگرام همچنین می توان به صورت گذشته نگر قدرت مطالعه منتشر شده را محاسبه کرد.

 

گروه های با اندازه نامساوی
در روش هایی که شرح داده شد، فرض بر این است که مقایسه بین دو گروه با اندازه مساوی انجام می شود. اگرچه چنین فرضی در عمل همیشه برقرار نیست، به عنوان مثال در مطالعه مشاهده ای یا کارآزمایی کنترل شده تصادفی با تخصیص تصادفی نامساوی نمونه ها. در چنین شرایطی تطبیق تعداد برای بازتاب این تفاوت امکانپذیر است. اولین قدم محاسبه حجم نمونه کل (برای دو گروه) با این فرض است که گروه ها اندازه نمونه مساوی دارند (همانطور که در بالا بدان اشاره شد). این حجم نمونه (N) را می توان با توجه به سهم واقعی (actual ratio) بین دو گروه (k) با استفاده از فرمول زیر تطبیق داد، که در آن 'N نشانگر حجم نمونه کل بازنگری شده است:

و اندازه نمونه هریک از دو گروه برابر خواهد بود با (N’/(1+k و (kN’/(1+k. یعنی حجم نمونه یک گروه k برابر حجم نمونه گروه دیگر خواهد بود.

حال اگر در مثال فشار خون متوسط شریانی، قرار باشد که سهم بیمارانی که تحت یک رویکرد درمانی قرار می گیرند، دو برابر بیماران تحت درمان با رویکردی دیگر باشد، این تفاوت در اندازه باید در اندازه مطالعه بازتاب داشته باشد. همانطور که قبلاً محاسبه شد، تعداد کل 86 بیمار برای شناسایی تفاوت استاندارد شده 0.78 با قدرت 90% و سطح معنی داری 0.05 بین دو گروه با اندازه مساوی مورد نیاز است. برای اینکه سهم رویکرد اول به رویکرد دوم را در نظر بگیریم (k=2)، طبق فرمولی که ذکر شد، حجم نمونه بازنگری شده برابر خواهد بود با:

N’ = (86×(1+2)^2)/4×2 = 774/8 = 97

تعداد کل نمونه های محاسبه شده شامل 32=97/3 بیمار در گروه تحت درمان با رویکرد دوم و 65 بیمار در رویکرد اول می شود.

تعداد کل نمونه های محاسبه شده شامل 97/ 3=32 بیمار در گروه تحت درمان با رویکرد دوم و 65 بیمار در رویکرد اول می شود.

 

محاسبه حجم نمونه لازم برای بررسی یک نسبت در جمعیت خاص

برای محاسبه شیوع یک صفت در یک جمعیت خاص، بررسی تمام افراد آن جمعیت همیشه امکانپذیر نیست. بنابراین انتخاب حجم نمونه مناسب برای تخمین نسبت به طوری که بازتابی از کل جمعیت باشد، عاقلانه به نظر می رسد. فرمول کوکران (Cochran's formula) یکی از پرکاربردترین روش‌ها برای محاسبه حجم نمونه در مطالعاتی است که به بررسی شیوع در یک جمعیت می پردازند. عوامل مؤثر در انتخاب حجم نمونه مناسب برای چنین مطالعاتی به قدرت مطالعه مدنظر، مقدار p، شیوع صفت مورد بررسی و اندازه جمعیت مورد مطالعه وابسته است. 

Cochran's formula

با توجه به پیچیده بودن فرمول، برخی سایت های اینترنتی امکان محاسبه آنلاین حجم نمونه را برای شما فراهم می آورند. از جمله این سایت ها می توان به حسابگر اندازه نمونه Raosoft اشاره کرد. اگر از شیوع صفت مورد نظر اطلاعاتی در دست ندارید، از شیوع 50% استفاده کنید که منجر به بزرگترین اندازه آماری لازم خواهد شد (همانگونه که در پیش فرض سایت آمده است.)

 

ترک مطالعه، داده های مفقود و شکست در پیگیری
محاسبه حجم نمونه بر اساس تعداد کل افرادی استوار است که در مطالعه نهایی مورد نیاز است. در عمل، افراد واجد شرایط همیشه مایل به شرکت در پژوهش نیستند و لازم است که رویکرد به حجم نمونه بیش از آن چیزی باشد که در وهله اول به نظر می رسد. به علاوه، حتی در مطالعات با بهترین طراحی و اجرا، رسیدن به مجموعه داده هایی که در آن داده ها کامل باشند، غیر معمول است. بنابراین محاسبه تعداد نمونه هایی که برای دستیابی به حجم نمونه مورد نظر نهایی نیاز است، ضروری خواهد بود.
فرض کنیم که تعداد کل N فرد در مطالعه نهایی مورد نیاز است ولی انتظار می رود که نسبتی از آن ها (q) از شرکت در مطالعه امتناع ورزند یا قبل از اتمام مطالعه ریزش داشته باشند. در چنین موقعیتی تعداد کل نمونه هایی که باید مدنظر باشد تا از رسیدن به اندازه نمونه نهایی اطمینان حاصل شود:

به عنوان مثال اگر فکر می کنید 10% نمونه ها از شرکت در مطالعه امتناع ورزند یا قبل از اتمام مطالعه ریزش داشته باشند، در فرمول بالا q برابر با 0.1 خواهد بود و در مثال فشار خون متوسط شریانی، تعداد نمونه مورد نیاز برای رسیدن به 86 نمونه در انتهای مطالعه برابر 96 خواهد بود.

 

پیام های کلیدی
مطالعات باید دارای قدرت کافی برای رسیدن به اهدافشان باشند و محاسبه حجم نمونه مناسب باید در طراحی هر مطالعه ای انجام پذیرد.

تخمین اندازه مورد انتظار اثر (effect) ممکن است دشوار باشد و باید در صورت امکان بر اساس شواهد موجود و تجربه بالینی استوار باشد. بسیار حائز اهمیت است که هر تخمینی به اندازه کافی بزرگ باشد تا از نظر بالینی مهم باشد و در عین حال قابل دستیابی باشد.

بسیاری از مطالعات با نتیجه صفر (null studies) ممکن است قدرت کمی داشته و قادر به نمایش تفاوت بین دو گروه نبوده باشند؛ فقدان شواهد به معنی شاهدی بر فقدان نیست.

 

"Abscence of evidence is not evidence of abscence"


برگرفته از: Statistics Review
دکتر فرشاد قلی پور

نظرات (0)
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)

نام :
ایمیل :
وب/وبلاگ :
ایمیل شما بعد از ثبت نمایش داده نخواهد شد