المبدأ الذي يقوم عليه “اختبار t” للعينات

2٬609 5 دقائق

2012 استخدام الإحصاء لفهم البيئة

فيليب ويذر وبني أ.كوك

KFAS

المبدأ الذي يقوم عليه الاختبار للعينات t الرياضيات والهندسة الهندسة

إذا كانت التوزيعات للعينتين طبيعية (كما هو الحال للاسترانشيوم 90 في مثال اللبن) وإذ كانت أحجام العينات صغيرة (أقل من 30 وحدة عينة فردية في كل عينة) فإن الاختبار t سيكون مناسباً في هذه الحالة.

وهذا الاختبار (والذي يسمى في بعض الأحيان باختبار t للطالب أو اختبار t للعينة المستقلة) يقارن الفرق المطلق بين المتوسطين (أي أننا مهتمين عند هذه النقطة حيث يكون االمتوسط أكبر فقط بحسب حجم الفرق المتضمن).

وهذا الفرق بين المتوسطين يقدم لنا قياساً للتباين المفسر بين العينات، أي التباين الناتج بحسب التصنيف (وهو هنا أنواع المحطات النووية المختلفة).

وهذا الفرق يتم ضبطه ليضع في الاعتبار حجم التباين غير المفسر داخل كل عينة (ويتم قياسه باستخدام الانحرافات المعيارية) وحجم العينة (العدد من كل نوع من المزارع).

والانحرافات المعيارية الكبيرة تجعل هناك احتمال أقل في الحصول على فرق جوهري وله دلالة من الناحية الإحصائية بين المتوسطات وذلك لأنها تتضمن أن هناك قدر كبير من التفاوت لم يوضع في الاعتبار بحسب عضوية التصنيفات.

وأحجام العينات الكبيرة تسمح لنا بدرجة ثقة أكبر في التقريبات التي تتم في متوسطات المجتمعات والانحرافات المعيارية لها وتقليل تأثير الانحرافات المعيارية.

وتوجد صيغ عديدة لهذه الصيغة الحسابية لحساب المؤشر الإحصائي t (ويسمى في بعض الأحيان ts) ومعظمها في شكل تقريبات سهلة في الاستخدام بالمقارنة مع صيغة حسابية أخرى كاملة وأكثر تعقيداً (انظر المربع 4 -1).

وعلى الرغم من أن هذه الصيغة الحسابية تبدو شديدة التعقيد، لكن جميع الأرقام المطلوبة مألوفة بدرجة كبيرة (المتوسطات والانحرافات المعيارية وأحجام العينات). والعديد من برامج الكمبيوتر الإحصائية تستخدم هذه الصيغة الكاملة.

يبين الشكل 4 – 3 العلاقة بين التباين المفسر والتباين غير المفسر والقيمة t والاحتمالات والافتراض الصفري.

والقيم t الأكبر تؤدي إلى قيم P أصغر للاحتمالات أي أن هناك احتمال أكبر لأن تكون ذات دلالة وتؤدي إلى رفض الافتراض الصفري.

وإذا كانت t من ناحية أخرى صغيرة فإن الافتراض الصفري هو أنه لا يوجد فرق جوهري بين المتوسطات وهناك احتمال أكبر لأن يكون هذا الافتراض صحيحاً.

وبخصوص حجم القيمة t ومدى هذا الحجم لإثبات الدلالة فإن هذا يعتمد على درجات الحرية، وهي في هذه الحالة n₁ + n₂ – 2 حيث n₁ هو حجم العينة للعينة 1 وn₂1 هو حجم العينة للعينة 2. وبمجرد الحساب فإننا نجد احتمال الحصول على المؤشر الإحصائي الاختباري (t) بالصدفة.

ولكي نقوم بذلك فإننا نقارن قيمتنا الحسابية للقيمة t في الجدول الذي يحتوي على القيم t مع احتمالاتها المرتبطة للافتراض الصفري والتي ستكون صحيحة، وهذا يتضمن النظر إلى القيمة التي حصلت عليها من المعادلة في المربع 4 – 1 في جدول التوزيع t (ويوجد اقتباس منها مبين في الجدول 4 – 2) مقابل درجات الحرية المناسبة.

وهذا يقدم الاحتمال (P) للحصول على القيم المحسوبة t بالصدفة، أي احتمال ألا يكون هناك فرق جوهري له دلالة بين المتوسطات.

وفقط إذا كادت قيمة الاحتمالات P هذه أقل من 0.05 عندئذٍ يمكننا أن نرفض الافتراض الصفري ونصرح بأنه يوجد فرق له دلالة بين المتوسطات.

ومعظم برامج الكمبيوتر تقوم بحساب الاحتمالات لك وهكذا لا تحتاج لاستخدام الجداول.

يمر المثال العملي 4 – 1 عبر خطوات الحساب للقيمة t في مثال الاسترانشيوم 90. وعلى الرغم من أنه من المفضل عند تصميم مشروع محاولة المحافظة على أحجام العينات متساوية، ولكن هذا ليس ممكناً دائماً. وهنا على سبيل المثال لدينا فقط 9 محطات ري زووم بالمقارنة مع 10 محطات باور جاش.

يحدث هذا النوع من الأوضاع بشكل متكرر في تجميع البيانات البيئية حيث يتم تمثيل أحد الصنفين بشكل متكرر أقل من الصنف الآخر. ولحسن الحظ فإن أحجام العينات المتساوية ليست من الضرورات للاختبار t.

وبالنسبة لهذه البيانات فإن t تساوى 5.413. ودرجات الحرية هي 17 (n₁ + n₂ – 2 = 10 + 9 – 2) وبمعرفة درجات الحرية فإننا ننظر إلى القيمة t في جدول القيم t (انظر الجزء المظلل في الجدول 4 – 2) حيث ننظر للقيمة المحسوبة t وهي أكبر من قيمة t في الجدول إذا كنا سنرفض افتراضنا الصفري.

وهنا فإننا نجد أن القيمة t لدينا (5.413) أعلى من القيمة في الجدول t وذلك عند درجات الحرية df = 17 لكل من الاحتمال P = 0.05 (الجدول t = 2.110) والاحتمال P = 0.01 (الجدول t = 2.898).

ولاحظ أنه بالنسبة لأي عدد محدد لدرجات الحرية مع انخفاض الاحتمالات فإن القيمة t في الجدول تزداد (أي أنه بالنسبة لأي درجات حرية محددة فمع زيادة القيمة t يقل الاحتمال في أن يكون هذا قد حدث بطريق الصدفة).

ومعظم إحصاءات الاختبارات وإن لم تكن كلها موزعة بحيث أن الاحتمالات تنخفض مع القيم الزائدة للمؤشر الإحصائي، وإنك تحتاج لفحص كل جدول بعناية.

وحيث أن القيمة t التي قمنا بحسابها أكبر من 2.898 (القيمة عند الاحتمالات P = 0.01) فإن احتمال الحصول على القيمة t لدينا بطريق الصدفة أقل من 0.01 مما يتضمن احتمالاً أقل من حيث عدم وجود أي فرق جوهري بين المتوسطين.

وحيث أن القيمة P أقل من المستوى الحرج 0.05 فإننا نرفض الافتراض الصفري بعدم وجود فرق جوهري ونقبل الفرض البديل بأن هناك فرق جوهري.

وتحتاج لتسجيل الاحتمالات والقيمة t وعدد درجات الحرية بالإضافة إلى البيان الذي يفيد بأن هناك فرق له دلالة بين العينات.

وعلى الرغم من أننا نعرف أن هناك فرق له دلالة ولكننا لا نعرف بعد أين يوجد هذا الفرق وأنك تحتاج لفحص متوسطات العينة لرؤية المتوسط الأكبر (وفي هذا المثال فإن المتوسط للمزارع القريبة من محطات ري زووم أكبر من المتوسط للمزارع القريبة من محطات باور جاش). وفي الجزء الخاص بالنتائج في التقرير يمكنك أن تقوم كما يلي:

اللبن من المزارع بالقرب من محطات ري زووم به نسبة أعلى بصورة جوهرية لها دلالة إحصائية لنشاط الاسترانشيوم 90 بالمقارنة مع اللبن من المزارع بالقرب من محطات باور جاش (t = 5.413, df = 17, P < 0.01).

ويجب أيضاً أن تقدم مؤشراً للمتوسطات (± الأخطاء المعيارية)، سواء في النص أو في الجدول أو في الأعمدة البيانية أو المخطط النقطي (انظر الفصل 2).

وفي بعض الأحوال فإن بعض برامج الكمبيوتر تقوم بحساب درجات الحرية للاختبارات t على أنها مختلفة اختلافاً طفيفاً عن القيمة n₁ + n₂ – 2. وذلك لأن هناك افتراض للاختبار t بأن التباين داخل عينة واحدة له قيمة مماثلة للتباين في العينة الأخرى.

وفي الحالات حيث تكون التباينات غير متساوية، فإن بعض البرامج تقوم بتعديل درجات الحرية لتصحيح ذلك. وإذا كان البرنامج لديك يفعل ذلك، استخدم درجات الحرية المصححة والاحتمالات المرتبطة.

وفي جميع الحالات فإن الاحتمالات (القيمة P) هي الرقم الأكثر أهمية لتفسير النتائج، ولكن عليك دائماً تسجيل درجات الحرية والمؤشر الإحصائي الذي يتم اختباره أيضاً.

وبعض برامج الكمبيوتر تقدم القيم السالبة للقيمة t: وعليك تسجيل القيمة المطلقة t (أي بدون العلامة السالبة إذا كانت موجودة).

والسبب في ظهور القيم السالبة للقيمة t هو أن البرنامج يستخدم الفرق بين المتوسطات وليس الفرق المطلق بين المتوسطات، وعند حساب t (انظر الخط العلوي للصيغة في المربع 4 – 1).

وبخصوص ما إذا كانت الإشارة موجبة أو سالبة فإن هذا يتم اختيارياً ويعتمد فقط على ما إذا كان المتوسط الأول الذي تم إدخاله في الصيغة الحسابية أكبر أو أصغر من المتوسط الثاني.

والبيانات في المثال العملي 4 – 1 يتم عرضها في عمودين منفصلين (واحد لكل عينة). وهذا الإيضاح العرض.

ولاحظ أنك إذا كنت ستستخدم برنامج كمبيوتر لحساب اختبارات t لديك فإن هذا النموذج للبيانات لن يكون مناسباً عادة. انظر الجدول ب 1 (الملحق ب) بخصوص تفاصيل مدخلات البيانات للتحليل الإحصائي باستخدام أجهزة الكمبيوتر.

ومما هو جدير بالملاحظة أنه يوجد أيضاً اختبار t بعينة واحدة يسمح بالمقارنات لقيمة فردية للوسط مع قيمة متوقعة – انظر زار (1999) أو سوكال ورولف (1995) لمزيد من التفاصيل. وكن حريصاً عند استخدام برامج الكمبيوتر بأن الاختبار الذي تستخدمه يسمى اختبار العينتين أو اختبار المقارنات بين المتوسطات.

وحيثما كانت العينات كبيرة (وعادة تكون أكبر من 30 في كل عينة) فإن الاختبار z يمكن استخدامه بدلاً من الاختبار t. والمعادلة مماثلة لتلك المستخدمة في الاختبار t، على الرغم من أن الحساب أسهل (انظر المربع 4 – 2).

[KSAGRelatedArticles] [ASPDRelatedArticles]

2٬609 5 دقائق

اظهر المزيد

اشترك معنا بإدخال إيميلك الشخصي

أمثلة توّضح كيفية استنتاج الفروق بين عينتين

المبدأ الذي يقوم عليه "اختبار مان ويتني U"

مقالات ذات صلة

نبذة تعريفية عن مجموعة العلوم التي يشملها علم الرياضيات

طرق تمثيل البيانات

الطرق الرياضية المتبعة لـ”حساب المثلثات”

نبذة تعريفية عن “علم الحساب”