المراحل التي تتم بها أداء الاختبارات الإحصائية

381 7 دقائق

2012 استخدام الإحصاء لفهم البيئة

فيليب ويذر وبني أ.كوك

KFAS

أداء الاختبارات الإحصائية الرياضيات والهندسة الهندسة

الأساليب الإحصائية الاستدلالية تقدم طريقة موضوعية لتحديد ما إذا كانت هناك فروق بين العينات والعلاقات بين المتغيرات والارتباطات بين التوزيعات التكرارية. وهذا الفصل يغطي:

– اختبار الفرض.

– تحويلات البيانات.

– اختيار الاختبار الإحصائي.

إن عرض البيانات باستخدام المتوسطات أو الوسيط يسمح لنا بتلخيص نقاط عديدة وفحص بعض الصفات والنماذج في العينة.

ولكن تفسير هذه الملخصات يميل إلى أن يكون وصفياً وسطحياً، وفي كثير من الأحيان فإننا نرغب في الوصول لاستنتاجات علمية بخصوص ما إذا كانت هناك:

– فروق بين التصنيفات أو المعالجات (على سبيل المثال في قيمة المحافظة على الطبيعة في مواقع مختلفة أو تركيز المعادن الثقيلة في أنواع معينة من التربة أو في تطوير الوعي البيئي في الأطفال في أماكن مختلفة).

– العلاقات بين المتغيرات (على سبيل المثال بين معدل النمو والتغذية أو تركيز الملوثات والمسافة من مصدر التلوث).

– الارتباطات بين التوزيعات التكرارية (على سبيل المثال تكرار وجود نوعين من النبات معاً أو نسبة الأشخاص الذين يفضلون المنتجات الغذائية الحيوية على المنتجات غير الحيوية).

– الإحصاء الاستدلالي يقدم لنا الأساليب الموضوعية لتحديد ما إذ كانت هذه الفروق أو العلاقات أو الارتباطات ذات دلالة أي ما إذا كان من شأنها أن تكون حقيقية أو أن من شأنها أن تكون قد حدثت بطريق الصدفة.

الفرض الاحصائي

في الفصل 2 تعرفنا على المتوسطات والأخطاء المعيارية لأطوال الضفادع الصغيرة والبالغة لغرض وصف مجموعة البيانات.

وقد نرغب في التقدم خطوة أخرى في ذلك لاكتشاف ما اذ كان الفرق الواضح بين المتوسطين له دلالة (أي ما إذا كان كبيراً بما يكفى لأن يكون دافعاً في مجال هذا البحث): وهنا يتم استخدام الإحصاء الاستدلالي.

والخطوة الأولى في عملية أداء الإحصاء الاستدلالي هي تكوين الفرض، والفرض الإحصائي قد يختلف عن الفرض العلمي للأهمية: ففي الاختبار الإحصائي حيث نقوم بمقارنة متوسطين، فإننا نختبر بالفعل الافتراض بأنه لا توجد فروق جوهرية بين المتوسطات.

وبنفس الأسلوب إذا كنا نقوم بفحص العلاقة بين متغيرين فإننا نختبر الافتراض بأنه لا توجد علاقة جوهرية. وهذا الافتراض بأنه لا يوجد فرق (أو لا توجد علاقة) يعرف باسم الافتراض الصفري ويشار إليه باسم H_o.

وكمثال تصور أننا نقوم بفحص ما إذا كان هناك فرق في النشاط الإشعاعي للمناطق المحيطة بالقرب من نوعين (أنواع تخيلية) من محطات توليد الطاقة النووية، وأحد النوعين يستخدم أسلوب "تكبير الأشعة" (راي زووم) والنوع الآخر يستخدم أسلوب "اندفاع الطاقة" (باور جاش).

وبالنسبة لأحد مقاسس النشاط الإشعاعي يمكننا استخدام مقياس نشاط الاسترانشيوم 90 المتواجد في اللبن في أقرب مزرعة لكل من عشرة محطات نووية تستخدم راي زووم وكل من 10 محطات تستخدم باور جاش (أي 20 مزرعة إجمالي).

والافتراض الصفري هو أنه لا يوجد فرق في نشاط الاسترانشيوم 90 في اللبن في المزارع القريبة من نوعي المحطات. وإذا حدث بعد الاختبار الإحصائي ووجدنا أن البيانات لا تدعم الافتراض الصفري، فإننا سنقبل الافتراض البديل والذي يجب أن يتم تحديده مقدماً قبل البحث، وبالنسبة لبعض الاختبارات (مثل تلك حيث نقارن متوسطين لفحص العلاقات بين المتغيرات)، يوجد نوعان من الافتراضات البديلة: الافتراض المحدد وغير المحدد.

وفي الاختبار المحدد فإننا نحدد اتجاه الاختلافات أو العلاقة. وعندئذ فقط نختبر في هذا الاتجاه. على سبيل المثال فإن الافتراض الصفري قد يكون متوسط العينة أ ليس أكبر من متوسط العينة ب والافتراض البديل هو أن متوسط العينة أ أكبر من متوسط العينة ب.

ولكننا مهتمون عاده في الحالة حيث يمكن أن يكون الفرق في أي اتجاه. وفي هذه الحالة فإن الافتراض البديل غير المحدد هو أن متوسطات العينة أ والعينة ب مختلفة.

وفي مثال نشاط الاسترانشيوم 90 في اللبن لا يوجد لدينا سبب واضح مقدماً قبل المسح للتنبأ باتجاه الفرق (إن وجد) في مستوى النشاط الإشعاعي بالقرب من محطات راي زووم أو محطات باور جاش.

ولذلك سنحدد افتراضاً بديلاً غير محدد بأن هناك فرق في نشاط الاسترادشيوم 90 في اللبن من المزارع القريبة من النوعين المختلفين من المحطات النووية.

والمرحلة التالية بعد تحديد الافتراض الصفري هي حساب معيار إحصائي اختباري. والمعيار الإحصائي الاختباري هو عدد فردي يتم حسابه من البيانات.

وبنفس الأسلوب مثل توزيع قيم البيانات فهو غالباً ما يتبع التوزيع الطبيعي والمعايير الإحصائية الاختبارية لها أيضاً توزيعات معروفة للاحتمالات، وهذا يعني أن أي قيمة إحصائية اختبارية معينة لها قيمة احتمالات مرتبطة بها.

وتفسير الاختبار الإحصائي يعتمد على هذا الاحتمال لحدوث مثل هذا المعيار الإحصائي الاختباري بالصدفة والمعيار الإحصائي الاختباري يكون مبيناً عادة على دسبة من التباين المفسر بالنسبة للتباين غير المفسر.

والتباين المفسر (أو التباين بين العينات) هو التباين الذي يمكن أن ينسب للتصميم في التجربة أو المسح: على سبيل المثال في مثال نشاط الاسترانشيوم 90 في اللبن، فإن التباين المفسر قد يكون بسبب قرب المزرعة من نوع معين من المحطات النووية (راى زووم أو باور جاش) والتباين غير المفسر هو التباين في العينات الفردية (على سبيل المثال لكل من العينتين من المزارع).

وبمقدار ما ترداد نسبة التباين المفسر إلى التباين غير المفسر بمقدار ما ترداد احتمالات أن تكون المتوسطات ذات اختلاف جوهري. والنوعان من التباين يمكن تصويرهما في الشكل 3 – 1.

وفي جزء لاحق في هذا الفصل سندرس كيفية اختيار الاختبار ثم الإجراءات لحساب المعيار الإحصائي الاختباري لكل اختبار معين وهي مبينة في الفصول اللاحقة.

وحيث أن المعايير الإحصائية الاختبارية لها خصائص حسابية معروفة، فإذ عرفنا حجم العينات (وغالباً ما يتم ضبطها على أساس أن تضع في الاعتبار عدد النقاط الثابتة – وهي درجات الحرية – انظر المربع 3 – 1) يمكننا أن نجد احتمال الحصول على أي قيمة معينة للمعيار الإحصائي الاختباري بالصدفة.

وبعبارة أخرى فإننا نحصل على احتمال (P) أن يكون الافتراض الصفري صحيحاً (في حالة اختبار الفرق فإن الاحتمال هو أنه لا يوجد فرق).

وإذ كان هذا الاحتمال مرتفعاً (P أكبر من أو يساوي 0.05) فهناك احتمال مرتفع لأن يكون الافتراض الصفري صحيحاً ولذلك فإننا نقبل الافتراض الصفري بأنه لا يوجد فرق جوهري.

ولكن إذا كان الاحتمال منخفضاً (P أقل من 0.05) ففي هذه الحالة يوجد احتمال منخفض لأن يكون الافتراض الصفري صحيحاً ويمكننا رفض الافتراض الصفري بأنه لا يوجد فرق وقبول الافتراض البديل عندئذ بأنه يوجد فرق.

وإذا وجدنا فرق، فإنه يعرف بأنه فرق جوهري إحصائي ونسجله هكذا مع بيان الاحتمالات. وأسلوب تسجيل الاحتمالات مبين في ٍالمربع 3 – 2.

ومستوى الدلالة 0.05 (أو 5%) يسمى المستوى الحرج وهو يمثل حداً تحكمياً يتم قبوله لدى معظم علماء الإحصاء. والاحتمال 0.05 يتضمن النتيجة تحدث فقط وبصورة مطلقة كنتيجة لتفاوتات العينة بصورة عشوائية 5 مرات في كل 100 (أو 1 لكل 20).

وبعبارة أخرى إذا لم يكن هناك فرق جوهري في مستوى الاسترانشيوم 90 من اللبن بالقرب من النوعين من المحطات النووية ولكننا كررنا المسح 20 مرة فإننا نتوقع الحصول على فرق جوهري مرة واحدة من بين العشرين لمجرد الصدفة.

وفي الإحصاء لا يمكننا أبدا أن نكون متأكدين بصفة مطلقة من أن رفض الافتراض الصفري يمثل النتيجة الصحيحة. واحتمال رفض الافتراض الصفري عندما يكون في الحقيقة هو الفرض الصحيح يسمى خطأ من النوع 1 ("ومصطالح الخطأ" لا يتضمن أنه أخطاء من جانب الباحث أو العالم الإحصائي: ولكنه مجرد خطر كامن في عملية أداء الاختبارات الإحصائية).

ومن خلال تخفيض مستوى الدلالة الذي نستخدمه في الاختبار يمكننا أن نكون أكثر تأكيداً من أن الخطأ من النوع 1 لن يحدث (من خلال الاختبار عند المستوى 0.001 يمكننا أن نكون على ثقة بنسبة 99.9 % أننا لم نرفض الافتراض الصفري بصورة باطلة).

ولكن هناك نوع آخر من الخطأ الإحصائي (يسمى الخطأ من النوع 2) ويصبح هناك احتمال أكبر لحدوثه عند انخفاض المستوى الحرج واهو احتمال قبول الافتراض الصفري بينما يكون في الحقيقة افتراضاً غير صحيح.

على سبيل المثال فإننا قد نستنتج بأنه لا يوجد فرق بين متوسطين بينما في الحقيقة يوجد فرق. ولمعظم الأغراض فإن المستوى 0.05 يقدم تسوية مقبولة بين الحصول على الأخطاء من النوع 1 والنوع 2.

وتوجد بعض حالات حيث من المفضل استخدام الحد الحرج الأدنى. وأحد هذه الحالات حيث يتم أداء عدد كبير من الاختبارات.

فعند حساب 20 اختبار عند المستوى 0.05 فإننا نتوقع على الأقل نتيجة واحدة تظهر كقيمة جوهرية بطريق الصدفة. وهناك أسلوب لمعالجة هذه المشكلة (أسلوب بونفيروني وهو تقليل المستوى الحرج طبقاً لعدد الاختبارات التي يتم أداؤها.

والمستوى الحرج المعتاد (0.05) مقسوم ببساطة على عدد الاختبارات وهكذا فعند حساب 20 اختبار فإن المستوى الحرج لرفض الافتراض الصفري سيكون 0.50 ÷ 20 = 0.0025 وفي حالة إجراء 50 اختبار سيكون 0.050 ÷ 50 = 0.001 وبالنسبة للتحليلات الأكثر تعقيداً، انظر سوكال ورولف (1995).

وإذا قررنا أن هناك نتيجة ذات دلالة، فإننا نحتاج للرجوع للبيانات الأصلية (على سبيل المثال بفحص رسم للمتوسطات أو رسم الانتشار للعلاقة) لتعريف اتجاه أي فرق أو علاقة.

والشكل 3 – 2 يقدم ملخصاً للمراحل في أداء الاختبار الإحصائي عندما يكون لدينا افتراضاً بديلاً غير محدد (كما هو معتاد) مع بيان النتيجتين ويتوقف ذلك على ما إذا كان المؤشر الإحصائي الاختباري له دلالة أم لا.

وفي أحوال معينة لدينا المبررات في وجود افتراض بديل محدد. على سبيل المثال قد نرغب في فحص تأثير المواد المثبطة للشهية (وهي الكيماويات التي تودي إلى تخفيض الشهية للأكل في الحيوانات اللافقرية) من حيث تأثيرها على الآفات في المحصول.

ويمكننا أن نضيف الكيماويات إلى مجموعة واحدة من النباتات والماء إلى مجموعة أخرى. وعندما نقوم بمقارنة أحجام الآفات الفردية في العينتين من النباتات فإننا نتوقع أنه إذا كانت هناك أي فروق فإن الآفات المعرضة لمثبطات الشهية ستكون أصغر من تلك الموجودة في نباتات عينة التحكم.

وعندئذٍ سنختبر الافتراض الصفري بأن الآفات في نباتات التجربة لم تكن أصغر كثيراً من تلك الموجودة في نباتات عينة التحكم (مع الافتراض البديل بأنها أصغر بدرجة كبيرة).

ولاختبار هذا الافتراض المعدد سنقوم بحساب المؤشر الإحصائي الاختباري كما هو معتاد مع تنصيف قيمة الاحتمال الناتج.

والسبب في التنصيف هو احتلال أننا قد نكون مهتمين فقط بالوضع حيث تكون الآفات في نباتات التجربة أصغر من الآفات في نباتات التحكم (وليس في 50% من الحالات حيث التفاوتات العشوائية في العينة ستؤدي إلى أن تكون الآفات أكبر في نباتات التجربة).

ولكن نظراً لأنه من النادر أن نتوقع اتجاه النتائج مقدماً، فهناك برامج كمبيوتر إحصائية كثيرة تقدم فقط قيمة الاحتمالات P للاختبارات غير المحددة.

ويجب أن نلاحظ أنه يجب أن تكون هناك أسس سليمة نظرية أو تجريبية عند الرغبة في استخدام افتراض محدد: ولاحظ أن تنصيف الاحتمالات فيما بعد فقط كوسيلة للحصول على نتيجة جوهرية إنما هو تضليل للنتائج.

ويمكن أيضاً تحديد افتراض بديل محدد لغرض إعداد أسئلة العلاقة. فعلى سبيل المثال فإننا قد نفترض بأنه مع زيادة كمية مسبطات الشهية المستخدمة بمقدار ما تكون الحيوانات التي تعيش في النباتات أصغر، أي أن لدينا افتراض بديل محدد يدل على وجود علاقة سالبة.

[KSAGRelatedArticles] [ASPDRelatedArticles]

381 7 دقائق