الرياضيات والهندسة

“تحليل التباين البارامتري أحادي الاتجاه” لإيجاد الفروق بين أكثر من عينتين

2012 استخدام الإحصاء لفهم البيئة

فيليب ويذر وبني أ.كوك

KFAS

تحليل التباين البارامتري أحادي الاتجاه لإيجاد الفروق بين أكثر من عينتين الرياضيات والهندسة الهندسة

لغرض فحص الفروق المحتملة بين أكثر من عينتين فإننا نحتاج لامتداد الاختبارات المذكورة في الفصل 4.

وتم تصنيف هذه الاختبارات ليس على أساس احتياجاتها للبيانات الموزعة بشكل اعتيادي ولكن أيضا فيما إذا كنا نبحث في أكثر من متغير متسق في المرة الواحدة. وهذا الفصل يغطي:

– التحليل أحادي الاتجاه للتباين للبيانات الموزعة توزيعاً طبيعياً.

– تحليل كروسكال واليس الأحادي الاتجاه للتباين باستخدام الرتب للبيانات المقاسة على المقياس الرتبي على الأقل.

– التحليل الثنائي الاتجاهات للتباين للبيانات الموزعة توزيعاً طبيعياً.

– تحليل الثنائي الاتجاه للتباين باستخدام رتب الديانات المقاسة على الأقل على المقياس الرتبي.

– دراسة نماذج التحليل البديلة للتباين للتصميمات التجريبية والمسح الأكثر تعقيداً.

 

وفي الفصل 4 فلقد قمنا بمقارنة المتوسطات (أو الوسيط) لعينتين باستخدام الاختبار t (للبيانات الموزعة توزيعاً طبيعياً) أو اختبار مان ويتني U (للبيانات الرتبية أو غير الطبيعية).

ولكن العديد من التجارب أو الاختبارات تتضمن مقارنة ثلاث عينات أو أكثر. على سبيل المثال عند مسح فواتير الكهرباء في المنازل، فقد نضع المنازل في ثلاث تصنيفات ويتوقف ذلك على نوع العزل الذي تستخدمه المنازل – عزل قوي أو زجاج مزدوج أو عزل بسيط.

ولغرض فحص تأثير نوع العزل على فاتورة التدفئة في المنازل، فقد يكون من المنطقي أداء ثلاث اختبارات t (لمقارنة العزل القوي مع الزجاج المزدوج والعزل القوي مع العزل البسيط والزجاج المزدوج مع العزل البسيط).

وبالتأكيد فإن هذا ممكن. ولكن إذا كانت لدينا عينات أكثر فإن الحساب سيصبح طويلاً جداً ومستهلكاً للوقت (فعلى سبيل المثال عند وجود 7 عينات فإننا نحتاج لعدد 21 منفصل).

 

ويوجد اعتراض أكثر أهمية على أداء اختبارات t المتعددة وهو أنه عندما نقوم بحساب اختبارات عديدة فإننا نزيد من الفرص في الحصول على نتيجة ذات دلالة بالصدفة فقط.

وتذكر أن القيمة الحرجة للاحتمالات 0.05. وهذه القيمة هي التي يتم عندها رفض الافتراض الصفري وذلك لأنه توجد احتمالات 5% فقط بأن هذه النتيجة قد حدثت بالصدفة.

ويمكننا أن نجد حلاً لذلك ونقول أنه في 5% من الحالات فإن الافتراض الصفري يتم رفضه بينما يكون في الحقيقة صحيحاً (وهذا خطأ من النوع 1: انظر الفصل 3)

 

والآن قد أصبح من الواضح أنه إذا قمنا بـ 20 اختبار فهناك اختبار واحد على الأقل قد يبدو أن له دلالة إحصائية حتى ولو لم تكن هناك فروق حقيقية بين المتوسطات.

ولغرض حل هذه المشكلة فإننا نحتاج لاختبار يقوم بالمقارنة في نفس الوقت لثلاثة أو أكثر من المتوسطات (أو الوسيط) وباحتمال إجمالي 5% لحدوث خطأ من النوع 1. وبالنسبة للبيانات الموزعة توزيعاً طبيعياً فإننا نستخدم تحليل التباين (ANOVA) البارامتري.

ويوجد أنواع عديدة من اختبارات تحليل التباين ANOVA وهي تعتمد على التصميم التجريبي أو تصميم المسح: وأبسط نوع مستخدم لمقارنة متوسطين أو أكثر ويسمى تحليل التباين الأحادي الاتجاه.

 

وفي تحليل ANOVA الأحادي الاتجاه يوجد متغير مستقل واحد (وهو نوع العزل في مثال تدفئة المنازل الخاص بنا) ومتغير تابع واحد (فاتورة الطاقة).

وافتراض تحليل التباين أحادي الاتجاه ANOVA هو أن جميع البيانات يتم جمعها عشوائياً وكل نقطة بيانات مستقلة عن جميع النقط الأخرى، وهذا الافتراض لن يكون صحيحاً في مثال فاتورة الطاقة الخاص بنا إذا كان نصف المنازل قد تم معاينتها من لندن ونصف المنازل من مانشستر، وذلك لأنه من المحتمل أن تكون هناك اختلافات بين المنطقتين (على سبيل المثال في المناخ) مما يؤثر على فواتير الطاقة.

وفي هذه الحالة فإن المسح سيكون له متغيران مستقلان: نوع العزل والمدينة. والطريقة المناسبة لتحليل التجارب أو المسح باستخدام متغيرين مستقلين باتباع تحليل التباين الثنائي الاتجاه والذي سيتم دراسته لاحقاً في هذا الفصل.

 

إذا كانت البيانات لا يمكن استخدامها في تحليل التباين البارامتري سواء لكن ذلك بسبب أنها فد تم قياسها على مقياس رتبي أو أنها ليست موزعة توزيعاً طبيعياً ولا يمكن تحويلها، فإن النسخة المعادلة غير البارامترية لتحليل التباين أحادي الاتجاه ANOVA هو تحليل التباين أحادي الاتجاه باستخدام الرتب من كروسكال واليس وهو الذى يجب أن يتم تطبيقه في هذه الحالة.

وإذا كان هناك أكثر من متغير واحد مستقل، يتم استخدام التحليل المكافئ الثنائي الاتجاه غير البارامتري.

 

وهذا الفصل يغطى أولاً التحليلات أحادية الاتجاه للتباين (الاختبارات البارامترية ثم الاختبارات غير البارامترية) ثم التحليلات ثنائية الاتجاه (ومرة أخرى كل من الاختبارات البارامترية وغير البارامترية). ويتبع ذلك امتدادات اختبارات الفصل 4 ذات الأزواج المتوافقة.

وأخيراً فإن التحليلات المناسبة للتصميمات التجريبية وتصميمات اختبارات المسح الأكثر تعقيداً تم تقديمها بشكل مختصر.

 

تحليل التباين البارامتري أحادي الاتجاه

كما هو الحال في العديد من الاختبارات التي يغطيها هذا الكتاب فإن تحليل التباين ANOVA يقوم بمقارنة مصدرين رئيسين للاختلاف في بيانات التغير الذي يتم تفسيره بتصميم التجربة أو المسح (تغير مفسر) والتغير الناتج بسبب التغير الكامن في العينات (تغير غير مفسر).

وفي مثال فاتورة الطاقة فإن الهدف هو دراسة ما إذا كان التغير في فاتورة الطاقة يمكن تفسيره بحسب نوع العزل، وبالطبع فإن التغير في فاتورة الطاقة يمكن أن يكون ناتجاً بسبب عوامل أخرى عديدة.

على سبيل المثال نوع نظام التدفئة وعدد ساعات تدفئه المنزل، وعلى الرغم من أن المسح يقوم بالتوحيد القياسي للعديد من العوامل بقدر الإمكان (على سبيل المثال اختيار منازل متماثلة تقريباً من حيث الحجم وتشغلها نفس الأعداد من الأشخاص).

 

ولكن ما زال هناك تغير كامن في فواتير الطاقة، ولكن إذا كان نوع العزل يمثل عاملاً هاماً في تأثير التغير في فواتير الطاقة، فإننا نتوقع تغيراً مفسراً (بحسب نوع العزل) ويكون أكبر من التغير غير المفسر (التغير الكامن).

وتحليل التباين أحادي الاتجاه ANOVA يقوم بالحساب الفعال للمؤشر الإحصائي الاختباري (F) باعتباره نسبة التغير المفسر للتغير غير المفسر (المؤشر الإحصائي F يسمى في بعض الأحيان بنسبة التباين).

ويوجد افتراض في تحليل التباين ANOVA وهو أن تباينات العينات ليست مختلفة، ولذلك فإن الخطوة الأولى في التحليل هي الفحص بخصوص ذلك، وإذا كانت التباينات مختلفة اختلافاً جوهرياً.

 

فإن تحويل بيانات باستخدام أحد الأساليب في الفصل 3 يمكن أن يؤدي إلى مساواة التباينات وذلك لأن المتوسط في بعض التوزيعات غير الطبيعية يعتمد على التباين ويمكن أن يؤدي التحويل في نفس الوقت إلى إزالة هذا الاعتماد والتوزيع الطبيعي للبيانات: انظر الفصل 3 وإذا حدث بعد التحويل وكانت التباينات ما زالت مختلفة.

ففي هذه الحالة فإنننا سنحتاج لاختبار غير بارامتري (تحليل كروسكال واليس الأحادي الاتجاه للتباين باستخدام الرتب والتي نغطيه في الجزء التالي)

اظهر المزيد

مقالات ذات صلة

زر الذهاب إلى الأعلى
إغلاق
إغلاق