الرياضيات والهندسة

كيفية حساب المؤشر الإحصائي F لتحليل التباين ANOVA

2012 استخدام الإحصاء لفهم البيئة

فيليب ويذر وبني أ.كوك

KFAS

كيفية حساب المؤشر الإحصائي ANOVA تحليل التباين F الرياضيات والهندسة الهندسة

يتضمن تحليل التباين أولاً إيجاد التغير الإجمالي في البيانات (مع قياسه باسم إجماليات المربعات: وهو موجود أولاً في الخطوة 3 في المربع 2 – 3).

وقسمة هذا التغير إلى تغير مفسر (أي التغير الذي يتم تفسيره على أساس تصنيف أو معالجة – وفي هذه الحالة بحسب نوع العزل – والذي يتم استخدامه أيضاً بين التغير أو (SSbetween) والتغير غير المفسر (التغير الكامن داخل العينات ويسمى أيضاً التغير الداخلي أو (SSwithin). وهكذا:

والصيغ الحسابية لحساب إجماليات المربعات مبينة في المربع 7 – 1 وحسابات مثال الطاقة مبينة في المثال العملي 7 – 1 ب

 

يتم الآن استخدام مقادير قيم المربعات لحساب المؤشر الإحصائي الاختباري (F).

وهذه الحسابات يمكن تنظيمها في جدول تحليل التباين ANOVA كما في الجدول 7 – 2 (ويسمى هذا أيضاً الناتج المعتاد من برامج الإحصاء).

 

ويتم إدخال الحرية في العمود 1، ودرجات الحرية الإجمالية هي إجمالي عدد البيانات في التحليل الكامل ناقص 1 والدرجات الحرية البينية هي عدد العينات ناقص 1 ودرجات الحرية الداخلية هي إجمالي df ناقص df البينة، وإجماليات المربعات التي حسبناها في المثال العملي 7 – 1 ب يتم إدخالها في العمود 2.

ولاحظ أن درجات الحرية البينية والداخلية تضاف إلى بعضها لتمثل درجات الحرية الإجمالية وإجماليات المربعات البينية والداخلية تضاف إلى بعضها لتمثل إجماليات المربعات الكلمة، وفي العمود 3، متوسط المربعات (بالاختصار MS) فهي ببساطة إجماليات المربعات مقسومة على درجات الحرية المقابلة لها لتوحيد التغير، وفي العمود 4 المؤشر الإحصائي الاختباري F ويتم حسابه باسم MSbetween مقسومة على MSwithin.

وهذا هو التغير البيني الموحد (المفسر) مقسوماً على التغير الداخلي القياسي (غير المفسر). ثم يتم بعد ذلك مقارنة المؤشر الإحصائي الاختباري بقيم الجدول F (ويوجد اقتباس منه مبين في الجدول 7 – 3) باستخدام قيمتين لدرجات الحرية (القيمة الدينية والقيمة الداخلية) للحصول على احتمالات عدم وجود أي فرق له دلالة بين المتوسطات (العمود 5).

 

وهناك مصطلحات بديلة متعددة لمكونات جدول تحليل التباين ANOVA تستخدم في مراجع الإحصاء وفي برامج الكمبيوتر الإحصائية. والتغير البيني يسمى في بعض الأحيان المعالجة أو تغير العوامل أو تغير المجموعة.

والتغير الداخلي يسمى في بعض الأحيان الخطأ (وذلك من الكلمة اللاتينية والتي تحمل معنى الخطأ أو التشتت) أو الباقي (أي التغير الباقي)، وجدول تحليل التباين ANOVA في مثال الطاقة الخاص بنا، ويشمل الحسابات مبين في المثال العملي 7 – 1.

وبمجرد حصولنا على القيمة F، فإننا نحتاج لأن نقرر ما إذا كانت لها دلالة، وتذكر أن القيمة F هي نسبة التغير المفسر للتغير غير المفسر، والافتراض الصفري هو أن التغير المفسر (التغير البيني) ليس أكبر بصورة جوهرية لها دلالة من التغير غير المفسر (التغير الداخلي).

والافتراض البديل هو أن التغير المفسر أكبر من التغير غير المفسر (أي أن القيمة F أكبر من 1 كما هو الحال في بيانات فاتورة الطاقة – انظر المثال العملي 7 – 1 ج حيث القيمة F تساوي 5.839).

 

ولمعرفة ما إذا كان التباين المفسر أكبر من التباين غير المفسر ، فإننا نقارن القيمة المحسوبة F في جدول القيم F باستخدام درجات الحرية للقيمة البينية (df = 2) والقيمة الداخلية (df = 21)، كما هو مبين في المساحة المظللة في الجدول 7 – 3.

وفي الحالات حيث يكون التغير المفسر أقل من التغير غير المفسر (أي أن القيمة F أقل من 1) يمكننا أن نقبل تلقائياً أن الافتراض الصفري صحيح (أي أنه لا يوجد فرق له دلالة بين المتوسطات) و(P>0.05.

وبالنظر إلى الجدول 7 – 3 لدرجات الحرية 2 و 21 ، فإن قيمتنا F المحسوبة (5.839) تتجاوز القيمة في الجدول لكل من (P = 0.05) F= 3.47 و (P = 0.01) F = 5.78. ولذلك فإننا نرفض الافتراض الصفري ونقبل الافتراض البديل بأن التغير بين تصنيف العزل أكبر من التغير داخل تصنيفات العزل. والفرق الجوهري الذي له دلالة بين المتوسطات يمكن التعبير عنه في العبارة:

تصنيف العزل (سواء كان عزل سميك أو زجاج مزدوج أو عزل بسيط) له تأثير جوهري له دلالة إحصائية عالية في فواتير الطاقة في المنازل (F2.21 = 5.839, P < 0.01).

 

ولا تنسي وضع القيمتين الخاصتين بدرجات الحرية: ولاحظ الطريقة المختصرة في التعبير عن درجات الحرية كأرقام ملحقة بالرمز F مع درجات الحرية البينية أولاً، ويتبعها درجات الحرية الداخلية.

وإذا كنت تفضل يمكن وضع جدول مختصر لتحليل التباين ANOVA (مثل الجدول المبين في الجدول 7 – 4) في الجزء الخاص بالنتائج في التقرير ولاحظ أننا لا نحتاج لوضع إجماليات القيم المربعة أو درجات الحرية الإجمالية وذلك لأن القارئ لديه معلومات كافية لحسابها.

لقد أثبتنا تحليل التباين ANOVA عند مقارنة ثلاثة متوسطات. وهذا الاختبار يمكن استخدامه لمقارنة أي عدد من المتوسطات ويشمل ذلك وجود متوسطين فقط: أي الوضع حيث قمنا باستخدام الاختبار t في الفصل 4.

 

وإذا قمنا بحساب F بدلاً من t فإننا نحصل على نفس الاحتمالات بدقة، وذلك لأن اختبارات t و F مترابطة رياضياً (وفي الواقع لمقارنات العينتين F = t2).

بعد الحصول على قيمة F ذات دلالة في تحليل التباين ANOVA لأكثر من متوسطين يمكننا الاستنتاج بأنه يوجد قرق جوهري بين المتوسطين، ولكن لا يمكننا أن نقول أين توجد هذه الفروق، والمتوسط الأكبر يجب أن يكون أكبر بصورة جوهرية ذات دلالة من الأصغر.

ومن خلال وجود ثلاث عينات أو أكثر يمكننا مشاهدة المتوسطات والحصول على الانطباع: في مثالنا فإن المساكن ذات العزل الأقل لها فواتير أكثر تكلفة (197 جنيه – انظر المثال العملي 7 – 1 أ) وتلك المزودة بالعزل السميك هي الأقل في النفقات (164.40 جنيه) وتلك المزوده بالزجاج المزدوج في المتوسط في مكان ما (171.50 جنيه).

 

ولكن لا يمكننا أن نقول أن جميع المتوسطات تختلف اختلافاً جوهرياً بين أحدها والآخر، وفي الواقع توجد احتمالات عديدة:

الحد الأدنى أكبر من الزجاج المزدوج أكبر من العزل السميك.

الحد الأدنى أكبر من (الزجاج المزدوج والعزل السميك).

(الحد الأدنى والزجاج المزدوج) أكبر من العزل السميك.

 

وحيث العينات في الأقواس لا تختلف اختلافاً جوهرياً له دلالة إحصائية عن أحدها الآخر.

ولمعرفة أين توجد الفروق فإننا نحتاج لاختبار آخر يعرف باسم اختبار المقارنة المتعددة. حيث توجد مقاسات عينات متساوية (كما في هذا المثال)، واختبار تاكي، مناسب.

وإذا كانت مقاسات العينات تختلف فإننا نحتاج لاستخدام اختبار تاكي كرامر. ولاحظ أن بعض برامج الكمبيوتر لا تحسب اختبارات تاكي او اختبارات كرامر.