الرياضيات والهندسة

الارتباط بين التوزيعات التكرارية

2012 استخدام الإحصاء لفهم البيئة

فيليب ويذر وبني أ.كوك

KFAS

التوزيعات التكرارية الرياضيات والهندسة الهندسة

يغطي هذا الفصل اختبارات تحليل التوزيعات التكرارية للبيانات المقاسة على مقياس اسمي:

– اختبارات الارتباط (أو الاستقلال) بين متغيرين تم قياسهما على مقاييس اسميه.

– اختبارات جودة الملاءمة بين توزيع مقاس وتوزيع نظري.

– دراسة الاختبارات البديلة للارتباط وجودة الملاءمة والحالات حيث يوجد أكثر من متغيرين.

 

لقد قمنا حتى الآن بدراسة تحليل البيانات التي يتم قياسها على المقياس الترتيبي على الأقل (على سبيل المثال ترتيب حالة أوراق الشجر) أو مقياس المدى/ النسبة (على سبيل المثال نشاط الاسترانشيوم 90 بوحدات بكريل لكل لتر).

ولقد استخدمنا فقط المتغيرات الاسمية (أي الديانات الموضوعة في تصنيفات) كطريقة لفصل العينات (على سبيل المثال الذكور من الإناث والمناطق الحضرية من الضواحي الشبه حضرية والنظيف من الملوث)، وإننا نحتاج الآن لطريقة لتحليل بيانات المقياس الاسمي في حد ذاتها.

وافترض أننا قد قمنا بمسح الأشجار في مواقع ملوثة ومواقع نظيفة (الفصل 4) ولم نتمكن من تحديد درجة رتبة الحالة للشجرة وأمكننا فقط أن نقول ما إذا كانت الشجرة بحالة رديئة أم لا.

وبالنسبة لكل شجرة حصلنا بعد ذلك على المقياس الاسمي (جيد أو سيء) بدلاً من الدرجة من 1 إلى 6 (حيث الحالة الجيدة 6).

 

وهذه هي القطعة الثانية من البيانات الاسمية وذلك لأننا نسجل أيضاً نوع الموقع: نظيف أو ملوث، فكيف يمكننا بعد ذلك تحليل هذه البيانات؟

يمكننا مقارنة عدد الأشجار في الحالة الجيدة وعدد الأشجار في الحالة السيئة على نوعين من المواقع باستخدام التحليل التكراري، ويوجد نوعان رئيسان للتحليل التكراري:

اختبارات الارتباط واختبارات جودة الملاءمة. ويعتمد اختيار الاختبار على ما إذا كنا نقوم بفحص الارتباط لتوزيع تكراري مقاس 1 مع آخر (على سبيل المثال ارتباط حالة الشجر بنوع الموقع) أو ما إذا كنا نقوم باختبار توزيع تكراري مقاس مقابل توزيع نظري معروف.

ومصطلح "التوزيع النظري" يبدو جيداً، ولكن يمكن أن يحدث هدا النظام فقد بتوقع التكرارات المتساوية للأحداث (على سبيل المثال نسبة الجنسين. أي أن الأعداد متساوية للذكور والإناث).

 

الارتباط بين التوزيعات التكرارية

عند مسح اتفاقيات الدخول العامة بين السلطات المحلية وملاك الأراضي تم تسجيل متغيرين سواء ما إذا كانت كل سلطة لديها أو ليس لديها عقود للدخول (بالإضافة إلى الدخول العام من خلال شبكه حق المرور العامة)،

وأي نوع من السلطة المحلية كانت هذه السلطة (أي ما إذا كانت سلطة في المنطقة أو على مستوى المدينة أو من ضواحي لندن).

ويوجد اقتباس من صفحة البيانات مبين في الجدول 6 – 1 حيث كل صف يمثل سلطة وقد تم مسح 287 سلطة جميعاً معاً (أي أنه كان هناك 287 صف).

 

في هذا المثال توزيعان تكراريان (انظر الشكل 6 – 1): توزيع وجود أو غياب عقود الدخول وتوزيع أنواع السلطة.

نفترض أننا نرغب في معرفة ما إذا كان هناك ارتباط بين هذين التوزيعين، أي ما إذا كانت أنواع السلطات المختلفة تختلف في نزعتها نحو وجود عقود دخول إضافية مع الملاك.

 

وهذا يعني أننا نقوم بالتحقق فيما إذا كانت التوزيعات مستقلة عن بعضها البعض (أي ما إذا كان وجود عقد الدخول مستقل عن نوع السلطة)؛ ولهذا السبب فإن هذا الاختبار يعرف أيضاً باسم اختبار الاستقلالية، ويمكن تلخيص سجلات البيانات (من الجدول 6 – 1) في جدول الارتباطات المبين في المثال العملي 6 – 1 أ.

وهنا نجد الأعداد التكرارية لجميع المجموعات المحتملة (وجود وغياب عقود الدخول لكل نوع من السلطة المحلية) وهي مبينة في جدول مماثل للجدول المستخدم في الجدولة المتقاطعة في الفصل 2 (الجدول 2 – 7).

جدول الارتباط في المثال العملي 6 – 1 أ يسمي جدول طارئ 3 × 2 (لأنه يوجد ثلاثة صفوف وعمودين).

ولاحظ أن التوزيع الواحد يشمل الأعمدة والتوزيع الآخر يشمل الصفوف (ولا يهم أي طريق يتم التحرك فيه).

وحيث إننا نسأل ما إذا كان هناك ارتباط بين التوزيعين، فإن الافتراض الصفري هو أنه لا يوجد ارتباط (أي أن التوزيعات مستقلة عن أحدها والآخر).

 

ويمكننا حساب ما هي القيم المتوقعة إذا كان نوع السلطة ووجود أو غياب عقود الدخول موزعة بشكل مستقل عن أحدها والآخر، أو بعبارة أخرى فإننا نحسب التكرارات المتوقعة إذا كان توزيع عقود الدخول مماثلاً لكل نوع من السلطة.

والخطوة الأولى هي العمل في إجماليات الصفوف والأعمدة (المبينة في المثال العملي 6 – 1 أ) ثم يتم العمل في التكرارات المتوقعة من خلال صيغة حسابية بسيطة تستخدم إجماليات الصف والعمود (انظر المربع 6 -1).

ولاحظ أنه عند تحليل الارتباطات بين التوزيعات التكرارية فإن معظم برامج الكمبيوتر ستقبل البيانات سواء في شكل زوج من الأعمدة وكل منها يحتوي على الكود لتوزيع فردي كما في الجدول 6 – 1 أ في شكل جدول ارتباطات كما في المثال العملي  6 – 1 أ (للتفاصيل بخصوص مدخلات البيانات للتحليل بالكمبيوتر.

انظر الجداول ب – 4 و ب – 5، الملحق ب). ولاحظ أيضاً أن بعض البرامج تحتاج لكود رقمي بدلاً من الحروف.

 

المثال العملي 6 – 1 ب يبين حساب كل قيمة متوقعة. ولاحظ أنه عند فحص الحسابات فإن القيم المتوقعة يجب أن يكون لها نفس إجماليات الصف والعمود باعتبارها قيم المشاهدات على أن يوضع في الاعتبار أي أخطاء تتعلق بالتقريب.

ويمكننا أن نرى أنه توجد اختلافات بين القيم المتوقعة وقيم المشاهدة في المثال العلمي 6 – 1 ب، على سبيل المثال توجد مناطق أقل مع العقود أقل مما نتوقع إذا كان نوع السلطة ووجود العقود مستقلة، والمزيد من المناطق في المدن مع العقود أكثر مما هو متوقع.

ولتعريف ما إذا كانت هذه الفروق لها دلالة فإننا نحتاج لحساب معيار إحصائي اختباري لنجد ما إذا كان هذا الفرق بين التكرارات التي يتم مشاهدتها والتكرارات المتوقعة أكبر مما هو متوقع بطريق الصدفة.

وهذا المعيار الإحصائي x2 (ويجب ألا يلتبس مع المعيار بالأحرف الصغيرة X2 والمستخدم في الفصول السابقة)، يتم حسابه أولاً لكل خلية في جدول الارتباطات ثم يتم تجميعها للحصول على القيمة الإجمالية X2 (انظر المربع 6 – 2).

 

وتوزيع هذا المعيار الإحصائي الاختباري يقوم بالتقريب لتوزيع إحصائي مبين باسم كاي تربيع (وينطق كاي تربيع، حيث كلمة كاي تشبه كلمة ماي ويحصل على الرمز X2 بدلاً من X2، ولكن إذا تحدثنا بصورة أكثر دقة فإن هذا غير صحيح لأن X2 هو فقط مجرد تقريب X2 (انظر سوكال ورولف 1995).

ولأغراض بيانات عقود الدخول فإن القيمة الإجمالية X2 هي 23.168 (انظر المثال العملي 6 – 1 ج).

ولمعرفة ما إذ كانت هناك دلالة إحصائية فإننا نقارن إجمالي القيمة X2 بجدول قيم كاي تربيع (انظر المساحة المظللة في الجدول 6 – 2) وعدد الدرجات المناسبة للحرية حيث أن لدنيا ثلاثة صفوف وعمودين، df = (3 – 1) (2 – 1) (انظر المربع 6 – 2).

وعند درجتين للحرية فإن قيمتنا المحسوبة (23.168) أعلى من القيم في جدول كاي تربيع لأي من P = 0.05 (5.99) أو P = 0.01 (9.21)، مما يفيد بأن لدينا ارتباط عالي الدلالة (P < 0.01) بين نوع السلطة ووجود أو غياب عقود الدخول.

 

بعد أن أثبتنا أنه يوجد ارتباط جوهري بين نوع السلطة ووجود عقود دخول إضافية فإننا نعود الآن إلى البيانات لتفسير هذه النتائج. ويمكن أن يتم دلك بالنظر إلى مكونات الخلايا الفردية X2 (انظر المثال العملي 6 – 1 ج).

والمشارك الأكبر في قيمة إجمالي X2 ينبع من سلطات المدن (أي تلك التي تغطي المراكز والمدن) حيث بها أكبر من العدد المتوقع لعقود الدخول الإضافية. وتفسير الارتباطات ذات الدلالة قد يعتمد على بعض المعرفة بالمواد موضوع الدراسة.

وفي هذا المثال فإن المراكز والمدن لها إمكانيات دخول أقل عن طريق شبكة حق المرور الموجودة بالمقارنة مع معظم المناطق الريفية، مع وجود أعداد أكبر من الناس وهكذا يوجد طلب أكبر للاحتياج للدخول الإضافي.

 

يمكن أداء تحليل جدول الارتباطات على الجداول بأي مقاس من 2 × 2 فصاعد على الرغم من أن جداول الارتباطات 2 × 2 تعتبر أنها تمثل حالة خاصة: انظر أدناه).

ولكن مع نمو الجدول بدرجة أكبر، فإن تفسير أي ارتباطات ذات دلالة يصبح أكثر صعوبة.

اظهر المزيد

مقالات ذات صلة

زر الذهاب إلى الأعلى
إغلاق
إغلاق