الرياضيات والهندسة

الطرق المستخدمة في تحليل العلاقات بين المتغيرات

2012 استخدام الإحصاء لفهم البيئة

فيليب ويذر وبني أ.كوك

KFAS

تحليل العلاقات بين المتغيرات الرياضيات والهندسة الهندسة

عند قياس أكثر من متغير واحد متصل أو مرتب برتبة لكل وحدة عينة فردية فقد نرغب في التحديد الكمي للعلاقة بين المتغيرات: عندما تزداد كمية متغير واحد، هل يؤدي ذلك إلى زيادة أو نقص المتغير الآخر؟ هذا الفصل يغطي:

– معامل ارتباط بيرسون لعزم حاصل الضرب للبيانات الموزعة توزيعاً طبيعياً.

– معامل ارتباط سبيرمان للرتبة للبيانات المقاسة على الأقل على مقياس ترتيب.

– الأساليب الفنية لتحليل الانحدار (الانحدار الخطي البسيط).

– دراسة الأحوال حيث يوجد أكثر من متغيرين يتم دراستهما في نفس الوقت.

 

في الفصل 4، نقوم بالتركيز على الحالة حيث قمنا بالحصول على عينتين ونرغب في معرفة ما إذا كان هناك فرق بينهما.

وهناك أسلوب نافع آخر في الإحصاء يتم استخدامه عندما تكون لدينا عينة واحدة، ولكن لكل فرد قمنا بقياسه يوجد متغيران ونحن مهتمون بمعرفة ما إذا كانت هناك علاقة بين المتغيرين.

على سبيل المثال يمكننا أن نقوم بمعاينة عدة مواقع لنواتج مناجم الفحم ونحصل على قياس للرقم الهيدروجيني لكل منها بالنسبة للتربة وعدد أنواع النباتات الموجودة في الموقع مع الحصول على العلاقة بين المتغيرين والمبينة في الشكل 1-5، وفي هذه الحالة توجد علاقة إيجابية بين عدد الأنواع النباتية والرقم الهيدروجيني مع عدد الأنواع التي تزداد مع زيادة الرقم الهيدروجيني.

 

يمكن أن تكون العلاقة بين متغيرين سالبة. مثلاً المسح الذي يتم بين الأشخاص الذين قاموا بإعادة تدوير النفايات الخاصة بهم قد يؤدي لاكتشاف علاقة سالبة بين المسافة بينهم وبين مركز إعادة التدوير وتكرار ذهابهم إلى هناك (الشكل 2-5). وتوجد طريقتان رئيسيتان لتحليل العلاقات: الترابط والانحدار.

في الترابط، فإن درجة تغيير المتغيرين معاً يتم قياسها.

ولذلك فإن الترابط يمثل مقياساً لقوة العلاقة بين المتغيرين. ويتم استخدام الانحدار لحساب خط أفضل ملاءمةً عبر البيانات لغرض تحديد أو تقدير اعتماد أحد المتغيرات على المتغير الآخر (وهكذا يتم افتراض علاقة السبب والتأثير) و/ إمكانية إجراء التوقعات لأحد المتغيرين من معرفتنا بالمتغير الآخر. ولتصوير الفرق، يتم الرجوع لبيانات نفايات المناجم.

وهنا فإن تحليل الترابط مناسب وذلك لأنه على الرغم من أننا مهتمون بالرقم الهيدروجيني للتربة وعدد الأنواع وكيف أنها تتغير معاً.

 

ولكن لا يمكننا الافتراض بالضرورة أن الرقم الهيدروجيني ليس أحد المتغيرات الأخرى أو أكثر من المتغيرات المرتبطة والتي لا يتم قياسها (على سبيل المثال خصوبة التربة)- هي التي تؤدي إلى العلاقة التي يتم مشاهدتها مع عدد الأنواع.

لبيان علاقة السبب والتأثير بين الرقم الهيدروجيني للتربة وعدد الأنواع يمكننا أداء تجربة مع التحكم حيث نأخذ عدة أنواع من التربة تختلف فقط في الرقم الهيدروجيني ثم يتم غرس البذور لأنواع نباتات مختلفة عديدة.

ويمكننا عندئذٍ استخدام تحليل الانحدار لتحديد ما إذا كان الرقم الهيدروجيني المتغير يؤثر على عدد الأنواع المنبتة وقد نحصل على علاقة مثل تلك المبينة في الشكل 3-5.

 

في حالة التراجع (ترابط غير محتمل) فهناك مبرر لملاءمة خط مع بياناتنا. والخط المستخدم هو الخط الذي يحقق أفضل ملائمة لنقاط البيانات.

ولكنه غير ملاءمة تماماً عند النظر بالعين: وبدلاً من ذلك فإننا نستخدم الأسلوب الحسابي والذي سنشرحه لاحقاً في هذا الفصل. وعند رسم الأشكال البيانية للبيانات الانحدارية، فإن المتغير الذي يتحكم فيه الباحث (في هذا المثال هو الرقم الهيدروجيني للتربة) يتم وضعه على طول الخط الأفقي (ويعرف أيضاً باسم المحور x، وبحيث أن الرقم الهيدروجيني يعرف باسم المتغير x) وعلى طول المحور الرئيسي (المحور y) يوجد المتغير الذي يتم قياسه (وهو هنا عدد الأنواع المنبتة ويعرف أيضاً باسم المتغير y)،

والمتغير المقاس (على سبيل المثال عدد الأنواع) هو المتغير التابع وذلك لأن قيمته تعتمد على قيمة المتغير المستقل والذي يتم التحكم فيه (على سبيل المثال الرقم الهيدروجيني للتربة).

عند تصوير الترابط فإن نفس المنطق يتم استخدامه لتحديد أي من المتغيرات يجب وضعه على المحور x والمحور y.

 

وفي العلاقة بين تكرار زيارات مركز إعادة التدوير والمسافة للذهاب إلى المركز، فإن تكرار الزيارات يمكن أن يعتبر أنه يعتمد على المسافة التي يحتاج الشخص أن ينتقلها للذهاب إلى المركز. ولذلك يتم رسمها على المحور الرأسي y.

وسيكون من غير المنطقي دراسة أن المسافة إلى المركز تعتمد على تكرار الزيارات، ولذلك فإن المسافة إلى المركز هي المتغير المستقل ويتم رسمها على المحور x.

ولاحظ أنه على الرغم من أننا قد حددنا المتغيرات على أنها غير مستقلة ومستقلة فإن هذا لأغراض رسم الشكل البياني فقط، وفي الترابط فإننا لا نفترض بالضرورة وجود علاقة سببية بين الاثنين.

 

وفي بعض الحالات لا يمكننا تعيين زوج من المتغيرات كمستقل وتابع، على سبيل المثال إذا احتجنا لقياس خصائص نوعين من التربة لعدة عينات من التربة (على سبيل المثال التوصيلية والرقم الهيدروجيني) لن يكون هناك أي سبب لتحديد أي من المتغيرين كمتغير مستقل. وفي هذه الحالة فإن تخصيص المحور يكون اختيارياً.

والمرحلة الأولى في أداء الترابط أو الانحدار هي رسم الشكل التخطيطي للانتشار مع النظر إلى شكل النقاط. وهذا ضروري لأن الأسلوب المختار يعتمد على ما إذا كانت هناك علاقة خطية بين المتغيرين. ورسم الانتشار يبين لنا أي علاقة غير خطية في البيانات.

على سبيل المثال إذا تم قياس تركيز النحاس في التربة على مسافات من مسبك صهر نحاس، فقد نجد علاقة منحنية بين المتغيرين (الشكل 4-5).

 

وفي حالة مثل الشكل 4-5 يمكننا أداء تحويل البيانات (وذلك من خلال الحصول على لوغريتم المتغير y فإن هذا يؤدي إلى استقامة هذه العلاقة)، أو استخدام الأساليب المناسبة للبيانات غير الخطية- انظر النصوص مثل زار (1999) أو سوكال ورولف (1995).

وحيثما ظهرت البيانات في شكل علاقة منحنية يمكن استخدام مجموعة متنوعة من التحويلات على أي من المحورين x أو y أو كليهما لاستقامة الخط (بحسب المجموعة التي تقدم العلاقة الخطية الأفضل) يتبع ذلك التحليل على البيانات المحولة.

اظهر المزيد

مقالات ذات صلة

زر الذهاب إلى الأعلى
إغلاق
إغلاق