بعض المقاييس الأخرى لوصف البيانات

بعض المقاييس الأخرى لوصف البيانات 
    مقاييس الالتواءSkewness
    التفرطح  Kurtosis
    معامل الاختلاف Variation Coefficient
    تقدير مدى الانحراف المعياري
    الدرجة المعيارية Standardized degree
Skewness مقاييس الالتواء
    مما سبق: قد توجد قيم شاذة  كبيرة (صغيرة) تجذب اليها الوسط الحسابي: في هذه الحال فإن منحني التوزيع التكراري يكون له ذنب ناحية اليمين (اليسار) ويوصف التوزيع بأنه موجب (سالب) الالتواء.
    يمكن قياس الالتواء عن طريق:
    طريقة "بيرسون Pearson"
    طريقة "المئين  Percentile"
 (1) طريقة "بيرسون 
Pearson"

    مبنية علي العلاقة بين الوسط والوسيط والمنوال، عندما يكون التوزيع قريب من التماثل وليس شديد الالتواء

    ومن ثم يحسب ”معامل الالتواء“ (α -الفا ) بالمعادلة التالية:
    
    ويمكن تحديد علامة (α ) من العلاقة بين الوسط والوسيط كما يلي:
    
    إذا كان (الوسط الحسابي = الوسيط ): α=0 ، ويدل ذلك على أن منحنى التوزيع التكراري متماثل.
    إذا كان (الوسط الحسابي > الوسيط ) α>0 ، ويدل ذلك على أن منحنى التوزيع التكراري ملتوي جهة اليمين .
    إذا كان (الوسط الحسابي < الوسيط ) α<0 ، ويدل ذلك على أن منحنى التوزيع التكراري ملتوي جهة اليسار.




وشكل التوزيعα

(2) طريقة "المئين“ لقياس الالتواء

    المئين ينتج من ترتيب البيانات تصاعديا و تقسيمها إلى 100   جزء متساو يفصل بينها قيم تسمى المئين ( vi)
    مثلا: المئين 15 ويرمز له بالرمز ( v15) هو القيمة التي يقل عنها 15% من القيم.
    كيف نحسب مثلا المئين ( vp)؟؟
    يتبع نفس الفكرة المستخدمة في حساب الربيع .
حساب المئين

    نرتب القيم تصاعديا ونحدد رتبة المئين من:

    إذا كانت الرتبة ( R ) عدد صحيح فإن: Vp=x(R)
    
    إذا كانت الرتبة  عدد كسري فإن قيمة المئين  تحسب من:
المئين و شكل الالتواء

    لتحديد شكل الالتواء نفحص موقع المئين ( vp)، والمئين v(100-p)، من المئين (v50 )؛ مثلا يمكن استخدام المئين 20 ، والمئين 80 ومن ثم نتوقع:
    يمكن الحكم على شكل التوزيع باستخدام معامل الالتواء المئيني، من المعادلة التالية:

    لاحظ في حالة المئين 25 ( Q1)، المئين 75 ( Q3) نحصل على معامل الالتواء الربيعي ، وهو :  
    
    
مثال

    أدناه درجات 8  طلاب في الاختبار النهائي في مقرر 122 إحص : احسب:
        معامل الالتواء بطريقة " بيرسون "
        معامل الالتواء الربيعي .

ومن ثم حدد شكل التوزيع

    لحساب معامل الالتواء بطريقة "بيرسون" نحتاج للوسط, الوسيط, والانحراف المعياري
    حساب الوسيط (انظر الجدول)
    موقع الوسيط  :  (n+1)/2=(8+1)/2=4.5

    الوسيط =76
    معامل الالتواء "بيرسون”:

    حساب معامل الالتواء : نحتاج لـ:Q1,Q2,Q3
    موقع Q1 :  (n+1)/4=(8+1)(1/4)=2.25

    بالمثل Q2=76,Q3 =83.75 
    إذا معامل الالتواء الربيعي هو :
التفرطح??  
Kurtosis 

    قد يكون المنحنى التكراري منبسط ، أو مدبب كما بالشكل
مفرطح
مدبب
قياس التفرطح

    يمكن قياس التفرطح  باستخدام عدد من الطرق، ومنها طريقة العزوم ، حيث يحسب معامل التفرطح (K) بتطبيق المعادلة التالية :

    معامل التفرطح في التوزيع الطبيعي يساوي 3 وعليه:
    
    
        إذا كان k=3    كان منحنى التوزيع معتدلا .
        إذا كان k>3    كان منحنى التوزيع مدببا .
        إذا كان k<3    كان منحنى التوزيع منبسطا (مفرطحا) .
مثال
    من المثال السابق:
    كذلك:
    

    إذا معامل التفرطح هو:

    k<3   :إذا منحنى التوزيع منبسط (مفرطح) 
    
معامل الاختلاف 
Coefficient of Variation

    أحد مقاييس المستخدمة لقياس درجة التشتت
    يحسب قيمة التشتت كنسبة مئوية من قيمة مقياس النزعة المركزية
    مفيد في مقارنة درجة تشتت بيانات مجموعتين أو أكثر مختلفة لها وحدات قياس مختلفة
    ويحسب معامل الاختلاف (النسبي) بتطبيق المعادلة التالية:

 (vcq) معامل الاختلاف الربيعي
    يحسب هذا المعامل بتطبيق المعادلة التالية:
مثال

    مجموعتين من الأغنام، تم استخدام عليقة معينة لتسمين المجموعة الأولى، بينما تم استخدام عليقة أخرى لتسمين المجموعة الثانية وبعد فترة تم جمع بيانات عن أوزان المجموعتين بالكيلوجرام ، وتم الحصول على المقاييس أدناه:المطلوب مقارنة درجة تشتت المجموعتين .
    
تابع

    معامل الاختلاف النسبي للمجموعة الأولى:

    معامل الاختلاف النسبي للمجموعة الثانية:
         درجة تشتت أوزان المجموعة الثانية أقل قليلا من درجة تشتت أوزان المجموعة الأولى  
    
الدرجة المعيارية 
Standardized degree(z-score) 

    تقيس الدرجة المعيارية لقيمة معينة عدد وحدات الانحراف المعياري التي تزيد أو تقل بها هذه القيمة عن الوسط الحسابي

    الدرجة المعيارية للقيمة ( xi) ويرمز لها بالرمز(z ) تحسب باستخدام المعادلة التالية: 
مثال

    في المثال السابق اختير أحد الأغنام من المجموعة الأولى بعد تطبيق البرنامج ، ووجد أن وزنه 178 كيلوجرام، وبالمثل أحد الأغنام من المجموعة الثانية، ووجد أن وزنه 180 كيلوجرام ، قارن بين هذين القيمتين من حيث أهمية كل منها في المجموعة التي تنتمي إليها:
    للمقارنة بين الوحدتين يتم حساب الدرجة المعيارية لوزن كل منها، بتطبيق المعادلة:
        الدرجة المعيارية لوزن الوحدة المسحوبة من المجموعة الأولى (178 Kg.) هي :

        الدرجة المعيارية لوزن الوحدة المسحوبة من المجموعة الثانية (180 Kg.) هي 


    من النتائج نجد أن الوزن 178 كيلوجرام يزيد عن الوسط الحسابي بـ 0.22 انحراف معياري  ، بينما نجد أن الوزن 180 كيلوجرام يقل عن الوسط الحسابي بـ 0.75 انحراف معياري . ومن ثم في هذه الحالة الوزن الأول أهميته النسبية أعلى من الوزن الثاني.


القاعدة العملية-التوزيع الطبيعي 

    للعينة (  x1,x2,x3,…,xn) ، ذات الوسط الحسابي (     و الانحراف المعياري (s ) ، يكون منحنى توزيع هذه العينة متماثل، إذا تحقق الآتي:
        68%  تقريبا من قيم هذه المشاهدات تتراوح بين      :
        95%  تقريبا من قيم هذه المشاهدات تتراوح بين:
        99%  تقريبا من قيم هذه المشاهدات تتراوح بين:
التوزيع الطبيعي

التوزيع الطبيعي-تفاصيل أكثر

قاعدة تشيبشيف النظرية
Chebyshev’s Theorem

    وفكرة هذه القاعدة: في أى توزيع من التوزيعات النظرية ”تقريبا“ كل القيم تكون ”قريبة“ من الوسط الحسابي.
    وطبقا لهذه القاعدة، فإنه على الأقل 75% من قيم
المشاهدات تقع في المدى            ، على الأقل 89% من

قيم المشاهدات تقع في المدى.

 شكل بوكس 
Box Plot 

    صندوق مستطيل، بداية حافته اليسرى هو الربيع الأول Q1  ونهاية حافته اليمنى هو الربيع الثالث Q3
    يقسم الربيع الثاني (الوسيط) Med  المستطيل إلى جزأين
    ويمكن استخدام شكل بوكس في وصف البيانات من حيث: التماثل, تركز البيانات, وجود قيم شاذة (الشكل أدناه).




شكل بوكس والالتواء
    من موقع الوسيط بالنسبة للربيع الأول والثالث:


الارتباط والانحدار الخطي البسيط (6)
Correlation & Simple Regression

    حتي الآن: بعض المقاييس الوصفية: (النزعة المركزية، والتشتت، ومقاييس الالتواء والتفرطح، وغيرها) لمتغير واحد
    ننتقل إلي: دراسة وتحليل العلاقة بين متغيرين:
        تحليل الارتباط-- دراسة العلاقة بين متغيرين
        والانحدار الخطي البسيط – أثر أحد المتغيرين على الآخر

    أمثلة لمتغيرين تعتقد وجود علاقة (سلبا أو إيجابا) بينهما؟؟؟   
أشكال العلاقة بين متغيرين

    تأخذ العلاقةبين المتغيرين (  x,y) أشكالا مختلفة منها:

    هل ثمة أشكال أخري؟؟؟؟؟
    
    
الارتباط الخطى البسيط 
Simple Linear Correlation 

    يستخدم لتحديد نوع وقوة العلاقة بين متغيرين (x,y)
    نفترض أن العلاقة بين المتغيرين تأخذ الشكل الخطي
    يمكن حسابه للبيانات الكمية، والبيانات الوصفية المقاسة بمعيار ترتيبي.
    ويرمز له في حالة المجتمع بالرمز    (رو)، وفي حالة العينة بالرمز     ، 
نوع العلاقة 

    يمكن تصنيف نوع العلاقة (حسب أشارة ”r ”) كالآتي:
 ( r = 0 ) 

لا توجد علاقة

موجبة  (r > 0 )   

طردية 

سالبة  (r < 0 )  

عكسية 

اشارة ”  r
نوع العلاقة
 قوة العلاقة 
    قيمة معامل الارتباط تقع في المدى( -1 ≤ r ≤ 1 )
    قوة العلاقة تعتمد علي قرب/بعد ” r ” عن ±1
    يمكن تصنيف قوة العلاقة حسب الجدول:
بيانيا “r
هل الارتباط يعني السببية؟

    اذا كان لدينا متغيرين: (س) و (ص) وكان الارتباط بينهما وثيقا (حوالي +0.99): هل هذا يعني:
    (س) يسبب (ص) ؟؟
    (ص) يسبب (س)؟؟
    أم:    ؟؟؟؟؟؟
أمثلة
    دراسة: ترك الأنوارمضيئة      قصر النظر (myopia)
        دراسة أخري: لا, الجينات (الآباء)
    لوحظ ارتفاع نسبة ( CO2 ) في الجو  و  )معدلات الجريمة(؟
    في الصيف: (عدد المسافرين) و (مبيعات الآيسكريم)
    لكي نتأكد من السببية: (س)     (ص) يشترط:
        يجب حدوث (س) قبل (ص)
        يجب الا تحدث (ص) عندما لا تحدث (س)
        يجب حدوث (ص) متي ما حدثت (س)
معامل الارتباط الخطى البسيط " لبيرسون" Pearson 

    يمكن قياس الارتباط بين متغيرين كميين (x,y) بطريقة "بيرسون" Pearson
    ولحساب معامل الارتباط في العينة ، نستخدم القانون:
تابع

    حيث :
                          هو التغاير ” Covariannce” بين (x,y).
                          هو الانحراف المعياري لقيم (x)
                          هو الانحراف المعياري لقيم (y)
مثال

    فيما يلي مساحة الأعلاف الخضراء بالألف هكتار، وإجمالي إنتاج اللحوم بالألف طن، خلال الفترة من 1995 حتى عام 2002 . والمطلوب: حساب معامل الارتباط بين المساحة والكمية، والتعليق.
    حساب الوسط الحسابي لكل من المساحة، والكمية:





    نحسب المجاميع كما في الجدول:
    نطبيق المعادلة (6-2) ونحسب ” r ” كما يلي:

    ما تعليقك؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟
    
r” صيغة أخري ”مبسطة“ لحساب


    بتطبيق الصيغة البسيطة:
معامل ارتباط الرتب (اسبيرمان)) 
Spearman 

    مقياس للعلاقة بين متغيرين وصفيين ترتيبين (مثال؟؟؟)
    يعبر عنه بالمعادلة التالية :

    حيث أن ” d ” هي الفرق بين رتب مستويات المتغير الأول  x ”، ورتب مستويات المتغير الثاني  y ”، أي أن : 
    
مثـــال 

    أدناه تقديرات 10 طلاب في مادتي الإحصاء، والاقتصاد: والمطلوب:
    احسب معامل الارتباط بين تقديرات الطلبة في المقررين.
    وما هو مدلوله ؟

    أولا نرتب التقديرات كالآتي:

    ثم نحسب مجموع ”  d2” ونطبق القانون.
    
    مدلول معامل الارتباط :
    بما أن   r=0.73”:يدل ذلك على وجود ارتباط طردي قوي بين تقديرات الطالب في مادة الإحصاء ، ومادة الاقتصاد .
ملحوظة

    يمكن استخدام صيغة معامل ارتباط "اسبيرمان" في حساب الارتباط بين متغيرين كميين، حيث يتم استخدام رتب القيم التي يأخذها المتغير،
الانحدار الخطى البسيط 
Simple Regression 

    يستخدم في دراسة وتحليل أثر متغير كمي على متغير كمي آخر.
    المتغير المؤثـّر“ x ” يسمي (المستقل)
    المتغير المؤثـّر عليه ”  y” يسمي (التابع),
    أمثلة:
        أثر الدخل ” x” على الإنفاق الاستهلاكي ” y
        دراسة أثر سوق الأسهم ” x ”علي العقارات بالمملكة ” y
        أخري؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟
نموذج الانحدار الخطي
The Linear Regression Model 

    يمكن عرض نموذج الانحدار الخطي في شكل معادلة خطية من الدرجة الأولى.
    المعادلة تعبر عن المتغير التابع كدالة في المتغير المستقل:

    الصورة العامة لهذه المعادلة هي:“ y” دالة في ” x 
    
    


 معاني رموز نموذج الانحدار الخطي

نموذج الانحدار الخطي بيانيا

النموذج المفترض/النموذج المقدّر-مالفرق؟؟

    النموذج المفترض: نموذج نظري نفترض أنه يحكم العلاقة بين المتغيرين (x,y) وهو الوارد في المعادلة (5-6):

    النموذج المقدر: نموذج فعلي يقدره الباحث بجمع (عينة) بيانات عن المتغيرين (x,y) ومن ثم تقدير/حساب معاملات الانحدار (Β1, Β0) (الثابت والميل) ويعبر عن هذا النموذج بالمعادلة: 
 
    بعد تقدير النموذج يمكن حساب الخطأ العشوائي من:
    لاحظ أن المعادلة أعلاه لكل العينة, بالنسبة للمفردة ( n ):
    
تقدير نموذج الانحدار الخطي البسيط 

    تقدير النموذج يعني حساب قيم معاملات الانحدار

(Β1, Β0) في المعادلة (6-5)

    يمكن استخدام طريقة ”أقل المربعات“ –(Least Squares Method ).
    هذا التقدير يجعل مجموع مربعات الأخطاء العشوائية أقل ما يمكن أي:


0 قوانين تقدير المعاملات (

    طبقا لقاعدة ”أقل المربعات“ تقدر المعاملات من القوانين التالية:




مثـال 

    فيما يلي بيانات عن كمية البروتين اليومي بالجرام التي يتناولها العجل الرضيع، ومقدار الزيادة في وزن العجل بالكجم،  وذلك لعينة من العجول الرضيعة حجمها 10.
    والمطلوب :
        ارسم نقط الانتشار، وما هو توقعاتك لشكل العلاقة ؟
        قدر معادلة انحدار الوزن على كمية البروتين.
        فسر معادلة الانحدار.
        ما هو مقدار الزيادة في الوزن عند إعطاء العجل 50 جرام من البروتين ؟ وما هو مقدار الخطأ العشوائي؟
        ارسم معادلة الانحدار على نقط الانتشار في المطلوب (1)

    رسم نقط الانتشار :

    ما شكل العلاقة  بين  x و y   من هذا الانتشار؟؟؟؟
    
    تقدير معادلة الانحدار: بتطبيق المعادلتين في (6-6):


    يمكن حساب       كما يلي:

    ويمكن حساب      كما يلي:
    
    بالتالي المعادلة أو النموذج المقدر هو:



    تفسير المعادلة:

    الثابت                : يدل على أنه في حالة عدم استخدام البروتين قي التغذية ( x=0 )، فإن الوزن يزيد 9.44 كجم.

    معامل الانحدار          : يدل على أنه كلما زادت كمية البروتين جرام واحد، حدث زيادة في وزن العجل بمقدار 0.143 كجم) 143   جرام(.
    مقدار الزيادة في الوزن عند (  x=50) هو:
ومقدار الخطأ العشوائي:

    رسم معادلة الانحدار على نقط الانتشار:

تذكر أنه يمكن رسم أي خط مستقيم إذا علم أي نقطتين على ذلك الخط.

تمرين

    تقدير معادلة إنحدار باستعمال (Excel)
    ارسم انتشار هذه البيانات
    ما مقدار معاملي الانتشار
    فسر معني معاملي الانتشار في هذه المسألة؟
    اكتب معادلة الانحدار