السبت، 8 أبريل، 2017

خطوات إجراء تحليل الانحدار المتعدد



خطوات إجراء تحليل الانحدار المتعدد
تحليل الانحدار
تحليل الانحدار المتعدد باستخدام spss
تحليل الانحدار
ما هو الانحدار
تحليل الانحدار المتعدد
الانحدار الخطي البسيط
تحليل الانحدار الخطي البسيط باستخدام spss
الانحدار والارتباط في الاحصاء
تعريف الانحدار

مقدمه:تحليل الانحدار أو تحليل الارتباط أو تحليل الانكفاء من أكثر الأدوات المستعملة في التحليل القياسي لذا سوف نبدأ بتحديد الخطوط العريضة لتحليل الانحدار.  بينما في الفصول التاليه سوف تتعامل مع  التعديلات وتوسيع للأساليب الاساسيه اللازمة في تحليل البيانات الاقتصاد يه.
نبدأ بالسؤال الأساسي: ما هو تحليل الانحدار؟ تحليل الانحدار يهتم بوصف وتقييم العلاقة بين متغير  ( عادة يسمى المتغير التابع) وواحد آو اكثر لمتغيرات أخرى ( تسمى عادة المتغيرات المفسرة آو المتغيرات المستقلة) ويرمز للمتغير المفسر بـ  y والمتغيرات المفسرة بـ  x3  x2  x1….xn . 
التفسير الحرفي لكلمة انحدار تعني" ارتداد أو انكفاء أو رجوع" في الحقيقة تحليل الانحدار لا يربطه بهذا المعنى أي رابط.
كلمة انحدار استخدمت من قبل سير فرنسيس جالتون Sir Francis Galton (1982-1911)  من إنجلترا. والذي كان يدرس العلاقة بين طول الأبناء وطول الآباء والذي لاحظ جالتون أن الطول يميل إلى المعدل مع أن الآباء الطوال يكون أبنائهم طوال والآباء القصار يميل أبنائهم لان يكونوا قصار أي أن  هناك ميل عند ألأبناء للمعدل أي أن هناك انحدار نحو المعدل.في دراسات أخرى مشابهه تحصل على نفس النتيجة التي تحصل عليها جالتون.
بالعودة إلى الرموز التي استخدمناها حيث رمزنا للمتغير المفسَر بـ y والمتغيرات المفسرة بـ  x3  x2  x1….xn . إذا كانت   k=1 ، أي إن هناك متغير مستقل  واحد فقط من المتغيرات المفسرة. أي ان هناك x واحدة فقط.  يعرف هذا بالانحدار البسيط. وهو ما سوف يتم مناقشته في هذا الفصل. إذا كانت k>2 ، آي أن هناك اكثر من x واحد  و متغير مستقل. نحصل على ما يعرف بالانحدار المتعدد. والذي سوف نناقشه في الفصل القادم. 
مثال 1 : الانحدار البســيط.
              y  = المبيعات
              x  = النفقات الاعلانيه.
حيث يتم تحديد العلاقة بين المبيعات والنفقات الأعلانيه.
مثال 2: الانحدار المتعدد.
       Y  = استهلاك ألا سره.
      X1  = دخل ألا سره.
        X2= الأصول المالية للاسره
      X3  = حجم ألا سره

تحديد العلاقة بين نفقات استهلاك ألا سره  من جهة والدخل، والأصول المالية و حجم ألا سره من جهة اخرى.
هناك عدة أسباب لدراسة هذه العلاقات. يمكن استخدام ذلك في :
1-      تحليل تأثير بعض السياسات التي تتضمن تغير قيم  لفرد معين. في المثال الأول نستطيع أن نحلل تأثير النفقات الاعلانيه على كمية المبيعات.
2-      التنبؤ بقيم Y من قيم  X.
3-      اختبار مدى معنوية العلاقة بين آي من  X  و Y.
 في مناقشتنا نفرق بين المتغيرY  و  المتغيرات X. افترضنا أن المتغيرات X هي المتغير الذي يؤثر على المتغير Y .  هناك العديد من المصطلحات التي نطلقها على Y , X  توجد في الجدول 1.3 .
جدول 3: مصطلحات المتغير التابع و المتغير المستقل.
X      Y
1-مًتنبأ          متَنبأ  به
2-مفسر        مفَسر
3-مستقل       تابع
4-مسبب       متأثر
5-خارجي     داخلي
6-المتغير المتحكم     المتغير الهدف
كل من هذه المصطلحات يستخدم حسب الغرض من تحليل الانحدار فالمصطلح الأول يستخدم في عملية التنبؤ بينما المصطلحات الأخرى تستخدم في مناقشة الانحدار. اما   المصطلح خارجي وداخلي تستخدم فقط  من قبل القياسيين.  بينما المصطلح الأخير يستخدم في التجارب الخاصة بدراسة تأثير مسببات معينه على متغير مستهدف.
2.2 تحديد العلاقة:
العلاقة بينY  وX  تمثل بالتالي:
                            1.2                
حيث ترمز لـ Y كدالة لـX.  نستطيع إن نقسم العلاقة إلى نوعين:-
1-      علاقة رياضية محدده.Deterministic
2-      علاقة إحصائيه لا تعطي قيمه فريدة لـ Y  من قيمه محدده من X. ولكن يمكن أن توصف بصيغة احتماليه.

سوف نتحدث هنا في تحليل الانحدار عن العلاقة من النوع الأول على سبيل المثال العلاقة بين المبيعات و النفقات الاعلانيه يمكن أن توصف بما يلي:-
        2.2                
هذه علاقة محدده deterministic . حيث يمكن تحديد المبيعات لكل مستوى من النفقات الاعلانيه، كما يلي:
      في الجانب الأخر، نفترض أن العلاقة بين المبيعات والنفقات الاعلانيه كما يلي:-
                                   3.2     
  قيمة  u تتراوح بين قيم معينه حسب جدول للاحتمالات يعطي لكل قيمه احتمال معين على سبيل المثال:-  الاحتمالات  أن قيمة   u اكبر من 500  يساوي ½  واقل من 500 يساوي ½ . لذا لا نستطيع تحديد قيمة Y  من  قيمة X   نقول إن هناك العديد من قيم Y المقابلة لقيمة واحدة من X .  إذا كان  هناك توزيع طبيعي لقيم   Y  المقابلة لقيمه واحدة من   X  . كما هو في الشكل                                                                                      
الخط الذي يمثل العلاقة هو العلاقة التحد يديه . ولكن القيم الحقيقية لـ Y  تمثل  الخط العمودي  وتسمى العلاقة بين X ,Y  علاقة عشوائية. 
بالرجوع إلى المعادلة التي تمثل الدالة.نستطيع القول إن الدالة تمثل الخط       بينما العلاقة العشوائية هي      
حيث تمثل u الخطأ العشوائي.     وتمثل     معاملات الانحدار.   
لماذا يتم إضافة الخطأ العشوائي للمعادلة؟
1-      يمثل عنصر العشوائية في استجابة الإنسان مثل اختلاف النفقات الاستهلاكية من فرد لأخر مع العلم انهم قد يتساووا في الدخل.
2-      تأثير عوامل أخرى محذوفة مثل العادات حجم ألا سره وغيرها من العوامل.
3-      خطأ في قياس المتغير التابع.

الهدف هو الحصول على تقدير للمعاملات الغير معروفه     للقيام بعملية التقدير يجب افتراض بعض الافتراضات الخاصة بالخطأ العشوائي:
1-      الوسط الصفري.E(u)=0
-أن وســـــط التوزيع الاحتمالي الخاص بالمتغير العشوائي = الصفر. إي أن قيم  u تتمركز حول الصفر.
2-      تساوي التباين   .  
   تباين التوزيع الاحتمالي الخاص بالعناصر العشوائية     uيساوي قيمه ثابتة وموجبة.
3-      استقلالية الخطأ العشوائي:  أي أن التغاير، درجة الارتباط بين قيم العشوائي = الصفر
         أي انها مستثقله عن بعضها.        
4-      التوزيع الطبيعي للخطأ العشوائي.    
تمثل هذه الافتراضات بالتالي   
3.2  تقدير نموذج الانحدار باستخدام طريقة المربعات الصغرى:-
هناك عدة طرق لتقدير معاملات معادلة الانحدار أهمها 1)طريقة المربعات الصغرى. 2) طريقة الإمكانية العظمى.
في المرحلة الأولى نفترض وجود  الفروض الاساسيه لمعالجة النموذج الخطي. وفي المراحل اللاحقة نتعرض للحالات التي تكون فيها هذه الفروض غير صحيحه.
نموذج الانحدار بالافتراضات الأساسية كما يلي:

هي المعادلة الأساسية التي تصور العلاقة بين التابع والمستقل حيث i تعتمد على العينة التي يبلغ حجمها n . بالأضافه إلى المعادلة ألأساسيه نقول أن النموذج يحتوي افتراضات عن المتغير العشوائي.
تقدير النموذج يتم بغرض الحصول على مقدرات معالم نموذج الانحدار البســــيط.  نموذج الانحدار البسيط يتضمن ثلاث معالم هي, , معلمة القاطع، ,  معلمة الميل، 2  معلمة التباين.  المراد هو استخدام إحصائيات المتغيرات التابعة والمتغيرات المستقلة حسب الطرق الإحصائيه الملائمة للحصول على مقدرات لهذه المعالم.
طريقة المربعات الصغرى
تعتمد طريقة المربعات الصغرى العادية على الحصول على مقدرات,   الانحدار حيث تمثل معلمة القاطع، ,  معلمة الميل. بحيث يتم تصغير مجموع مربعات البوا قي إلى آدني قيمه لها. بحيث يجري تعريف مكون يطلق علية مجموع المربعات البوا قي وبعد ذلك يشرع في الحصول على  ,، ,  بحيث يتم تصغير هذا المكون إلى أدنى قيمه له.
طريقة المربعات الصغرى تعطينا مقدرات الانحدار   ,، , ولكن لا تعطينا مقدرة التباين وهذا يعتبر من نقاط ضعف طريقة المربعات الصغرى.
المعيار الخاص في المربعات الصغرى العادية:  النموذج المقدر هو كما يلي

u هي البوا قي والتي تساوي من النموذج    نموذج الانحدار ممكن أن يمر من خلال انتشـــــار البيانات الخاصة بـX ,Y ، الخط المقدر هنا هو الذي  يعطي   Y  المقدرة                  
إذا أخذنا إحداثيات القيم Y,X  إحداثيات النقطة الأولى تنقسم إلى قسمين، قسم من المحور الأفقي في النموذج المقدر، هذا عبارة عن       الجزء الثاني  عبارة عن قيمة البوا قي.  فالمشاهدة Y هي حصيلة جمع  +u    أي أن أي مشاهده مكونه من جانبين، جانب الخط المقدر والبواقي. البواقي بحكم أنها مقدرة العنصر العشوائي يمكن أن تكون موجبة وممكن أن تكون سالبه وكذلك من الناحية النظرية يمكن أن تساوي الصفر.

للحصول على مقدرات المربعات الصغرى العادية يجب أن نحصل أولا على البواقي:              
مجموع مربعات البواقي =u2
        
يتم التوصل إلى الخط الذي تكون فيه مجموع مربعات البواقي  اصغر ما يمكن [ اختيار الخط الذي يدني مجموع مربعات البواقي إلى أصغر ما يمكن].  باستخدام الرياضيات فأن شرط الدرجة الأولى يتطلب أجراء التفاضل بالنسبة للمجاهيل     نستخدم التفاضل الجزئي وبعد ذلك نساوي المعادلات التي تم أل تحصل عليها بالصفر ثم نطبق المعادلات الآنية للحصول على قيم المقدرات.

                        نساوي بالصفر      
بادخال المجموع Σ  وحيث ان α عدد ثابت فأن Σ α = α n   ثم بقسمة المعادلة  على n نحصل على مايلي:

معادلة 2.7 تسمى المعادلات الطبيعية ونستطيع استخراج قيم    منها
بالتعويض نحصل على           

من الممكن الحصول على المقدرات باستخدام الانحرافات كما يلي:

4.2   خصائص مقدرات المربعات الصغرى العادية (م ص ع)
الخصائص الإحصائي التي تتميز فيها مقدرات المربعات الصغرى العادية.
تتميز المقدرات        بثلاث خواص أساسيه:
1)      الخطية        2)عدم التحيز         3) الكفاءة
1)  الخطية:  تعتبر داله خطية للعنصر العشوائي التابع Y . أهمية هذه الخاصة أنها
      تعطينا درجه من البساطة في أجراء الحسابات حيث انه لحساب   نستعمل
     المتغير التابع في صوره خطيه فقط هذه لتبسيط الحسابات.  
2)      عدم التحيز:  مقدرات (م ص ع)   مقدرة غير متحيزة للمعلمة . عدم التحيز يتطلب بأن القيمه المتوقعة لـ   و  التي هي قيمة المعلومة الحقيقية بمعنى آخر متوســـط   = . إذا جمعت عينات كثيرة وفي كل عينه نحسب    يتم أخذ المتوسط. ذلك المتوســط نظريا يجب أن يتساوى مع المعلمة الحقيقية.    مقدرات (م ص ع)   مقدرة غير متحيزة للمعلمة    حيث أن  .   أي أن توقع        يجب أن يســاوي المعلم ه الحقيقية  بمعنى آخر متوســـط قيم    أو في المتوسط   تساوي القيمة الحقيقية للمعلمه .

هذه الأوضاع كلها نظريه بحتة في الواقع لا يكون  عندنا عدد من العينات، بكون في الواقع عينه واحدة فقط وتعطينا قيمه واحدة  ،  قيمه واحدة        يعتمد عليها في التحليل، من الناحية النظرية نقول أن هذه المقدرات يتوقع أنها تســـاوي القيمة الحقيقية من الناحية الأخرى  القيمة الحقيقة لا نعرفها وبالتالي هذه الخصائص خصائص نظريه بحتة.
على الرسم البياني،  رسم دالة احتمال     ، خاصية عدم التحيز تقول أن توزيع احتمال    يأخذ هذا الشكل يتمركز حول القيمة الحقيقية، لـ يعني أن القيمة المتوقعة لـ  تســاوي     وأن قيمة تساوي المعلمة الحقيقية ونفس التحليل ينطبق على .




                                                                   
تباين المقدرات:    تباين اي قيمة تتوزع حول وسط معين هو معدل تشتت هذه القيم عن الوسط
ويكون القانون الخاص بتباين  مقدرة القاطع:

بإجراء بعض الخطوات يمكن إن نبرهن إن تباين   يساوي
            
من المعادلة نلاحظ إن تباين   تعتمد على تباين u فإذا زاد تباين  u  توقع زيادة تباين    لان  هناك علاقة طرديه بين تباين    وتباين   u     . وتوجد صيغه أخرى لتباين    على انه يساوي :

 اما  القانون الخاص بتباين      :

يمكن إن نثبت إن التباين الخاص بـ  يساوي            
 ومن المعادلة نلاحظ إن تباين      يعتمد طرديا على    تباين   u     وعكسيا على مجموع مربعات انحرافات  المتغير المستقل، فكلما   ازدادت درجة انتشـــار المتغير المســــتقل ( آي بيانات X مختلفة كثيرا عن بعضها) نتوقع إن يزيد المكون الموجود في المقام وبالتالي ينخفض تباين    مما يشعر إلى دقة التقديرات.
3-      آدني تباين:
    الخاصية الثالثة لمقدرات م ص ع  تمتلك آدني تباين  هذه الخاصية لها أهمية  بالغة  في الاقتصاد القياسي لان آدني تباين يعتبر مؤشــر إلى دقة القياســات،  آدني تباين يعتبر مؤشــر إلى دقة القياسات، آدني تباين يعني أعلى دقة من ناحية  القياســات.
هناك علاقة عكسية بين التباين ودقة القياسات كلما زاد التباين كلما انخفضت دقة القياسات وكلما قل ارتفعت دقة القياسات. لأن مقدرات م ص ع            تلك المقدرات تمتلك آدني تباين نعني مقارنه بمقدرات أخرى تقاس بطريقه مختلفة عن م ص ع فان مقدرات م ص ع تمتلك آدني تباين إي تتحلى بأعلى دقه. نفترض إن هناك مقدرات لـ           تحصل عليها بطريقه مختلفة ونفترض إن المقدرات الأخرى   ا ذا افترضنا أن تلك المقدرتين  خطيه وغير متحيزة سيكون الاختلاف  في خاصية أن  مقدرات م ص ع           تمتلك أعلى دقة.


>   
في الحالة (1) استخدمت  مقدرات م ص ع . في الحالة الثانية (2) مقدرات أخرى غير م ص ع , في الشكل التوزيع الاحتمالي لقيمة المقدرات    . في (1) يتبين ان التباين قليل، درجة الانتشار لـ   اقل وبالتالي تتمركز قيم   حول القيمة الحقيقية وفي الشكل (2) قد نحصل على قيم حول   لكنها بعيده  عن المعلمة الحقيقية.
من الشكل  إن احتمال الحصول على        أقرب للمعلمة   الحقيقية من   وبالتالي درجة احتمال العثور على    أقرب  مما سواها،   هذا ما يقصد بخاصية أدنى تباين.
من النتائج التي توصلنا أليها عن مقدرات م ص ع  يمكن أن نقول أن شـــــــــكل التوزيع الاحتمالي الخاص بالمقدرات     

من المعادلتين يتبين انه :
1- كلما زاد التباين 2 كلما زاد تباين المقدرات      .
2-كلما كان انتشار قيم X اكبر كلما قل تباين    
مثال (2):
البيانات التالية عن السعر وكميه البرتقال الذي تم بيعه في أحد أسواق الخضار  في مدة 12 يوم إذا رمزنا للسعر بـ X والكميه بـY

باستخدام المعادلة التالية:





تقدير التباين2  : حيث أن 2    مجهولة والتي نحتاجها لنتمكن من   حساب  تباين       .  نستخدم   مقدرة 2   = مجموع مربعات البواقي/درجة الحرية
7.2         
بحساب مربعات مجموع البواقي من قيمة 
إذا مقدرة   التباين                
ومنها يمكن الحصول على مقدرات تباين       .

          
للحصول على مقدرة التباين نستخدم المعادلة التالية      .

وبعد ذلك نستطيع أن نتحصل على تباين المقدرات

وللحصول على الانحراف المعياري نتحصل على الجذر التربيعي للتباين:



5.2    فترات الثقة  Confidence Interval
المقدرات  مؤشــرات مهمه يمكن إن تستخدم لاستخلاص نتائج  عن المجتمع التي استخلصت منه هذه المقدرات.لبناء فترات الثقة وأجراء اختبارات الفروض نستخدم التوزيع الطبيعي:
فترة الثقة:
   
إذا كانت تتوزع طبيعيا   فستكون قيمة Z  كما يلي:

إذا أخذت أي عشوائي يتوزع توزيع طبيعي وطرحت منه الوسط الخاص به وقسمته على الانحراف المعياري فان القيمة المتحصل عليها هي قيمة Z التي تتوزع طبيعيا بوســط صفر وتباين وانحراف معياري يساوي الواحد الصحيح. توزيع Z   كما هو معروف يمكن استخلاص الاحتمالات الخاصة به من جدول التوزيع الطبيعي.  وبذلك يمكن تحديد الاحتمال الخاص بحدوث أي قيمه من  Z بالنظر إلي الجدول حيث يشير العمود الرأسي إلي اليسار إلي قيم Z   والقيم بداخل الجدول تشير إلي الاحتمالات.
لاختبار الفرضية فإننا نختبر هل    تساوي    أم تختلف عنها وإذا كانت تختلف هل هذا الاختلاف قليل يمكن التعايش معه أي إن الاختلاف راجع إلي العشوائية فقط وليس بالاختلاف الكبير الذي يشير إلي انه لا ينتمي إلي نفس المجتمع. ونرفض الفرضية انهما متساويان.
في القانون أعلاه هناك معلمه غير متوفرة وهي معلمة تباين المجتمع فاستخدمنا مقدرة التباين. مقدرة التباين لا تمتلك التوزيع الطبيعي ولكن تتبع توزيع t  والذي يتحدد تبعا لدرجات الحرية المستعملة أي في هذه الحالة إلي n-2 . توزيع t هو توزيع احتمالي مشابه للتوزيع الطبيعي وتوزيع t يتمركز حول الصفر ويأخذ شكل مماثل لتوزيع  Z ،ويستخدم توزيعZ فقط عندما تكون حجم العينه كبيره n>30
توزيع t
الاختبار الإحصائي يكون

يمكن حساب فترات الثقة كما يلي:

قيمة  t تمثل القيمة  اختبار t عند درجة حرية n-2 عند مساحة /2   من توزيع t  من المثال (3)

إن شرح فترة الثقة يعني إن إن الاحتمال أن فترة الثقة المحددة تعطي المعلمة الحقيقية يساوي   
( (1- . ويستخدم عادة   مستوى الثقة 95%    أو 99%.