إحصاء تطبيقي

إحصاء تطبيقي
    مالفرق؟؟؟
    Statistics”  “statistics”  “statistic
    الإحصاء التطبيقي/النظري
تعريف علم الإحصاء

    هل هو مجموعة من الأرقام والبيانات؟: أعداد السيارات بالرياض/ تعداد السكان/عدد المواليد/الوفيات...إلخ
    هل هو مجرد حصر الأشياء ومعرفة أعدادها؟
    لا  و نعم
    ماهو  علم الإحصاء؟
تعريف علم الإحصاء

يمكن تعريف علم الإحصاء كالآتي:

”علم الإحصاء علم رياضي يعني بـ: جمع البيانات, تنظيمها, تلخيصها, تحليلها, تفسيرها, وعرضها للوصول لنتائج سليمة وقرارات مقبولة في ظل ظروف غير مؤكدة“
Data collection, Organization, Analysis, Interpretation, and Presentation-uncertainty
تطبيقات علم الإحصاء
    كافة ضروب العلوم: الطبيعية/الإجتماعية/الإنسانية: الزراعة, الفيزياء, الكيمياء, علم الإجتماع, الفلسفة ...إلخ
    هل يمكنك التفكير في علم لا يحتاج للإحصاء؟؟
وظائف علم الإحصاء 
من التعريف: أهم وظائف علم الإحصاء هى:
    وصف البيانات  Data Description
    الاستدلال الإحصائي Statistical Inference
    التنبؤ Forecasting


(1) وصف البيانات

    عند جمع البيانات تكون ”خام“: Raw Data
    وصف البيانات يشمل:
        تلخيص, تبويب وعرض في صورة جداول”Tables” أو رسوم بيانية”Graphs
        حساب بعض المؤشرات الإحصائية (متوسطات, تشتت,...)

    الوصف يعطينا معلومات أولية مفيدة عن البيانات
 (2) الاستدلال الإحصائي 

    اختيار عينة (sample) بطريقة علمية من مجتمع(population) الدراسة
    جمع البيانات المطلوبة علي هذه العينة
    التقدير(Estimation):حساب مؤشرات إحصائية -إحصاء- (statistics) علي العينة
    الاستدلال (inference) علي معلمات (parameters) المجتمع
    يتم الإستدلال الإحصائي عبر موضوعين/مرحلتين:

خطوات الاستدلال الإحصائي

    التقدير Estimation كما سبق
    اختبارات الفروض (Tests of Hypotheses ) : استخدام بيانات العينة للوصول إلى قرار علمي سليم بخصوص الفروض المحددة حول معالم المجتمع.

    نوعين من التقدير:

        التقدير بنقطة (Point Estimate).
        التقدير بفترة (Interval Estimate).


 التنبؤ (3)

    تستخدم نتائج الاستدلال الإحصائي، الدالة على الماضي في معرفة ما يمكن أن يحدث في الحاضر والمستقبل.
    توجد أساليب إحصائية عديدة للتنبؤ، مثل استخدام معادلات رياضية يتم تقدير معاملاتها من بيانات العينة، ثم بعد ذلك استخدام المعادلات المقدرة في التنبؤ بما يمكن أن يحدث في المستقبل.
أنواع البيانات وطرق قياسها 

    نوع البيانات، وطريقة قياسها من أهم الأشياء التي تحدد التحليل الإحصائي المستخدم
    يمكن تقسيم البيانات إلى مجموعتين هما:
        البيانات الوصفية Qualitative Data
        البيانات الكمية Quantitative Data
 (1) البيانات الوصفية

    قد تكون غير رقمية، أو رقمية مرتبة في شكل مستويات أو في شكل فئات رقمية.
    تقاس البيانات الوصفية بمعيارين هما:
    بيانات وصفية مقاسة بمعيار اسميNominal Scale : وهي بيانات غير رقمية, من مجموعات متنافية، لا يمكن المفاضلة بينها أو ترتيبها.
    بيانات وصفية مقاسة بمعيار ترتيبي Ordinal Scales: وتتكون من مستويات، أو فئات يمكن ترتيبها تصاعديا أو تنازليا
للبيانات الوصفية ذات المعيار الاسمي أمثلة

    النوع:  متغير وصفي تقاس بياناته بمعيار اسمي " ذكر – أنثى " .
    الحالة الاجتماعية: متغير وصفي تقاس بياناته بمعيار اسمي " متزوج ـ أعزب ـ أرمل ـ مطلق ".
    أصناف التمور:  متغير وصفي يقاس بياناته بمعيار اسمي " برحي ـ خلاص ـ سكري ـ ....".
    الجنسية: متغير وصفي يقاس بياناته بمعيار اسمي " سعودي ـ غير سعودي”

    وهذا النوع من البيانات يمكن ”تكويد“ مجموعاته بأرقام، فمثلا الجنسية يمكن إعطاء الجنسية "سعودي" الكود (1)، والجنسية "غير سعودي" الكود (2) 


للبيانات الوصفية ذات المعيار الترتيبي أمثلة

        تقدير الطالب: متغير وصفي تقاس بياناته بمعيار ترتيبي ""D-D+-C-C+-B-B+-A-A+
        المستوى التعليمي: متغير وصفي تقاس بياناته بمعيار ترتيبي "أمي – يقرأ ويكتب ـ ابتدائية ـ متوسطة ـ ثانوية ـ جامعية ـ أعلى من جامعية "
        تركيز خلات الصوديوم المستخدم في حفظ لحوم الدجاج من البكتريا: متغير وصفي ترتيبي يقاس بياناته بمعيار ترتيبي "0% ـ 5% ـ 10% ـ 15%"
        فئات الدخل العائلي في الشهر بالريال " <5000 ، 5000-10000 ، 10000-15000 ، 15000-20000، >20000 ".
 (2) البيانات الكمية

    هي بيانات يعبر عنها بأرقام عددية تمثل القيمة الفعلية للظاهرة، وتنقسم إلى قسمين هما:
    بيانات فترة Interval Data
    بيانات نسبية Ratio Data
Interval Data بيانات فترة 

    بيانات رقمية،تقاس بمقدار بعدها عن الصفر، ومن أمثلة ذلك:
        درجة الحرارة: متغير كمي تقاس بياناته بمعيار بعدي، حيث أن درجة الحرارة "0o" ليس معناه انعدام الظاهرة، ولكنه يدل على وجود الظاهرة.
        درجة الطالب في الاختبار: متغير كمي تقاس بياناته بمعيار بعدي، حيث حصول الطالب على الدرجة "0" لا يعني انعدم مستوى الطالب.
Ratio Data بيانات نسبية 

    متغيرات كمية، تدل القيمة "0" على عدم وجود الظاهرة ومن الأمثلة على ذلك:
        إنتاجية الفدان بالطن/هكتار.
        كمية الألبان التي تنتجها البقرة في اليوم.
طرق جمع البيانات
    طريقة جمع البيانات من أهم مراحل البحث الإحصائي
    جمع البيانات بأسلوب علمي صحيح          نتائج دقيقة
    طرق جمع البيانات تتلخص في:
        مصادر البيانات.         3. أنواع العينات
        أسلوب جمع البيانات     4. وسائل جمع البيانات.
 (1) مصادر البيانات
هناك مصدرين للبيانات:
    المصادر الأولية: يجمع الباحث البيانات من المصدر مباشرة. مثال؟؟
    المحاسن: الدقة (نسبيا)-الثقة بالمصدر
    المساوئ: تكلفة عالية         وقت, جهد, مال, الذاكرة
تابع مصادر البيانات 
2. المصادر الثانوية: تجمع البيانات بصورة غير مباشرة. مثال؟؟
    المحاسن: توفير الوقت والجهد والمال
    المساوئ: درجة ثقة أقل (نسبيا)
 (2) أسلوب جمع البيانات 
    بالنظر إلي: هدف البحث و حجم المجتمع هناك أسلوبين لجمع البيانات:
    أسلوب الحصر الشامل لمجتمع الدراسة: يتم جمع بيانات عن كل مفردة من مفردات المجتمع بلا استثناء
    أسلوب المعاينة: يتم اختيار عينة بطريقة علمية سليمة، ودراستها ثم تعميم نتائج العينة على المجتمع
 (أ) أسلوب الحصر الشامل لمجتمع الدراسة
    تجمع المعلومات عن كل مفردة في المجتمع
    محاسنه:
        الشمول وعدم التحيز
        دقة النتائج
    مساوئه:
        الوقت والمجهود،
        التكلفة العالية.

(ب) أسلوب المعاينة

    نختار عينة بطريقة علمية وتطبق عليها الدراسة
    محاسنه:
        تقليل الوقت والجهد.
        تقليل التكلفة.
        الحصول على بيانات أكثر تفصيلا، وخاصة إذا جمعت البيانات من خلال استمارة استبيان
    مساوئه:
        النتائج قد تكون أقل دقة، وخاصة (إذا)
        العينة المختارة لا تمثل المجتمع تمثيلا جيدا
        عدم وجود تنوع كاف (تمثيل العينة).
عوامل نجاح اسلوب المعاينة

    يعتمد نجاح استخدام أسلوب المعاينة على عدة عوامل هي:
        كيفية تحديد حجم العينة
        طريقة اختيار مفردات العينة
        نوع العينة المختارة
 (3) أنواع العينات

    بحسب أسلوب اختيارها يمكن تقسيم العينات إلي:
        (أ) العينات الاحتمالية
        (ب) العينات غير الاحتمالية

(أ) العينات الاحتمالية 

    يتم اختيار مفرداتها وفقا لقواعد الاحتمالات, أي:
    يتم اختيار مفرداتها من مجتمع الدراسة بطريقة عشوائية
    الهدف: تجنب التحيز الناتج عن اختيار المفردات
    ما هي مخاطر التحيز؟؟




أنواع العينات الاحتمالية 

    من أهم أنواع العينات الاحتمالية :
        العينة العشوائية البسيطة Simple Random Sample.
        العينة العشوائية الطبقية Stratified Random Sample.
        العينة العشوائية المنتظمة Systematic Random Sample.
        العينة العنقودية أو المتعددة المراحل Cluster Sample.


العينة العشوائية البسيطة 
Simple Random Sample

    في مجتمع حجمه (N) كم عينة حجمها (n) يمكن اختيارها؟
    تعريف العينة العشوائية البسيطة: ”هي العينة التي يتم اختيارها بحيث أن كل مفردة/عينة ذات حجم (n) لها نفس الفرصة (الاحتمال) في الاختيار“
    مثال: مجتمع يتكون من المفردات ( a,b,c,d,e), كم عينة حجمها 3 يمكن اختيارها من هذا المجتمع؟
العينة العشوائية البسيطة (تطبيق)

    يسلم هذا التطبيق يوم 13/3/2007
    مجتمع يتكون من سبع كرات ذات ألوان مختلفة (سوداء, بيضاء, زرقاء, حمراء, صفراء, خضراء, بنية):
السؤال:

كم عينة بحجم 4 يمكن اختيارها من هذا المجتمع؟ 


العينة العشوائية الطبقية 
Stratified Random Sample

    يتم تقسيم المجتمع إلي مجتمعات صغيرة (مستقلة/مستنفذة)؟
    من كل مجتمع صغير تؤخذ (عينة عشوائية بسيطة)
    هذه العينة أنسب عند وجود فوارق كبيرة بين المجتمعات الصغيرة: العينة أكثر تمثيلا للمجتمع.
العينة العشوائية المنتظمة 
Systematic Random Sample

    3 خطوات (المجتمع/حجم العينة)—جدول الأرقام العشوائية

(ب) العينات غير الاحتمالية

    يتم اختيار مفرداتها بطريقة غير عشوائية
    يقوم الباحث باختيار مفردات العينة بالصورة التي تحقق الهدف من المعاينة:
    قد يركز الباحث علي مفردات ذات مواصفات محددة
    أهم أنواع العينات غير الاحتمالية:
        العينة العمدية Judgmental Sample
        العينة الحصصية Quota Sample


الفصل الثاني: طرق عرض البيانات 

    بعد تحديد العينة وجمع البيانات ياتي تبويب البيانات وعرضها بصورة يمكن الاستفادة منها في وصف الظاهرة محل الدراسة، من حيث تمركز/توزيع البيانات، ودرجة تجانسها. وهناك طريقتين لعرض البيانات هما:

        عرض البيانات جدوليا.
        عرض البيانات بيانيا.




عرض البيانات جدوليا

    الفكرة هنا عرض البيانات آخذين في الإعتبار التشابه/الإختلاف بين المفردات
    عرض البيانات في شكل جدول وصفي مبسط
    يمكننا إجراء حسابات بسيطة لتلخيص خصائص العينة/المتغير
    دعنا ننظر إاي مثالين:
        مثال (1): جدول تكراري بسيط لمتغير وصفي
        مثال (2): جدول تكراري بسيط لمتغير كمي


مثال (1): جدول تكراري بسيط لمتغير وصفي
بيانات عينة من 40 مزرعة عن نوع التمر الذي تنتجه المزرعة:

تابع مثال (1): 

    المطلوب:
        ما هو نوع المتغير؟، وما هو المعيار المستخدم في قياس البيانات؟.
        اعرض البيانات في شكل جدول تكراري.
        كون التوزيع التكراري النسبي.
        مالذي يمكن قوله من هذه النتائج؟
مناقشة المثال
جدول أولي (تفريغ البيانات)
عدد المزارع (التكرارات) (f)

التوزيع التكراري النسبي*



التوزيع التكراري النسبي*

    لاحظ من الجدول السابق حساب التوزيع التكراري النسبي من: قسمة تكرار المجموعة على مجموع التكرارات أي:



تعليقات علي الجدول التكراري

ملاحظات على الجداول/الرسوم البيانية 

    عند تكوين جدول ما لعرض البيانات، يجب مراعاة الآتي:
        كتابة رقم/عنوان للجدول.
        لكل عمود من أعمدة الجدول عنوان يدل على محتواه.
        يجب كتابة مصدر البيانات في الجدول.
        يسر قراءة/فهم المعلومات من الجدول/الرسم
مثال (2): جدول تكراري بسيط لمتغير كمي

    نود الآن تكوين جدول تكراري/التوزيع التكراري النسبي ومن ثم إبداء ملاحظات في حالة: متغير كمي
    لدينا درجات 70 طالبا في مقرر ”إحص 122“:
        كون التوزيع التكراري /التوزيع التكراري النسبي لدرجات الطلاب.
        ما هي نسبة الطلاب الحاصلين على درجة ما بين 70 إلى أقل من 80؟
        ما هي نسبة الطلاب الحاصلين على درجة أقل من 70 درجة؟
        ما هي نسبة الطلاب الحاصلين على درجة 80 أو أكثر ؟
        أية تعليقات أخري من واقع الجداول؟؟




مثال لمتغير كمي

    درجات ”إحص 122“ –افتراضي:
مثال لمتغير كمي-تابع

    خطوات تكوين الجدول التكراري:
        حدد أعلي وأدني مفردة
        احسب المدي”Range”( R): (الفرق بين أعلي وأدني مفردة)
        حدد عدد الفئات # of Classes(C) / طول الفئة Length(L): (حسب :رأي الباحث/حجم البيانات/أهداف البحث)
        كون الجدول من: الفئة/التكرار/التكرار النسبي


مثال لمتغير كمي-تابع

    المدي( Range-R):

=أعلي درجة - أدني درجة =94-55 = 39

    افرض أن عدد الفئات ( C) المناسب هو 8
    طول الفئة : R/C=39/8=4.875≈5
    الآن نحدد كل فئة من الفئات الـ 8

تحديد الفئات-تابع

    كل فئة عبارة قيمتين المسافة بينهما هي طول الفئة ( 5): القيمة الأولي تسمي (الحد الأدني)؛ والثانية (الحد الأعلى).
    كل فئة تبدأ عند انتهاء الفئة التي قبلها بحيث:
    كل مفردة من المفردات تقع داخل فئة واحدة فقط؛ مثلا:
    الفئة الأولي :
        الحد الأدني = أقل درجة (55=)
        الحد الأعلي= الحد الأدني + طول الفئة=55+5=60
        اذا الفئة الأولي تكون  " من 55 إلى أقل من 60 "
        لاحظ إن الدرجة (60) لا تقع داخل الفئة الأولي


تحديد الفئات-تابع

    الفئة الثانية:
    الحد الأدنى= 60
    الحد الأعلى=60+5=65
        اذا الفئة الأولي تكون  " من 60 إلى أقل من 65 ”
    وهكذا (أنظر الجدول لكل الفئات)
جدول أولي (تفريغ البيانات)-مثال كمي
عدد الطلاب  (التكرارات) 

العلامات الإحصائية