عداد تعليمات الاختبار

-إعداد تعليمات الاختبار.
هناك نوعين من التعليمات النوع الخاص الذي يقدم الى القائم بتطبيق الاختبار وهي تتعلق بتصحيح الاختبار وتفسير درجاته والزمن المحدد لا دائه والنوع الثاني يقدم الى الطلبة الذين يجي عليهم الاختبار المقنن وتكتب التعليمات في صفحة مستقلة من صفحات الاختبار وان على القائم بالاختبار ان يتبعها واذا دعت الحاجة ان يقرأها دون تعديل او تغيير فيها ولجميع الطلبة وكما هو وارد في التعليمات المبينة ادناه :  
1- يجب ان تكون التعليمات سهلة وواضحة ومفهومة وقصيرة وقادرة على إيصال ما هو مطلوب اجراءه من الطالب .
2- يفضل ان تحتوي التعليمات على امثلة توضيحية للإجابة وخاصة للأسئلة الي لم يألفها الطالب سابقا .
3- يفضل ان تفسح الوقت الكافي للطالب لقراءة التعليمات والانتباه الى الاسئلة قبل البدء في الاختبار .
4- يفضل ان توضح التعليمات الهدف من الاختبار والوقت المحددللاجابة وكيفية تدوين الاجابة.
5- يجب ان توضح التعليمات اسلوب التصحيح وخاصة اذا كان الاختبار يستخدم معادلة التصحيح من اثر التخمين .
تطبيق الاختبار.
ان الهدف من الاختبارات التحصيلية المقننة هو مقارنة النتائج التي يحصل عليها في الاختبار مع عينة من الطلبة ولكي تحصل استجابة صادقة فيجب ان يخطط لتطبيق الاختبار بحيث تتهيأ للطلبة ظروفا مناسبة للاستجابة وفي نفس الوقت نضبط العوامل التي يمكن ان تتدخل في سلامة الإجراء ومن اهم هذه العوامل :
01 ظروف اجراء الاختبار يفضل عند تطبيق الاختبار التحصيلي المقنن ضبط الظروف الفيزياوية عند اجراء الاختبار لانها كثيرا ما تؤثر على اجابات الطلبة فيجب ان تكون التهوية والاضاءة ومكان االجلوس مناسبة اذ ان ذلك يؤثر تأثيرا كبيرا على اجابات الطلبة وقد تؤثر الحالة المزاجية للطالب وقت تطبيق الاختبار على درجته الكلية .
02 تقنين الموقف الاختباري ويقصد بتقنين الموقف الاختباري هو محاولة ضبط الموقف الذي تعطى فيه التعليمات واثارة الدافعية المناسبة وذلك عن طريق توحيد الموقف الاختباري ولجميع الطلبة .
03 ملاحظة ان تكون التعليمات المكتوبة واضحة لان يكون الاختبار ذاتي التطبيق مع تجنب اعطاء الطالب اية كلمة او اشارة تلمح بالاجابة .
-        تحليل فقرات الاختبار.
ان التحليل الاحصائي لفقرات الاختبار هي عملية فحص او اختبار استجابات الافراد عن كل فقرة من فقرات الاختبار وتتضمن هذه العملية معرفة مدى صعوبة او سهولة كل فقرة ومدى فعاليتها او قدرتها في التمييز في الفروق الفردية للصفة المراد قياسها كما يمكن الكشف عن مدى فعالية البدائل الخاطئة في الفقرات اختبار الاجابة وخاصة في فقرات الاختبار المتعدد.
01 ايجاد معامل سهولة وصعوبة الفقرة :
ان أي فقرة في الاختبار يجب ان لاتكون سهلة جدا بحيث يستطيع جميع افراد العينة الاجابة عليها او ان تكون صعبة جدا فيفشل فيها الجميع وعلى وجه العموم يجب ان تحقق الفقرة الواحدة اقصى نجاح في التمييز بين الطلبة اذا كان  مستوى صعوبتها يسمح بنجاح 50%من افراد العينة في الاجابة عليها . ان اهمية استخراج معامل الصعوبة للفقرة هو انه يمكن التعرف على نسبة الذين يجيبون اجابة صحيحة والذين يجيبون اجابة خاطئة فاذا افترض ان فقرة اختبار ما مطبقة على (100) طالب وقد اجاب عنها (60) طالب بشكل صحيح فان معامل سهولة الفقرة يساوي 60 ÷100 =  0،60
اما صعوبة الفقرة في نسبة الاجابات الخاطئة على تلك الفقرة اعلاه يكون معامل الصعوبة 40 ÷100=0,40
ولما كان مجموع نسبتي الاجابات الصحيحة والخاطئة على كل فقرة يساوي (1) فإننا يمكننا حساب معامل صعوبة الفقرة من معامل السهولة وذلك بطرح معامل السهولة من (1) .
ولما كان مجموع نسبتي الاجابات الصحيحة والخاطئة على كل فقرة يساوي (1) فإننا يمكننا حساب معامل صعوبة الفقرة من معامل السهولة وذلك بطرح معامل السهولة من (1) .
1-0,60 =0,40 معامل الصعوبة
وهناك طريقة اخرى لاستخراج معامل الصعوبة والسهولة تعتمد على التكرارات وباستخدام المعادلة الاتية :
معامل السهولة او الصعوبة=مجموع الاجابات الصحيحة في المجموعة العليا + مجموع الاجابات الصحيحة في المجموعة الدنيا مجموع افراد المجموعة العليا + مجموع افراد المجموعة الدنيا
ولغرض توضيح ذلك نورد المثال الاتي :
محتوى الفقرة / وضع الفريد بينه اول اختبار للذكاء عام .
ا- 1904
ب- 1906
ج- 1905
د-1907
وبعد تصحيح الاختبار وفرز الإجابات للمجموعتين العليا والدنيا كانت الإجابات الصحيحة معا للبدائل على النحو الاتي علما ان عدد الطلبة المطبق عليهم الاختبار هو (100) طالب .
البدائل                 27%من المجموعة العليا                 27ِ% من المجموعة الدنيا
 ا                            3                                            10
ب                         صفر                                           3
ج                          24                                            2
د                           صفر                                          12
ولغرض ايجاد معامل السهولة والصعوبة للفقرة نتبع الخطوات الاتية :
01 ترتب الدرجات التي حصل عليها الطلبة في الاختبار من اعلى درجة الى ادنى درجة .
02 تأخذ مجموعتين من الدرجات تمثل الاولى الطلبة الذين حصلوا على اعلى الدرجات في الاختبار وتمثل الثانية الذين حصلوا على ادنى الدرجات .
03 تأخذ نسبة 27%من المجموعة العليا والدنيا من الدرجات وهذه النسبة تمثل افضل نسبة يمكن اخذها لأنها تقدم لنا مجموعتين بأقصى مايمكن من حجم وتمايز وهذه النسبة تأخذ في حالة كون اعداد الطلبة كبير اما في حالة كون الاختبار تحصيلي وعدد الطلبة مثلا (40) طالب فيمكن ان تقسم الصف الى مجموعتين بالتساوي بعد ترتيب درجاتهم على الاختبار من
 اعلى الى ادنى وفي مثل هذه الحالة تكون المجموعة الاولى الطلبة الذين حصلوا على الدرجات العليا والمجموعة الثانية الذين حصلوا على الدرجات الواطئة .
04 استخراج عدد الطلبة الذين اجابوا عن الفقرة بصورة صحيحة في كل من المجموعتين العليا والدنيا .
05 نطبق المعادلة لاستخراج السهولة والصعوبة للفقرة على الشكل الاتي :
24+12              36
س،ص = ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ = ــــــــــــــــــــــــــــــــــــــــــــــــــــــــ  = 0,67 معامل السهولة
27 +27              54
1- 0,67 = 0،33 معامل الصعوبة
02 ايجاد معامل تمييز الفقرة :
يقصد بمعامل التميز قدرة الفقرة على تميز الفروق الفردية بين الافراد الذين يعرفون الاجابة والذين لايعرفون الاجابة الصحيحة لكل فقرة او سؤال من الاختبار . أي قدرة الفقرة على التمييز بين الطلبة الممتازين والضعاف . اذ ان كل فقرة لابد ان تكون لها القدرة على التميز بين من يحصلون على درجات واطئة ومن يحصلون على درجات عالية .
ولغرض ايجاد الفقرة تستخدم المعادلة الآتية وهي إحدى الطرق في حساب معامل التمييز للفقرة :
مجـ ص ع -  مجـ ص د
ت = ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
1/2 (ع +د )
حيث ان :
ت=  معامل التمييز
مجـ ص ع = مجموع الاجابات الصحيحة للمجموعة العليا
          ع = عدد افراد المجموعة العليا
مجـ ص د = مجموع الاجابات الصحيحة للمجموعة الدنيا
          د= عدد افراد المجموعة الدنيا
مثال :
لو عدنا الى المثال الذي ورد في ايجاد سهولة وصعوبة الفقرة واستخدمنا معادلة تمييز الفقرة نبين مايلي :
24 – 12                             12
         ت = ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ    = ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ   = 0،45
 1/2 (27 +27)                     27        
0،45 ويعد هذا التمييز جيد جدا كلما كان تمييز الفقرة اعلى كلما كانت افضل وقد قدم ايبل معيار لمقارنة القوة التمييزية والجدول الاتي يوضح هذا المعيار :
معامل التمييز تقييم الفقرة
0،40 فاعلى  فقرات جيدة جدا
0،20-39     جيدة الى حد مقبول ولكن قد تخضع للتخمين
0،19 فأقل    فقرات ضعيفة تحذف او لم يتم تحسينها

03 فعالية البدائل الخاطئة :
تحتوي فقرات الاختبار من متعدد على البدائل ولهذه البدائل صفات واعتبارات فنية عند اختيارها من المفروض ان تكون البدائل فعالة بما فيها الكفاية لان يخطئ البعض بها وليس الجميع فلا فائدة من بديل خاطئ يخطئ به الجميع او يعرفه الجميع .
ويعد البديل الخاطئ فعال عندما يجذب اكثر عدد ممكن من الطلبة الضعاف ( المجموعة الثانية ) على انه البديل الصحيح . وفي الوقت نفسه تتوقع ان تجذب البدائل الخاطئة العدد القليل من( المجموعة العليا ) واذا كان هنالك بديلا لم يجذب احدا من المجموعتين العليا والدنيا فانه يكون واضح الخطأ ويجب استيعابها من الفقرة . فالبديل الخاطئ الفعال في المثال السابق هو (ا) 
        الصدق:
يعد الصدق من الامور التي يجب ان يتأكد منها مصمم الاختبار عندما يريد بناء اختباره فلا بد من ان تكون لديه ظاهرة سلوكية محددة لقياسها كأن يقيس القيم الاجتماعية او سمات الشخصية او الميول المهنية او الانطواء او الذكاء او التعصب او التحصيل الدراسي في مادة معينة فيقوم بترجمة هذه الظاهرة السلوكية الى عبارات او مواقف يعتمد كفقرات للاختبار يسمى باختبار سمات الشخصية او القيم او ماشابه وبعد التأكد بطرق علمية من ان الاختبار يقيس الظاهرة التي يراد دراستها فانه يعد اختبارا صادقا ويعني  صدق الاختبار مقدرته على قياس ماوضع من اجله او السمة المراد قياسها فالاختبار الصادق هو ذلك الاختبار القادر على قياس السمة التي وضع من اجلها فمثلا يعد اختبار الاستعداد المدرسي صادقا اذا كان قادرا على قياس الاستعداد الدراسي ويكون غير صادق اذا كان يقيس ظاهرة سلوكية اخرى .
ان الصدق يتحدد بخصائص وطبيعة المجتمع الاصلي الذي اشتقت منه معاملات الصدق فالاختبار الذي ثبت صدقه في المجتمع ثبت صدقه في مجتمع اخر وبهذا المعنى فالصدق عد نسبي.
للصدق مظهرانهما :
 01 الثبات – في الاختبار الصادق يبقى في معظم الاحيان الا اذا تداخلت عوامل تحول دون ذلك.
02 التعلق – ويقصد به مدى اقتراب درجات الاختبار من الدرجات الحقيقية الخاصة بالعينة كلها .
        انواع الصدق :
للصدق انواع مختلفة بحسب معنى الصدق وهناك انواع متعدد حددها المشتغلين بالقياس ، وسنتطرق هنا الى الانواع الاكثر شيوعا واستخداما ومنها :
01 الصدق الظاهري :
الصدق الظاهري هو الصدق الذي يدل على ما يبدو ان الاختبار يقيسه ظاهريا وليس ما يقيسه الاختبار بالفعل ويعتمد هذا النوع من الصدق على الفحص المبدئي لمحتويات الاختبار أي بالنظر الى فقراته وكيفية صياغتها ومدى وضوحها وكذلك النظر الى التعليمات ودقتها ثم مقارنة هذا الذي يبدو بالوظيفة المراد قياسها فاذا اقترب الاثنان كان الاختبار صادقا ظاهريا سطحيا أي بدا ان فقراته تتصل غالبا بجانب السمة المراد قياسها .
ويعتمد الصدق الظاهري على الخبراء والاختصاصين من ذوي الخبرة في تحديد صدق الاختبار وذلك من خلال الاعتماد على النسبة المئوية لتحديد اكثر اتفاق الخبراء على الاختبار ويمكن استخدام مربع كاي لاستخراج صدق الاختبار وعلى الرغم من ان هذا النوع يعد اقل انواع الصدق اهمية الا انه من المرغوب ان يكون الاختبار ذا صدق ظاهري .
02صدق المحتوى :
يقصد به فحص مضمون او محتوى الاختبار فحصا دقيقا منتظما لغرض تحديد ما اذا كان يشتمل على عينة ممثلة لميدان الموضوع الدراسي الذي يقيسه أي تحليل مواد الاختبار وفقراته لتحديد الوظائف والجوانب والمستويات الممثلة فيه ونسبة كل فيها الى الاختبار ككل .
ويعد صدق المحتوى من اكثر انواع الصدق ملائمة مع الاختبارات التحصيلية ولكي يتحقق يتطلب الجوانب الاساسية الاتية :
01 تحليل محتوى المادة الدراسية . فالخطوة الاولى في الوصول الى صدق المحتوى هو القيام بتحليل الموضوع الذي نريد قياسه فنحلله تحليلا منتظما لتحديد مجالاته وتقدير الوزن لكل مجال بناء على اهميته بالنسبة لبقية المجالات الاخرى فمثلا عندما نقوم بوضع اختبار لموضوع القياس والتقويم فانه يجب ان نختار فقراته من كل مجال من مجالات التي هي على سبيل المثال (التطور التاريخي للتقويم والقياس ، انواع الاختبارات التحصيلية ،التخطيط لاختبار ، شروط ومواصفات الاختبار الجيد ) وان تكون هذه الفقرات متناسبة مع اهمية المجال بالنسبة للموضوع .
02 تحليل اهداف التعلم : أي انه يجب ان تكون فقرات الاختبار ممثلة للأهداف السلوكية فاذا كانت الاهداف مثلا المعرفة ، الاستيعاب ، التطبيق ،فيجب ان تمثل الفقرات (الاسئلة ) هذه الاهداف بناء على الاهمية النسبية لكل هدف.
03 جدول مواصفات : وفيه يتم حصر المواصفات وتحديد الاهمية النسبية لكل منها بغية تمثيلها في الاختبار مع ما يتناسب واهميتها .
04 تقديرات المحكمين : يعتمد صدق المحتوى على تقديرات المحكمين لذلك يجب الاعتماد على محكمين قادرين ومختصين في مجال القياس والاختبار لكي نحصل على مؤشرات صدق غير مزيفة .
وبما ان صدق المحتوى يعتمد على تقديرات المحكمين فانه سيكون عرضة لأخطاء التقدير ولتلافي هذه الاخطاء يمكن الاعتماد على زيادة عدد المحكمين قدر الامكان للكشف عن مدى الاتفاق في تقديراتهم .
03 الصدق التجريبي :
معناه توفر الادلة العملية او التجريبية على ان الاختبار يقيس الصفة التي صمم لقياسها او انه صالح لغرض معين وفي مثل هذه الحالة يستعان بمحك خارجي مستقل تماما عن الاختبار يستخدم في تقويم صدق الاختبار وهذا المحك اما ان يكون مقياسا اخر للصفة التي يقيسها الاختبار او النشاط الذي يتناوله الاختبار بالقياس .
والمحك بصفة عامة عبارة عن عامل مستقل عن الاختبار نعلم او نفترض بأنه مرتبط بالعامل الذي يقيسه الاختبار او يتنبأ به وان الصدق التجريبي يعتمد على صدق المحك او الميزان لذلك يتطلب اختبار المحك على درجة كبيرة من الصدق تقارن به الدرجات التجريبية للاختبار .
ويعد الصدق التجريبي من اهم انواع الصدق بالنسبة للاختبار فهو يقيس مدى نجاح الاختبار في قياس الوقائع الخارجية او التجريبية وهي عبارة عن مؤشرات احصائية بين مقدار الارتباط وبين الصدق التجريبي والمحك المستخدم .
04 الصدق التنبؤي:
قدرة الاختبار وفاعليته في التنبؤ بنتيجة معينة في المستقبل ويتم ذلك بمقارنة درجات الطلبة في الاختبار ودرجاتهم في اختبار اخر مباشرة للأداء اللاحق للطالب . وهذا الاختبار الاخير يسمى من الناحية الفنية بالمحاكاة (الميزان ) مثلا اذا اردنا معرفة صدق اختبار ( الاستعداد القرائي ) على التنبؤ بتحصيل الطلبة في موضوع القراءة وقد اعطى لهم اختبارا تحصيليا في موضوع القراءة في نهاية السنة وحصل كذلك كل منهم على درجة ايضا .
فاذا كان معامل الارتباط عالي بين درجات الاختبارين دل ذلك على قدرة اختبار الاستعداد القرائي على التنبؤ الا انه اغلب الاحيان يكون معامل الارتباط واطئ وذلك بسبب اننا نجمع البيانات عن المحك يعد اجراء الاختبار بفترة زمنية أي في المستقبل وقد تحدث تغيرات على افراد العينة .
ان هذا النوع من الصدق يعتمد على المعلومات التي تصبح متوافية في المستقبل من الطلبة الذين اجرى عليهم الاختبار من الناحية التي يتنبأ بها الاختبار وهذه المعلومات قد تكون على شكل درجات او تغييرات او تقادير تتخذ بشأن الطلبة فالمحكات هنا هي مؤشرات للتنبؤ .
05 الصدق التلازمي :
يعني الكشف عن العلاقة بين الاختبار المراد استخراج صدقه ومؤشرات المحك التي نحصل عليها في نفس الوقت تقريبا ففيه نعطي الاختبار لمجموعة من الطلبة تتوفر لدينا عنهم معلومات وفي هذه الحالة يكون المحك المستخدم في تقويم صدق الاختبار بيانات أخرى من الصفة جمعت في نفس الوقت الذي اجرى فيه اختبار على المجموعة نفسها وقد تكون هذه البيانات مثلا تقديرات المدرسين لذكاء الاطفال واستخدامهم في تقويم صدق اختبار الذكاء  .
ويستخدم الصدق التلازمي في بعض الاحيان لتلافي مشكلة الصدق التنبؤي وبما يتطلبه من وقت طويل .
الفرق بين الصدق التنبؤي والصدق التلازمي :
01 وقت الحصول على درجات المحك او المعيار ففي الصدق التنبؤي تحصل عليها بعد فترة من تطبيق الاختبار الجديد وقد تصل الفترة الى اكثر من سنة اما في الصدق التلازمي فيحصل عليها اثناء تطبيق الاختبار .
02 الفائدة من الاختبار : يستفاد من صدق الاختبار في الصدق التنبؤي في التعرف على درجة انجاز الطالب في المستقبل اما الصدق التلازمي فيستفاد منه في الاختبارات التي تقيم السلوك الحالي للطالب .
03 يكون الصدق التنبؤي اكثر ملائمة مع اختبارات الاستعداد المدرسي واختبارات الذكاء اما الصدق التلازمي فانه يكون اكثر ملائمة مع الاختبارات التحصيلية .
طرق حساب الصدق :
هناك طرق عديدة لحساب الصدق منها :
01 طريقة حساب الصدق بواسطة معاملات الارتباط وهي من اكثر الطرق شيوعا واستعمالا في حساب الصدق ويعتمد عليها الصدق التجريبي .
02 طريقة الفرق بين المتوسطات والمقارنات الطرفية وفيها يقسم الاختبار الى قسمين او ثلاثة اقسام ويقارن متوسط 27%العليا بمتوسط 27%الدنيا ثم تختبر الدلالة الاحصائية للفرق بين المتوسطات وهذه الطريقة سريعة ولكن اقل دقة من الطريقة السابقة .
03 طريقة جدول الترقيم حيث يقارن التوزيع التكراري لدرجات الافراد في الميزان بالتوزيع التكراري لدرجات الافراد بالاختبار التجريبي.
04 مجموعة طرق اخرى تستخدم في حالة صعوبة الحصول على اختبار ميزان او على محك يتمتع بدرجة من الصدق والثبات .
العوامل المؤثرة في صدق الاختبار :
01 طول الاختبار : حيث ان طول الاختبار يؤثرفي صدقه لذا يلجأ مصمم الاختبار الى زيادة عدد فقراته حين يتبين ان معامل صدقه منخفض .
02 ثبات الاختبار: ان صدق الاختبار يتأثر بثباته مباشرة فالصدق دالة لمعامل الثبات ويصل ثبات الاختبار الى اقصاه حين يزداد طوله ويؤثر ثبات القياس في صدقه فان انخفاض معامل الثبات يؤثر على وجود خلل في الاختبار وفي نفس الوقت مؤشر لانخفاض صدقه مع ملاحظة ان الثبات العالي ليس مؤشرا لصدق الاختبار .
03 ثبات الميزان او المحك ويتأثر صدق الاختبار بثبات الميزان او المحك ولهذا فان من الأمور الضرورية اختيار موازين ذات ثبات عال .
04 التباين : يتأثر صدق الاختبار بمدى التباين بين افراد العينة في السمة المراد قياسها فكلما كان التباين قليلا كان الصدق ضعيفا .
05 اقتران ثبات الميزان بثبات الاختبار .
        الثبات :
ان الاختبار التحصيلي المقنن يجب ان يكون على درجة عالية من الدقة والاتقان والاتساق والاطراد فيما يزودنا به من بيانات على مستوى الطالب اذ ان مفهوم الثبات من المفاهيم الاساسية التي يجب ان تتوفر في الاختبار لكي يكون صالحا للاستخدام ففي كل اختبار يوجد قدر من اخطاء القياس وقد تكون الاخطاء قليلة او كثيرة مما تؤثرفي نتائج القياس وتسمى هذه الاخطاء بأخطاء الصدفة اذ انه لايوجد اختبار سواء كان تحصيليا او عقليا او نفسيا يحصل على درجة ثبات كاملة لان من غير الممكن التخلص من الاخطاء والشوائب في الاختبار لأننا عندما نريد استخراج معامل الثبات نحسبه بناءا على ارتباط درجات المرة الثانية بنفس الصورة او بصورة متكافئة من الاختبار وهنا لابد ان تكون معرض للخطأ وهذا الخطأ هو ان هؤلاء الافراد انفسهم يتغيرون وعلينا ان نعرف مدى تغيرهم حتى نعرف سبب تغير درجاتهم في المرات المختلفة فقد لايكون التغير في الاختبار بل فيمن يطبق عليهم الاختبار اذ ان الدرجة التي يحصل عليها الفرد في أي اختبار لاتعبر عن الاداء الحقيقي فقط وانما تمثل الاداء الحقيقي للفرد مع عوامل الخطأ أي بمعنى ان درجة الفرد على الاختبار تعبر عن التباين الحقيقي للفرد وتباين الخطأ وبذلك فان درجة الاختبار تتضمن قدرا من الخطأ قد يؤدي الى زيادة الدرجة الحقيقية او الى نقصان في الدرجة عن ما يستحقه الفرد المقاس مما يؤدي الى تقدير اداء الفرد اقل او اكثر من الواقع الذي يستحقه وافضل طريقة لمقارنة هذه الدرجات هي  حساب معامل ارتباط درجات الاختبار في المرة الاولى بدرجات نفس الاختبار في المرة الثانية بنفس الافراد وعندما تكون درجات المرتين نفسها متسقة فان ذلك يدل على ثبات اجاباتهم ويستخدم في حساب معامل الثبات . معامل الارتباط بين درجات الافراد في المرتين ويطلق على النتيجة الت نحصل عليها بمصطلح ( معامل الثبات ) ويتراوح معامل الثبات بين درجتين (صفر و 1 ) ويعد الصفر ادنى معامل ثبات اما الدرجة (1) فتمثل اعلى معامل ثبات ومن الصعب الوصول الى معامل ثبات يساوي (1) وذلك بسبب الاخطاء العديدة التي تتعلق بنتائج الاختبار والتي لا تخضع للضبط العلمي والتحكم الدقيق وكذلك الحالة النفسية او الجسمية للفرد والحالة الفيزيقية وغيرها مما تؤثر مباشرة في نتائج الثبات .
ان ثبات الاختبار يعني ان يعطي الاختبار نفس النتائج اذا ما أعيد على نفس المجموعة في نفس الظروف  وبمعنى اخر لو كررت عمليات قياس الفرد الواحد لأظهرت درجة شيئا من الاتساق أي ان درجته لاتتغير جوهريا بتكرار اجراء الاختبار
أي ان مفهوم الثبات يعني ان يكون الاختبار قادرا على ان يحقق دائما النتائج نفسها في حالة تطبيقه مرتين على نفس المجموعة .  
العلاقة بين الصدق والثبات :
ان الصدق يتضمن الثبات وهو مظهر من مظاهره كما ان الصدق اعم واشمل من الثبات اذ ان ثبات ودقة الاختبار لاتدل على صدقه بل من الممكن ان يكون الاختبار ثابتا ودقيقا وان درجة الفرد عليه لاتتغير كثيرا من اجراء الى اخر ولكنه ليس صادقا بمعنى ان يقيس دقة وثبات عاملا اخر غير العامل اذي صمم الاختبار لقياسه ومن جهة اخرى فان كل اختبار صادق هو ثابت بالضرورة ولكن لايمكن القول ان كل اختبار ثابت هو صادق بالضرورة اذ ان الاختبار الصادق يقيس فعلا ما اعد لقياسه فان درجته معبرة عن الاداء الحقيقي او القدرة الفعلية للفرد وتعبر عن الوظيفة المقاسة بكل دقة وبالتالي ستكون ثابتة في الوقت نفسه .
أي ان الاختبار الثابت ليس بالضروري ان يكون صادقا ذلك انه قد يقيس وظيفة اخرى عدا الوظيفة المخصص لقياسها او يقيس وظيفة اخرى الى جانب الوظيفة التي خصص لها .
        طرق حساب الثبات :
يقاس الثبات إحصائيا عن طريق معاملات الارتباط بين الدرجات التي يحصل عليها الطالب في المرتين ، وان معامل الثبات يقاس بأساليب متعددة ويختص كل اسلوب فيها بتقدير نوعية محددة من تباين الخطأ وهو التباين الذي يؤثر في ثبات الاختبار ولعل تباين وجود هذه الاساليب المتنوعة في حساب الثبات يعود الى تقويم الاختبارات لان بعض اختبارات تتميز بإمكانية حساب ثباتها بأسلوب دون الاخر وعدم صلاحية بعض الاساليب بالنسبة لها . كما يمكن استخدام اكثر من طريقة واحدة للاختبار الواحد بهدف التعرف على مصادر تباين الخطأ الذي يؤثر في استقرار او اتساق الدرجة التي يحصل عليها الاختبار .
        وهناك طرق مختلفة لحساب معامل ثبات الاختبار منها :
1- طريقة الصور المتكافئة :
تعد هذه الطريقة من افضل الطرق ملائمة مع الاختبارات التحصيلية ويفترض تكوين صورتين متكافئتين من الاختبار الواحد بحيث تكون هذه الصور متكافئة وتتوفر فيها نفس مواصفات الاختبار الذي نريد التحقق من ثباته بحيث يحتوي على نفس العدد من الاسئلة وان تكون صياغة الاسئلة متماثلة ودرجة الصعوبة واحدة وان تتضمن محتوى واحد وان تتفق معه في جميع المظاهر الاخرى مثل التعليمات والأمثلة والشكل العام .
فمثلا وجود صورتين من الاختبارين للقراءة فيجب ان يتضمنا نصوصا واسئلة لها نفس الصعوبة ويسأل فيها نفس النوع من الاسئلة أي ان يكون هناك توازن واحد بين الاسئلة وكذلك يجب ان تمثل فيها نفس نوع النصوص سواء كانت وصفية او حوارية ولكن النصوص الخاصة ومضامين الاسئلة يجب ان تكون مختلفة فاذا أصبحت لدينا صورتان من الاختبار فيمكن ان نطبق الصورتين فاما ان يعطي الواحد بعد الاخر مباشرة في نفس الوقت اذا لم يكن هنالك اهتمام بالاستقرار عبر الزمن وبعد ذلك يحسب معامل ارتباط بين درجات الاختبارين فيكون بذلك معامل ثبات تكافؤ .
او ان يطبق الاختبارين بعد فترة زمنية أي ان تكون هنالك فترة مناسبة بين اجراء صورتين وعند ذلك يكون معامل الثبات المحسوب بهذه الطريقة هو معامل التكافؤ واستقرار. ان طريقة الصور المتكافئة تقدم اساسا سليما جدا لتقدير الدقة في الاختبار الا ان هذه الطريقة تثير عدد من المشكلات العملية اذ انها تتطلب توفر صورتين متكافئتين ففي بعض الاختبارات لايمكن اعداد صورة للاختبار او قد لاتوفر الوقت لاجراء الاختبار الثاني . كما ان عامل اثر التدريب والالفة بالاختبار يزداد كلما اقتربت الصورة من الاصل مما يؤثر على ثبات الاختبار .
2- طريقة اعادة الاختبار :
تتطلب هذه الطريقة اعادة تطبيق الاختبار مرة اخرى على افراد المجموعة نفسها بعد فترة زمنية ملائمة ثم تحسب بعد ذلك معامل الارتباط بين الدرجات التي حصل عليها افراد العينة في المرة الاولى والثانية ويسمى معامل الارتباط المستخرج بهذه الطريقة بعامل استقرار أي استقرار نتائج الاختبار خلال الفترة بين التطبيقين للاختبار
ومن الضروري عند حساب الثبات بطريقة اعادة الاختبار تقدير الوقت بين التطبيقية فان هنالك احتمال كبير من تدخل عامل النمو الجسمي والعقلي لدى الفرد المقاس وعموما فليس هناك اتفاق على طول الفترة الزمنية بين تطبيقي الاختبار ولكن يمكن القول بصورة عامة ان الفترة القصيرة تعتمد على نوع الظاهرة المقاسة أي عدم تأثر الاستجابات في التطبيق الثاني بتذكر الاستجابات في التطبيق الاول وان افراد العينة من الاطفال حتى لايدخل عامل النمو الجسمي والعقلي . اما اذا كانت السمة المقاسة لاتتأثر بالنمو وأفراد العينة من الكبار ففي مثل هذه الحالة فان الفترة الطويلة تكون ملائمة لها ان طريقة اعادة الاختبار لاتصلح لحساب ثبات الاختبارات التحصيلية وتكون اكثر ملائمة مع الاختبارات الشخصية .
ومن الآخذ على هذه الطريقة ان الدرجات التي يحصل عليها الافراد في المرة الثانية من تطبيق الاختبار تكون اعلى بقليل من درجاتهم في التطبيق الاول وذلك بسبب الالفة وتذكر الاجابة كما ان الموقف التجريبي قد يختلف في المرة الأولى عن المرة الثانية مما تتأثر النتائج النهائية بالشوائب التي يصعب إخضاعها للظروف التجريبية كما ان هذه الطريقة تكلف جهد ووقت .
3- التجزئة النصفية :
تعتمد هذه الطريقة أساسا على تقسيم فقرات الاختبار الى قسمين أي تجزئة الاختبار الى قسمين متكافئين وايجاد معامل الارتباط بين القسمين وبذلك فان هذه الطريقة تتطلب تجزئة الاختبار الى نصفين يحصل كل فرد على درجة عن كل قسم وهكذا يصبح كل قسم وكأنه صورة مكافئة ولكن يختلف عنه بان الاختبار كله طبق مرة واحدة ويصحح ثم يحصل الافراد على مجموعتين من الدرجات احدهما القسم الاول والاخرى عن القسم الثاني والفترة الزمنية بينهما معدومة. 
وهنالك عدة طرق لتقسيم الاختبار منها :
1- القسمة النصفية : وذلك بقسمة الاختبار الى نصفين متساويين فمثلا لو كان لدينا اختبار يتكون من (60) فقرة فسيكون النصف الاول (1-30) فقرة والثاني من (31-60) فقرة . ب- الفردي والزوجي : يتم ذلك بقسمة فقرات الاختبار الى نصفين بحسب ارقام الفقرات فالفقرات ذات الارقام الفردية مثلا تعد قسما والفقرات ذات الارقام الزوجية قسما اخر .
ج- التقسيم الجزيئي : تشمل بعض الاختبارات على اختبارات فرعية وفي مثل هذه الحالة لايمكن استخدام أي نوع من الانواع اعلاه لذلك يقسم الاختبار الى جزئين او ثلاثة اجزاء بحسب ما يحتويه الاختبار من جوانب فرعية فمثلا اذا كان الاختبار من (6) اختبارات فرعية  فيكون القسم الأول من الفروع (1-3-5) والقسم الثاني من الفروع (2-4-6) وهكذا
ان معامل الارتباط المستخرج بين نصفي الاختبار يفسر بأنه معامل الاتساق الداخلي ولما كان معامل الثبات لايقيس التجانس الكلي للاختبار لانه ثبات لنصف الاختبار فهنالك طرق متعددة لتلافي هذا النقص وذلك باستخدام معامل سبيرمان براون ومعدلة رولون وغيرها .
العوامل المؤثرة في الثبات : 
1- طول الاختبار ان عدد اسئلة الاختبار عامل مؤثر في درجة ثبات الاختبار فكلما زاد عدد الفقرات ادى ذلك الى ارتفاع معامل الثبات
2- زمن الاختبار يتأثر ثبات الاختبارات الموقوتة بالزمن المحدد لها وقد اكدت ابحاث ليند كريست وبذلك يزداد الثبات تبعا لزيادة الزمن حتى يصل الى الحد المناسب للاختبار فيصل الى نهايته العظمى ثم يقل بعد ذلك كلما زاد الزمن عن ذلك الحد
3- صياغة الاسئلة : ان كون الاسئلة غامضة وطويلة تقلل من الثبات والاسئلة الواضحة والموضوعية والقصيرة تزيد من  الثبات   وهذا يتطلب من الباحث الدقة في اختيار الالفاظ والعبارات ونوعها عند صياغة الاسئلة حتى يجعلها قادرة على الوصول الى الثبات الحقيقي .
4-صعوبة الفقرات ودقتها ان وجود فقرات صعبة في الاختبار لا يستطيع اغلب الافراد او جميعهم من الاجابة عنها تؤثر في الاختبار من حيث ثباتها الا ان حذفها لايؤثر على درجة المفحوص كما ان وجود فقرات سهلة يستطيع جميع افراد العينة الاجابة عنها تؤثر في معامل ثبات الاختبار الا ان حذفها لاتؤثر على الاختبار لذلك ينبغي حذف الاسئلة الصعبة او السهلة لرفع ثبات الاختبار .
5- حالة الفرد : يتأثر الثبات بحالة الفرد النفسية والصحية ومدى تدربه على الموقف الاختباري فالمرض والتعب والتوتر الانفعالي قد يؤدي الى نقصان الثبات .
6- ظروف اجراء الاختبار ان أي تغيير في الظروف الخاصة بإجراء القياس من اختبار لآخر يؤثر على نتائج المقياس ويحد من عوامل الخطأ الذي يؤثر في ثبات الاختبار . 
7- موضوعية الاختبار : تعد موضوعية التصحيح من بين العوامل المؤثرة في ثبات لاختبار وعلى الاخص في الاختبارات التي تعتمد على تقدير المصحح كاختبارات المقال التحصيلية واختبارات الابداع حيث ان تباين التصحيح يؤثر في زيادة تباين الخطأ وبالتالي الى نقصان معامل الثبات
8- التخمين: يلجأ بعض من المفحوصين في حالة عدم تأكدهم من الاجابة الصحيحة الى التخمين مما يؤدي الى خفض ثبات الاختبار حيث زيادة اثر التخمين يقود الى نقص الثبات .
9- تباين العينة وتجانسها يرتبط الثبات بتباين الاختبار فينقص ثبات الاختبار عندما ينقص التباين ويزداد تبعا لزيادة التباين وبما ان الافراد في درجات الاختبار فالسهولة والصعوبة تؤديان الى التجانس وبالتاي الى خفض الثبات والاسئلة المتدرجة في الصعوبة تؤدي الى رفع الثبات .
8-الدرجات وطرائق الاستفادة منها.
1-      الدرجة المعيارية:
يحصل المعلم على نتائج متباينة من خلال اجراء الاختبارات التحصيلية التي يجربها على طلابه ،او على علامات او تقديرات كمية تحدد بشكل يبين مقدار ما يستحقه الطالب على ذلك الاختبار كما تعد العلامة التي يحصل عليها الطالب العلامة الخام.
   ولا نستطيع ان نقارن بين علامة طالب في مادة تحصيلية بمادة اخرى كما لا نستطيع مقارنة علامة الطالب بغيره من الطلاب ويعزى ذلك لاختلاف ظروف اجراء الامتحان وطبيعة المادة نفسها ومتغيرات اخرى تؤثر على اداء الطالب للاختبار لذلك يلجا الاحصائيون الى استعمال قوانين رياضية وطرق احصائية مختلفة تمكنهم من اجراء المقارنات سواء بين علامات الطالب وزملائه او بين علامات الطالب نفسه في المواد الدراسية المختلفة.
من خلال هذه الطرق الاحصائية والقوانين الرياضية يستطيع المعلم ان يتعرف على مركز الطالب بالنسبة لغيره من الطلبة كما انه يستطيع ان يقارن مستوى العلامات التي حصل عليها الطالب بموضوعات مختلفة وهذا يساعد على اجراء مقارنات صحيحة مستندين في ذلك على الانحراف المعياري والمتوسط والوسيط والمنوال والعلامة التي يحصل عليها الطالب يطلق عليها اسم العلامة الخام واليك مثال يوضح ذلك:
   حصل احمد على (99) من (100)في مادة الرياضيات فهذه العلامة هي علامة خام لانستطيع مقارنتها بعلامات طالب اخر في الرياضيات على سبيل المثال من الصف نفسه او في مدرسة ثانية وهذا يعزى لاختلاف الاسئلة والجو الدراسي وظرف الاختبار لذلك لابد هنا من ان نلجأ الى استعمال الطرق الاحصائية كاستخراج الدرجة المعيارية ممثلا ذلك في استعمال المعادلة التالية :

الدرجة المعيارية =العلامة الخام –المتوسط
الانحراف المعياري

وتمتاز الدرجة المعيارية عن غيرها من الطرق الاحصائية الاخرى بانها تحول العلامة الخام الى علامة قابلة للمقارنة مع الطلبة الاخرين في مدارس اخرى وشعب اخرى
   والدرجة المعيارية هي العلامة التي يحصل عليها الطالب في الامتحان (العلامة الخام) محولة الى درجات تشكل منحى التوزيع الطبيعي بحيث تكون قابلة للمقارنة .
مثال :حصل طالب على علامة (19)في اللغة الانكليزية وعلى (19)في اختبار الرياضيات فاذا كان متوسط علامات الاختبارين (15)بينما الانحراف المعياري لاختبار اللغة العربية (7,9)ولاختبار الحساب (2.5)في أي المادتين كان مستوى الطالب افضل .
الحل:الدرجة المعيارية في اختبار اللغة الانكليزية =س  -  م=19-15     =0،53
                                             ع                        7،5
الدرجة المعيارية في اختبار الرياضيات=19-15         =1،60
                                               2,5
عيوب الدرجة المعيارية:
1-قد تكون الدرجة سالبة مثل (-5)او0،6) وهذا بدوره لن يكون مقنعا في حالة الاستفسار من قبل اولياء الامور او الاخرين الذين يجهلون هذه العملية .
2-قد تنخفض الدرجات المعيارية اقل مو واحد صحيح مثل (0,05) وهذا بدوره ليس مقنعا لولي امر الطالب.
ويمكن التخلص من هذه العيوب كالاتي:
1-      ضرب العدد في (10)
2-      التخلص من الكسور
3-      جمع العدد مع العلامة التي تفصل النجاح بالكسور.
2-الميئيات:
تعرف الميئيات في مجال الاحصاء الوصفي بانها مجموعة النقاط التي تقسم علامات الطالب الى اجزاء مئوية كما ان المئين يختلف عن الرتبة المئينية فالرتبة المئينية لعلامة طالب ما في صف دراسي تدل على نسبة الطلاب المئوية الذي حصلوا على علامة اقل من علامته اما المئين فيمثل العلامة المقابلة للرتبة الميئية فاذا كان ترتيب احمد الخامس من بين خمسين طالبا فهذا يعنى ان يسبق في علامته خمسة واربعين طالبا ،اي رتبة الميئنية45 x100=90%ونسبة (90%)من
               50
الطلبة الذين هم ضمن اطاره الصفي ويرمز للمئين عادة بالرمز (م) مع اضافة رقم يدل على النقطة المعينة ،فمثلا (م15) تعني الخامس عشر
مثال :اذا كان ترتيب علاء هو الثالث من بين (40) طالب فما هي رتبته المئينية؟
الحل:نقول عدد الطلبة الذين سبقهم علاء
40-3=37 طالبا يسبقهم علاء
الرتبة المئينية = عدد الطلبة الذين سبقهم x   100=37x  100=92.5%
                      عدد الطلبة الكلي                  40
         طرائق تفسير الدرجات.
تؤخذ   عدة طرق لتفسير العلامات التي يحصل عليها الطالب من خلال الاختبار المقدم له باعتبار ان العلامة الخام لايمكن الاستناد عليها في الحكم على مستوى الطالب ومن هذه الطرق الاتي
1-      ترتيب العلامات واستخراج رتبة الطالب بالطريقة البسيطة وتقوم هذه الطريقة على استخراج معدل الطالب بجميع العلامات وبقسمتها على عددها وبالتالي فان ترتيب المعدلات واعتبار اعلى معدل هو الاول فالثاني فالثالث فالرابع وهكذا .
مثال:حصل احمد وعلاء وخالد على المعدلات التالية (85)و(95) و(84) بالترتيب فيكون بذلك اعلى معدل هو (95) اي الاول و(85) الثاني و(84) الثالث.
2-      الرتبة المئينية ويمكن تفسير العلامات التي حصل عليها الطلبة من خلال استخدام الرتبة المئينية التي تعتمد على ترتيب علاماتهم وتسلسها يمكن استخراج النسبة المئوية ومن ثم الرتبة المئينية
بواسطة القانون الاتي :
رت= 100 – (100xت)-50
                       ن
رت= الرتبة المئينية المطلوبة
ن=عدد الطلبة
ت=ترتيب الطالب التكراري
مثال :حصلت مجموعة من الطلاب على العلامات التحصيلية التالية والمطلوب منك استخراج الرتبة الميئينية لكل طالب علما ان عدد الطلاب في الصف (20)طالب.
العلامات       الترتيب
90     1
80     2
71     3
الرتبة الميئنيةللاول=100- (100x1)-50 =100-0،2=97.5%
                                      20
الرتبة الميئينية للثاني=100- (100x2)-50 =100-0،7=92،5%
                                      20
100الرتبة الميئينية للثالث= - (100x3)-50 =100-12،5=87،5%
20