สรุปการแปลผลการวิเคราะห์ข้อสอบ

ดูรายละเอียดเพิ่มเติมได้ที่ http://lily.bu.ac.th/~wathna.s/item.htm

 

สถิติที่สำคัญได้แก่ 1. ดัชนีความยากง่าย (P) 2. ดัชนีอำนาจจำแนก (R) และ 3. ดัชนีความเที่ยง

 

1. ดัชนีความยากง่าย P=(อาจคูณด้วย 100 ทำเป็นค่าร้อยละ) แปลความได้ดังนี้

 

P (ดูช่อง DIFFICULTY INDICE ชนิด TOTAL)

ระดับ

การตัดสินใจ *

0.00 – 0.19

ยากมาก

ควรปรับปรุง

0.20 – 0.39

ค่อนข้างยาก

เหมาะสม

0.40 – 0.59

ปานกลาง

เหมาะสม

0.60 – 0.80

ค่อนข้างง่าย

เหมาะสม

0.81 –1.00

ง่ายมาก

ควรปรับปรุง

* คุณภาพของข้อสอบให้ดูที่ค่า R เป็นหลัก โดย R จะต้องมีค่าไม่น้อยกว่า 0.20 จึงจะถือว่าใช้ได้

 

2. ดัชนีอำนาจจำแนก R =  แปลความดังนี้

 

R (ดูช่อง DISC. INDEX)

ระดับการจำแนก

การตัดสินใจ

น้อยกว่า 0.00

ติดลบ (คนเก่งตอบถูกน้อยกว่าคนอ่อน)

ควรตัดทิ้ง หรือแก้ไข

0.00 – 0.19

ต่ำ (คนเก่งคนอ่อนตอบถูกใกล้เคียงกัน)

ควรแก้ไข

0.20 – 0.39

ปานกลาง

เก็บเข้าธนาคาร หรือแก้ไข

0.40 – 0.59

ดี

เก็บเข้าธนาคาร

0.60 –1.00

ดีมาก

เก็บเข้าธนาคาร

 

ค่า R ในตารางข้อ 2. ใช้สำหรับคำตอบถูก แต่ถ้าเป็นตัวลวงแล้วค่า R จะต้องติดลบ โดยตัวลวงที่ใช้ได้ควรมีค่าน้อยกว่าลบ 0.05 (เช่น -0.07, -0.13, -0.26 เป็นต้น) หมายถึง คนอ่อนตอบตัวลวงมากกว่าคนเก่ง ซึ่งเป็นไปตามจุดประสงค์ของการเขียนตัวลวง ดังนั้น ตัวลวงตัวใดที่มีค่า 0 หรือบวก (คนเก่งตอบตัวลวงมากกว่าคนอ่อน) ก็ควรปรับปรุงตัวนั้น

 

3. ดัชนีความเที่ยงของแบบทดสอบ (Reliability)

ให้ดูที่ KR20 หรือ CRONBACH ALPHA ซึ่งควรมีค่าอย่างน้อย 0.70 โดยแบบทดสอบชุดใดก็ตามที่ดัชนีความเที่ยงมีค่าต่ำกว่านี้ แบบทดสอบชุดนั้นจะขาดความน่าเชื่อถือ หรือมีคุณภาพต่ำนั่นเอง ทำให้คะแนนความคลาดเคลื่อน (SEM) มีค่ามาก ส่งผลทำให้เกรดมีคุณภาพต่ำตามไปด้วย