ความคลาดเคลื่อนมาตรฐานในการวัดค่า

Standard Error of Measurement: SEM

 

ผู้ช่วยศาสตราจารย์วัฒนา สุนทรธัย

________________________

 

บทคัดย่อ

            ภาระงานหลักอย่างหนึ่งของคณาจารย์สายวิชาการคือ การออกข้อสอบ และการวิเคราะห์ข้อสอบ โดยการวิเคราะห์ข้อสอบจะทำให้คณาจารย์ทราบคุณภาพของข้อสอบ ซึ่งมีทั้งคุณภาพรายข้อและคุณภาพโดยรวม ตัวบ่งบอกอย่างหนึ่งของคุณภาพโดยรวมคือความคลาดเคลื่อน ถ้าข้อสอบมีคุณภาพแล้ว ความคลาดเคลื่อนในการวัดค่าจะไม่มีหรือมีค่าต่ำ ซึ่งความคลาดเคลื่อนดังกล่าวเป็นที่รู้จักกันดีในหมู่นักวัดผล แต่ผู้ที่ไม่เคยศึกษาวิชาเกี่ยวกับการวัดและประเมินผล อาจไม่ทราบว่าเราสามารถวัดค่าของความคลาดเคลื่อนได้อย่างไร ในบทความนี้จึงได้ให้ความหมายของความคลาดเคลื่อน ที่มาของความคลาดเคลื่อน และวิธีการวัดค่าความคลาดเคลื่อน และเมื่อผู้อ่านอ่านบทความนี้จบแล้ว จะสามารถเข้าใจได้ว่า ความรู้ความเข้าใจในเรื่องการวิเคราะห์ข้อสอบ จะมีส่วนสำคัญในการทำให้แบบวัดมีความคลาดเคลื่อนลดลง

 

Abstract

One of the major responsibilities of faculty members is to create high-quality examinations.  Using analytical tools, instructors can assess the quality of each question or the overall exams.  Standard Error of Measurement (SEM) is the main indicator for quality of examinations.  Less SEM suggests that the examination is high quality.  Although SEM is well-known among evaluation experts, this concept is still uncommon for other scholars.  This article, therefore, provides explanation of SEM, including its meaning, derivation, and methodology.  After the readers finish reading this article, they will realize that understanding of SEM is very helpful in designing and creating high-quality examinations.

 

 

ดูเทคนิคการวิเคราะห์ข้อสอบได้ที่

http://tulip.bu.ac.th/~wathna.s/item.htm

 

 

ความปรารถนาสูงสุดในการเขียนข้อสอบของคณาจารย์ทุกท่าน คือ ความเที่ยง (reliability) และความตรง (validity) ของแบบวัด หรือแบบทดสอบ (แบบวัด/ แบบทดสอบ หมายถึง ชุดของคำถามรายข้อ)

ความเที่ยง แสดงถึง คุณภาพของแบบวัดที่สามารถวัดค่าออกมาได้อย่างไม่มีความคลาดเคลื่อน ไม่ว่าผู้สอบจะสอบเวลาใดก็ตาม ถ้าหากไม่มีการเรียนรู้เพิ่มเติมแล้ว คะแนนสอบจะมีค่าเท่าเดิมเสมอ

ความตรง มีอยู่ด้วยกันหลายชนิด แต่ในเรื่องการวัดผลสัมฤทธิ์ทางการศึกษาแล้ว เราเน้นที่ความตรงเชิงเนื้อหา แบบวัดที่มีความตรงเชิงเนื้อหาคือ แบบวัดที่วัดความรู้ได้คลุมเนื้อหาของหลักสูตรที่เรียน การจะออกข้อสอบให้มีความตรงเช่นนี้ได้นั้น ผู้ออกข้อสอบจะต้องดำเนินการตามแผ่นพิมพ์เขียว (blueprint) หรือ ตารางวิเคราะห์หลักสูตร (specification table) แล้วแต่จะเรียก

            ในบทความเรื่องนี้ ผู้เขียนได้พัฒนาตัวอย่างของแบบวัดที่มีความเที่ยงสมบูรณ์ (ดัชนีวัดค่าเป็น 1 ดังตัวอย่าง 1 และ 3) เพื่อให้ผู้อ่านมองเห็นว่าผลการทำข้อสอบที่มีความเที่ยงอย่างนี้จะมีลักษณะอย่างไร และแบบวัดที่ดัชนีความเที่ยงมีค่าน้อยกว่า 1 (ดังตัวอย่าง 2 และ 4) เพื่อให้ผู้อ่านมองเห็นความแตกต่างของแบบวัดทั้งสองชนิด เมื่ออ่านจบแล้ว ผู้อ่านจะทราบว่าองค์ประกอบที่มีผลต่อความเที่ยงมีอะไรบ้าง และมีความเข้าใจว่าแบบวัดยิ่งมีความเที่ยงมากเพียงใด ความคลาดเคลื่อนก็ยิ่งมีค่าน้อยมากเพียงนั้น สำหรับแบบทดสอบที่มีทั้งความเที่ยงและความตรง ถ้ามีเทคนิคการตัดเกรดที่เหมาะสมแล้ว จะทำให้เกรดมีคุณภาพ ซึ่งจะส่งผลให้บัณฑิตมีคุณภาพในที่สุด และ ตัวบ่งชี้ที่ใช้วัดความคลาดเคลื่อนของแบบทดสอบ เรียกว่า ความคลาดเคลื่อนมาตรฐานในการวัดค่า สูตรที่ใช้คือ SEM = S เมื่อ S คือ ส่วนเบี่ยงเบนมาตรฐาน และ rtt คือ ความเที่ยงของแบบวัด  

 

 

ดูเทคนิคการตัดเกรดได้ที่ 

http://tulip.bu.ac.th/~wathna.s/grading/grade1.htm

 

 

*   การวิเคราะห์สูตรความคลาดเคลื่อนมาตรฐานในการวัดค่า

 

หากวิเคราะห์จากสูตร SEM = S จะพบว่า ถ้าแบบวัดมีความเที่ยงสมบูรณ์ (rtt=1) แล้ว เราสามารถวัดค่าได้อย่างไม่มีความคลาดเคลื่อน (SEM=0) ในทางกลับกัน ถ้าแบบวัดไม่มีความเที่ยง (rtt=0) แล้ว จะได้ความคลาดเคลื่อนมาตรฐานในการวัดค่าเท่ากับ S ดังนั้น ความคลาดเคลื่อนมาตรฐานในการวัดค่าจึงมีค่าอยู่ระหว่าง 0 กับ S

 

*   องค์ประกอบที่มีผลต่อความเที่ยง

 

องค์ประกอบสำคัญที่มีผลต่อความเที่ยงของข้อสอบแบบเลือกตอบ คือ อำนาจจำแนกของข้อสอบ และจำนวนข้อของแบบวัด โดยถ้าหากเพิ่มจำนวนข้อให้มากขึ้นแล้ว ความเที่ยงใหม่จะเพิ่มขึ้นเป็นดังนี้

 

 

เมื่อ  = ความเที่ยงค่าใหม่  n = จำนวนข้อสอบชุดใหม่

= ความเที่ยงค่าเดิม  k = จำนวนข้อสอบชุดเดิม

 

สมมุติว่าเดิมมีข้อสอบจำนวน 5 ข้อ (k = 5) ซึ่ง  = 0.67 ถ้าเพิ่มจำนวนข้อสอบเป็น 15 ข้อ (n = 15) แล้ว จะได้ดัชนีความเที่ยงค่าใหม่ () ดังนี้

 

 โดย

 

*   สิ่งที่มีผลต่ออำนาจจำแนกของข้อสอบรายข้อ

 

สิ่งที่มีผลต่ออำนาจจำแนกของข้อสอบรายข้อ คือ ความชัดเจนของคำถาม ความยากง่ายที่เหมาะสม ประสิทธิภาพของตัวลวง และความเป็นปกติของกลุ่มที่สอบ วิธีที่ใช้ในการวัดความเที่ยงมีอยู่ด้วยกันหลายวิธี อาทิ วิธีทดสอบซ้ำ วิธีคูเดอร์-ริชาร์ดสัน วิธีเชิงคล้ายกัน วิธีแบ่งครึ่ง วิธีครอนบาช เป็นต้น ในที่นี้จะแสดงวิธีคำนวณความเที่ยงทั้งแบบวัดที่คำตอบมีค่าจาก 1 ถึง 5 โดยใช้วิธีครอนบาช และแบบวัดที่คำตอบมีค่า 1 หรือ 0 โดยใช้วิธีคูเดอร์-ริชาร์ดสัน


 

Cronbach's alpha

            ดัชนีวัดความเที่ยงของครอนบาชมาจากการทดสอบเพียงครั้งเดียว จึงเรียกดัชนีเช่นนี้ว่า ความคงเส้นคงวาภายใน (internal consistency) สูตรของครอนบาชใช้ได้ทั้งข้อสอบแบบเลือกตอบ (คือมีคะแนนรายข้อเป็น 1 หรือ 0) และแบบวัดความคิดเห็น แบบวัดความรู้สึก หรือแบบวัดทางจิตวิทยาโดยทั่วไปที่มีคะแนนเต็มเท่ากัน เช่น มาตรวัดแบบลิเคิร์ท (Likert scale) ซึ่งเป็นมาตรวัดชนิดประมาณค่าจากค่าน้อยที่สุดถึงค่ามากที่สุด มาตรวัดแบบประมาณค่าที่พบเห็นได้บ่อยคือ แบบวัดชนิด 5 ระดับ โดยให้ 1 = น้อยที่สุด            2 = น้อย  3 = ปานกลาง  4 = มาก 5 = มากที่สุด

สูตรครอนบาชแอลฟาคือ Cronbach a =  

            k = จำนวนข้อของแบบวัด

            = ความแปรปรวน (variance) ของข้อ i

            = ความแปรปรวนของคะแนนรวม หรือความแปรปรวนระหว่างผู้ตอบ

 

เพื่อให้เข้าใจความหมายของดัชนีตัวนี้มากยิ่งขึ้น จะแสดงตัวอย่างทั้งแบบวัดที่มีความเที่ยงสมบูรณ์ และแบบวัดที่มีความเที่ยงไม่สมบูรณ์ สมมุติว่ามีแบบวัดทางจิตวิทยาชุดหนึ่ง ซึ่งวัดในเรื่องเดียวกัน โดยมีคำถาม 5 ข้อ และมีผู้ตอบ 6 คน ผลการตอบของแต่ละคนปรากฏดังตาราง 1

 


ตัวอย่าง 1 แบบวัดที่มีความเที่ยงสมบูรณ์ (rtt = 1)

                                                               คำถาม 5 ข้อ (k = 5)

ผู้ตอบ 6 คน (n = 6)

ข้อ 1

ข้อ 2

ข้อ 3

ข้อ 4

ข้อ 5

คะแนนรวม

คนที่ 1

3

3

3

3

3

15

คนที่ 2

4

4

4

4

4

20

คนที่ 3

2

2

2

2

2

10

คนที่ 4

5

5

5

5

5

25

คนที่ 5

1

1

1

1

1

5

คนที่ 6

2

2

2

2

2

10

17

17

17

17

17

85

59

59

59

59

59

1,475

1.81

1.81

1.81

1.81

1.81

 

 


            การคำนวณ

            ข้อ 1: =   =   = 1.81

             ในที่นี้   =  =  =  =  = 1.81 ดังนั้น  = 5´1.81  = 9.05

=  =   = 45.14

rtt  หรือ Cronbach a คือa =   =   = 1

ดังนั้น SEM = Sp = Sp  = 0

 

การแปลความ

แบบวัดนี้มีความเที่ยงสมบูรณ์ (rtt=1) จึงมีความคลาดเคลื่อนมาตรฐานในการวัดค่าเท่ากับศูนย์ (SEM=0) นั่นคือ ไม่มีความคลาดเคลื่อนมาตรฐานในการวัดค่า

 

*   ข้อสังเกต

 

โปรดสังเกตว่า ผู้ตอบแต่ละคนตอบข้อใดข้อหนึ่งเหมือนกัน เช่น คนที่ 1 ตอบทุกข้อในระดับ 3, คนที่ 2 ตอบทุกข้อในระดับ 4 เป็นต้น เพราะคำถามแต่ละข้อวัดในเรื่องเดียวกัน ดังนั้น เมื่อผู้ตอบมีความคิดเห็นในข้อใดข้อหนึ่งในระดับใดแล้ว ข้อที่เหลือก็มีความคิดเห็นในระดับนั้นด้วย คนอื่น ๆ ก็มีลักษณะเดียวกันนี้ ซึ่งเป็นสมบัติของแบบวัดที่มีความเที่ยงสมบูรณ์

            คำถามในตัวอย่าง 1 ถ้าเป็นข้อสอบที่มีคะแนนเต็มข้อละ 5 คะแนนแล้ว แสดงว่าผู้สอบคนที่ 1, 2, 3, 4, 5, 6 ได้คะแนนเท่ากับ 15, 20, 10, 25, 5, 10 ตามลำดับ โดยคะแนนที่แต่ละคนได้นี้แสดงถึงความสามารถที่แท้จริงของผู้สอบ เพราะแบบวัดไม่มีความคลาดเคลื่อน ซึ่งมีค่าเฉลี่ยเท่ากับ 14.17 คะแนน และค่าเบี่ยงเบนมาตนฐานเท่ากับ 6.72 คะแนน ถ้านำคะแนนที่ได้นี้ไปใช้ในการตัดเกรด และมีเทคนิคการตัดเกรดที่ยุติธรรมแล้ว ผลของการตัดเกรดจะไม่มีความคลาดเคลื่อน ซึ่งแสดงถึงคุณภาพของเกรด

            ถ้าข้อสอบหรือแบบสอบถามข้อใดข้อหนึ่งหรือหลายข้อมีปัญหาแล้ว ความเที่ยงจะมีค่าน้อยกว่า 1 และความคลาดเคลื่อนมาตรฐานในการวัดจะมีค่ามากกว่าศูนย์ นั่นคือ มีความคลาดเคลื่อนมาตรฐานในการวัดค่า ดังตัวอย่าง 2

 

ตัวอย่าง 2 แบบวัดที่มีความเที่ยงไม่สมบูรณ์ (rtt = 0.80)

                                                               คำถาม 5 ข้อ (k = 5)

ผู้ตอบ 6 คน (n = 6)

ข้อ 1

ข้อ 2

ข้อ 3

ข้อ 4

ข้อ 5

คะแนนรวม

คนที่ 1

3

2

3

3

3

14

คนที่ 2

4

2

4

4

4

18

คนที่ 3

2

3

2

2

2

11

คนที่ 4

5

2

5

5

5

22

คนที่ 5

1

3

1

1

1

7

คนที่ 6

2

5

2

2

2

13

 


            การคำนวณ คำนวณแบบเดียวกันกับตัวอย่าง 1 ได้ Cronbach a = 0.80, S = 4.81 และ 

 

               SEM = S = 4.81  = 2.15

 

การแปลความ

            แบบวัดนี้มีความเที่ยงเท่ากับ 0.80 และมีความคลาดเคลื่อนมาตรฐานในการวัดค่าเท่ากับ 2.15 คะแนน

 

*   สาเหตุที่ทำให้ความเที่ยงลดลง

 

โปรดสังเกตว่า ตัวเลขในตัวอย่าง 2 นำมาจากตัวเลขในตัวอย่าง 1 เพียงแต่ข้อ 2 มีผู้ตอบแตกต่างจากตัวอย่าง 1 โดยคนที่ 1 ตอบข้อ 2 ในระดับ 2 และตอบข้ออื่นๆในระดับ 3, คนที่ 5 ตอบข้อ 2 ในระดับ 3 และตอบข้ออื่นๆในระดับ 1 คนอื่นๆก็ตอบในลักษณะเดียวกัน กล่าวคือ ตอบทุกข้อเหมือนกัน ยกเว้นข้อ 2 แสดงว่าข้อ  2 มีปัญหา โดยปัญหาดังกล่าวอาจเกิดจากหลายกรณีด้วยกัน อาทิ ถ้าข้อ 2 เป็นแบบวัดความคิดเห็นแล้ว ข้อนี้อาจมีคำถามที่ไม่ชัดเจน หรืออาจวัดเรื่องอื่นที่แตกต่างจาก 4 ข้อที่เหลือ หรืออาจมีคำถามเป็นเชิงลบในขณะที่ข้ออื่นๆมีคำถามเป็นเชิงบวก ถ้าข้อ 2 เป็นข้อสอบแบบอัตนัยแล้ว ข้อนี้อาจมีธงคำตอบที่ไม่ชัดเจน เป็นต้น แบบวัดในตัวอย่าง 2 ถ้าตัดข้อ 2 ออกไปแล้วความเที่ยงจะมีค่าเท่ากับ 1 และมีความคลาดเคลื่อนมาตรฐานในการวัดเท่ากับ 0 แบบเดียวกับตัวอย่าง 1

 

 

ดูตัวอย่างข้อสอบที่มีปัญหาได้ที่

http://tulip.bu.ac.th/~wathna.s/problem.ppt

 

 

*   คะแนนแท้จริง

 

ผลการตอบในตัวอย่าง 2 ถ้าเป็นข้อสอบซึ่งมีคะแนนเต็มข้อละ 5 คะแนนแล้ว ผู้สอบคนที่ 1, 2, 3, 4, 5, 6 จะได้คะแนนเท่ากับ 14, 18, 11, 22, 7, 13 ตามลำดับโดยคะแนนที่แต่ละคนได้นี้มีความคลาดเคลื่อนเท่ากับ 2.15 คะแนน หมายความว่า ถ้านายสมชายทำข้อสอบในตัวอย่าง 2 ได้ 20 คะแนนแล้ว คะแนนที่แท้จริงของนายสมชายคือ 20 ± 2.15 หรือ ระหว่าง 17.85 - 22.15 คะแนน นั่นคือ ถ้าคะแนนมีการแจกแจงปกติแล้ว จะมีโอกาส 2 ใน 3 ที่นายสมชายจะได้คะแนนอยู่ในช่วง 17.85 - 22.15 คะแนน ถ้านำคะแนนที่ได้นี้ไปใช้ในการตัดเกรดแล้ว ผลการตัดเกรดจะมีความคลาดเคลื่อน โดยเฉพาะเกรดที่อยู่ในช่วงรอยต่อระหว่าง 2 ช่วงที่อยู่ติดกัน ยิ่งความคลาดเคลื่อนมีค่ามากเพียงใด คุณภาพของเกรดก็ยิ่งลดน้อยลงมากเพียงนั้น

 

Kuder-Richardson 20 (KR-20)

            สูตรของคูเดอร์-ริชาร์ดสัน 20 คำนวณจากสัดส่วนของการตอบถูกหรือผิด จึงใช้ได้เฉพาะข้อสอบที่มีคะแนนเป็น 1, 0 เท่านั้น สูตรของคูเดอร์-ริชาร์ดสัน 20 คือ

            KR-20 =

k = จำนวนข้อของแบบวัด

            pi, qi = สัดส่วนของการตอบถูกและผิดของข้อ i ตามลำดับ

            = ความแปรปรวนของคะแนนรวม หรือ ความแปรปรวนระหว่างผู้ตอบ

 

สมมุติว่ามีข้อสอบแบบเลือกตอบชุดหนึ่งซึ่งวัดในเรื่องเดียวกัน โดยมีคำถาม 5 ข้อ และมีผู้ตอบ 6 คน ผลการตอบของแต่ละคนปรากฏดังตารางต่อไปนี้


 

ตัวอย่าง 3 ข้อสอบแบบเลือกตอบที่มีความเที่ยงสมบูรณ์ (rtt = 1)

                                                               คำถาม 5 ข้อ (k = 5)

ผู้ตอบ 6 คน (n = 6)

ข้อ 1

ข้อ 2

ข้อ 3

ข้อ 4

ข้อ 5

คะแนนรวม

คนที่ 1

1

1

1

1

1

5

คนที่ 2

1

1

1

1

1

5

คนที่ 3

1

1

1

1

1

5

คนที่ 4

0

0

0

0

0

0

คนที่ 5

1

1

1

1

1

5

คนที่ 6

0

0

0

0

0

0

ตอบถูก

4

4

4

4

4

= 20

ตอบผิด

2

2

2

2

2

= 100

pi

0.667

0.667

0.667

0.667

0.667

 

qi

0.333

0.333

0.333

0.333

0.333

 

piqi

0.222

0.222

0.222

0.222

0.222

= 1.11

 


=  =  = 5.55

            KR-20 =   =    = 1

 


การแปลความ

            แบบวัดนี้มีความเที่ยงสมบูรณ์ (KR-20: rtt = 1) จึงมีความคลาดเคลื่อนมาตรฐานในการวัดค่าเท่ากับศูนย์ (SEM = 0) นั่นคือ ไม่มีความคลาดเคลื่อนมาตรฐานในการวัดค่า

 

*   ความสามารถที่แท้จริงของผู้สอบ

 

โปรดสังเกตว่า ผู้ตอบแต่ละคนตอบข้อใดข้อหนึ่งเหมือนกัน เช่น คนที่ 1, 2, 3 และ 5 ตอบข้อถูกทุกข้อ, คนที่ 4 และ 6 ตอบข้อผิดทุกข้อ เพราะคำถามแต่ละข้อวัดในเรื่องเดียวกัน ดังนั้น เมื่อตอบข้อใดถูก ข้อที่เหลือก็ตอบถูกด้วย หรือเมื่อตอบข้อใดผิดข้อที่เหลือก็ตอบผิดด้วย ผู้สอบคนที่ 1, 2, 3, 4, 5, 6 ได้คะแนนเท่ากับ 5, 5, 5, 0, 5, 0 ตามลำดับ โดยคะแนนที่แต่ละคนได้นี้แสดงถึงความสามารถที่แท้จริงของผู้สอบ เพราะแบบวัดไม่มีความคลาดเคลื่อน แสดงว่าข้อสอบได้มาตรฐานทุกข้อ คนเก่งทำได้ และคนอ่อนทำไม่ได้ แต่ถ้าข้อสอบข้อใดข้อหนึ่งหรือหลายข้อมีปัญหาแล้ว ความเที่ยงจะมีค่าน้อยกว่า 1 ดังตัวอย่าง 4


ตัวอย่าง 4 ข้อสอบแบบเลือกตอบที่มีความเที่ยงไม่สมบูรณ์ (rtt = 0.67)

                                                               คำถาม 5 ข้อ (k = 5)

ผู้ตอบ 6 คน (n = 6)

ข้อ 1

ข้อ 2

ข้อ 3

ข้อ 4

ข้อ 5

คะแนนรวม

คนที่ 1

1

1

0

1

1

4

คนที่ 2

1

1

0

1

1

4

คนที่ 3

1

0

1

1

1

4

คนที่ 4

0

0

1

0

0

1

คนที่ 5

1

1

1

1

1

5

คนที่ 6

0

0

1

0

0

1

ตอบถูก

4

3

4

4

4

= 19

ตอบผิด

2

3

2

2

2

= 75

pi

0.667

0.500

0.667

0.667

0.667

 

qi

0.333

0.500

0.333

0.333

0.333

 

piqi

0.222

0.250

0.222

0.222

0.222

= 1.14

=  =  = 2.47, Sp = 1.57

            KR-20 =   =    = 0.67

การแปลความ

            แบบวัดนี้มีความเที่ยงเท่ากับ 0.67 และมีความคลาดเคลื่อนมาตรฐานในการวัดค่าคือ

 

SEM = S = 1.57  = 0.90

 

*   ข้อสังเกต

 

โปรดสังเกตว่า ตัวเลขในตัวอย่าง 4 นำมาจากตัวอย่าง 3 แต่ผลการตอบในข้อ 2 และ 3 เปลี่ยนแปลงไป แสดงว่าสองข้อนี้มีปัญหา ทำให้วัดค่าได้ผิดจากความเป็นจริง เช่น คนที่ 1 เคยได้คะแนนเต็ม 5 ในตัวอย่าง 3 แต่เมื่อทำแบบทดสอบในตัวอย่าง 4 แล้วได้คะแนน 4 และคนที่ 6 เคยได้คะแนน 0 ในตัวอย่าง 3 แต่เมื่อทำแบบทดสอบในตัวอย่าง 4 แล้วได้คะแนน 1 เป็นต้น เมื่อคำนวณค่าความคลาดเคลื่อนมาตรฐานในการวัดค่าแล้วจะมีค่าเท่ากับ 0.90 ถ้าตัดข้อ 2 และ 3 ออกจากแบบวัดนี้แล้ว จะทำให้แบบวัดนี้มีความเที่ยงเท่ากับ 1 ซึ่งจะมีผลทำให้ความคลาดเคลื่อนมาตรฐานในการวัดค่าเป็น 0  แบบเดียวกับตัวอย่าง 3

            ข้อสอบหรือแบบสอบถามที่คำตอบมีค่าเป็น 1 หรือ 0 สามารถใช้ได้ทั้งสูตร Cronbach a และ KR-20 แต่ข้อสอบหรือแบบสอบถามที่คำตอบมีค่าเป็น 1 ถึง 5 ไม่สามารถใช้สูตร KR-20 ได้ เช่น จากตัวอย่าง 4 ถ้าใช้สูตร Cronbach a แล้วจะได้ความเที่ยงเท่ากับ 0.67 เช่นเดียวกับสูตร KR-20 ดังตัวอย่าง 5


 

ตัวอย่าง 5 ตัวเลขชุดเดียวกันกับตัวอย่าง 4

                                                               คำถาม 5 ข้อ (k = 5)

ผู้ตอบ 6 คน (n = 6)

ข้อ 1

ข้อ 2

ข้อ 3

ข้อ 4

ข้อ 5

คะแนนรวม

คนที่ 1

1

1

0

1

1

4

คนที่ 2

1

1

0

1

1

4

คนที่ 3

1

0

1

1

1

4

คนที่ 4

0

0

1

0

0

1

คนที่ 5

1

1

1

1

1

5

คนที่ 6

0

0

1

0

0

1

4

3

4

4

4

19

4

3

4

4

4

75

0.222

0.250

0.222

0.222

0.222

 

 


            การคำนวณ

                        ข้อ 1: =  =   = 0.222

                        ข้อ 2: =   =  = 0.250

                        ในที่นี้  =  =  = = 0.222  ดังนั้น  =  +  +  +  +  = 1.14

                =   =  = 2.47

                        Cronbach a =  =  = 0.67

 

          หมายเหตุ

1.      เราสามารถพิสูจน์ได้ว่า ถ้าคำตอบมีค่า 1 หรือ 0 แล้ว Cronbach a = KR-20 ดังนี้

ถ้าคำตอบมีค่า 1 หรือ 0 แล้วจะได้

และ  =   =    =

              =  =    = p(1-p)  = pq

              ทำให้  และ Cronbach a =   =   = KR-20

ดังนั้น Cronbach a = KR-20 เมื่อคำตอบมีค่า 1 หรือ 0

 

2. ถ้าสัดส่วนของการตอบถูกแต่ละข้อมีค่าเท่ากันแล้ว KR-20 มีค่าเท่ากับ KR-21

 เมื่อ KR-21 =

แต่ถ้าสัดส่วนของการตอบถูกแต่ละข้อมีค่าไม่เท่ากันแล้ว KR-20 มีค่ามากกว่า KR-21

 

*   จากตัวอย่าง 3

สัดส่วนของการตอบถูกแต่ละข้อมีค่าเท่ากัน

 จะได้ KR-21 =   =   = 1

 

*   จากตัวอย่าง 4

สัดส่วนของการตอบถูกแต่ละข้อมีค่าไม่เท่ากัน

 จะได้ KR-21 =   =  = 0.66

 

ตัวอย่าง 3 สัดส่วนของการตอบถูกแต่ละข้อมีค่าเท่ากัน ทำให้ KR-20 มีค่าเท่ากับ KR-21 แต่ตัวอย่าง 4 สัดส่วนของการตอบถูกแต่ละข้อมีค่าไม่เท่ากัน ทำให้ KR-20 มีค่ามากกว่า KR-21 ยิ่งสัดส่วนของการตอบถูกแต่ละข้อแตกต่างกันมากเพียงใด KR-20 และ KR-21 ยิ่งแตกต่างกันมากเพียงนั้น ซึ่งข้อสอบโดยทั่วไปสัดส่วนของการตอบถูกแต่ละข้อมักแตกต่างกัน ดังนั้นสูตร KR-21 จึงไม่เหมาะที่จะนำไปใช้ แต่สามารถคำนวณได้สะดวกและรวดเร็วกว่า จึงเหมาะสำหรับการประมาณค่า KR-20

 

สรุป

องค์ประกอบสำคัญที่มีผลต่อความเที่ยงของข้อสอบแบบเลือกตอบ คือ อำนาจจำแนกของข้อสอบรายข้อ และจำนวนข้อของแบบวัด ถ้าข้อสอบมีคำถามที่ชัดเจน ความยากง่ายเหมาะสม ตัวลวงมีประสิทธิภาพ กลุ่มที่สอบมีความเป็นปกติ และจำนวนของข้อสอบมีมากพอแล้ว จะทำให้แบบวัดมีความเที่ยงสูง เมื่อแบบวัดมีความเที่ยงสูงแล้ว จะทำให้ความคลาดเคลื่อนมีค่าต่ำ เมื่อแบบวัดมีความคลาดเคลื่อนต่ำและมีเทคนิคการตัดเกรดที่ยุติธรรมแล้ว จะทำให้เกรดมีคุณภาพ เมื่อเกรดมีคุณภาพแล้ว จะส่งผลให้บัณฑิตมีคุณภาพตามไปด้วย การวิเคราะห์ข้อสอบเป็นเครื่องมืออันสำคัญที่จะทำให้ผู้สอนทราบว่าข้อสอบรายข้อมีคำถามที่ชัดเจนหรือไม่ ความยากง่ายเหมาะสมหรือไม่  ตัวลวงมีประสิทธิภาพหรือไม่  อำนาจจำแนกได้มาตรฐานหรือไม่ แบบวัดมีความเที่ยงอยู่ในระดับใด และความคลาดเคลื่อนมาตรฐานในการวัดค่ามีค่ามากน้อยเพียงใด

 

     บรรณานุกรม

 

ภาษาไทย

ราชบัณฑิตยสถาน.  ศัพท์คณิตศาสตร์. พิมพ์ครั้งที่ 6. กรุงเทพมหานคร: มหาจุฬาลงกรณ์ราชวิทยาลัย,  2538.

สุพัฒน์ สุกมลสันต์. การวิเคราะห์ข้อสอบแนวใหม่ด้วยคอมพิวเตอร์. กรุงเทพมหานคร:  วิทยพัฒน์, 2540.

เสริมศักดิ์ วิศาลาภรณ์ และเอนกกุล กรีแสง.  การประเมินผลการเรียนการศึกษา. กรุงเทพมหานคร:  อักษรสัมพันธ์, (...).

 

ภาษาอังกฤษ

Bloom, Benjamin S., Hasting, J. Thomas and  Madaus, Geoge F.   HANDBOOK ON FORMATIVE AND

          SUMMATIVE EVALUATION OF STUDENT LEARNING.  New York: McGraw-Hill, 1971.

Ebel, Robert L.  ESSENTIALS OF EDUCATIONAL MEASUREMENT. New Jersey: Prentice-Hall, 1979.

Gronlund, Norman E.  MEASUREMENT AND EVALUATION IN TEACHING. New York: Macmillan, 1978.

 

INTERNET

Glenn Meyer. Reliability and Validity. www.wadsworth.com/psychology_d/special_features/ext/workshops/reliability2.html.

Trinity University, N.D.

Reliability and Item Analysis. www.statsoftinc.com/textbook/streliab.html. StatSoft,1984-2003.