ความแม่นยำของโพลล์ (Poll)

 

                                โดย รองศาสตราจารย์วัฒนา สุนทรธัย

                                สำนักวิชาการ มหาวิทยาลัยกรุงเทพ

                                เมษายน 2549

 

                ส่วนที่เหมือนกันในเรื่องของการทำโพลล์และการวิจัยเชิงปริมาณ คือ กลุ่มตัวอย่างและเทคนิคการสุ่ม ถ้าจำนวนกลุ่มตัวอย่าง เทคนิคการสุ่ม การเก็บข้อมูล และการวิเคราะห์ข้อมูลมีความเหมาะสมแล้ว ผลลัพธ์ก็มีความน่าเชื่อถือ บทความนี้ต้องการเน้นองค์ประกอบที่ส่งผลต่อความแม่นยำของโพลล์ หลักการคำนวณจำนวนตัวอย่าง ตารางเลือกจำนวนตัวอย่าง การแปลความความเชื่อมั่น/ความคลาดเคลื่อน พร้อมด้วยตัวอย่างจริงของโพลล์ 2 แห่งที่ได้ผลลัพธ์ตรงกัน

                โพลล์ คือ การหยั่งเสียง หมายถึง การสำรวจความคิดเห็นของประชาชนต่อเรื่องใดเรื่องหนึ่ง ณ ช่วงเวลาหนึ่ง ดังนั้น ผลการสำรวจดังกล่าวจะสะท้อนความคิดเห็นของประชาชนต่อเรื่องนั้นๆ ณ ช่วงเวลาที่ทำการสำรวจเท่านั้น เมื่อเวลาเปลี่ยนแปลงไป ความคิดเห็นดังกล่าวก็เปลี่ยนแปลงตามไปด้วย ผลของโพลล์นั้นย่อมมีทั้งคนที่ชื่นชมและผิดหวัง โดยถ้าผลโพลล์ตรงกับความรู้สึกของตนก็รู้สึกชื่นชมและมักกล่าวถึงโพลล์ในแง่ความแม่นยำ ในทางตรงกันข้าม ถ้าผลโพลล์ขัดกับความรู้สึกของตนก็มักตั้งข้อสงสัยต่าง ๆ นานา อาทิ ขนาดตัวอย่างเพียงพอหรือไม่ ผู้ทำมีความเป็นกลางหรือไม่ บางคนถึงกับกล่าวว่า “ไม่เห็นมาถามตนเองเลย หากมาถามแล้วผลการสำรวจอาจไม่ออกมาเป็นแบบนั้นก็ได้”

                สิ่งหนึ่งที่คนทั่วไปมักใช้ในการประเมินความแม่นยำของโพลล์ก็คือ ขนาดของตัวอย่าง โดยคิดว่า ถ้าตัวอย่างมีขนาดใหญ่แล้วโพลล์ก็มีความแม่นยำมาก แต่ถ้าตัวอย่างมีขนาดเล็กแล้วโพลล์ก็มีความแม่นยำน้อย การคิดเช่นนี้มีส่วนถูกเพียงบางส่วนเท่านั้น แท้ที่จริงแล้ว สิ่งที่มีความสำคัญมากกว่านั้นก็คือ ความเป็นตัวแทนที่ดีของประชากร เพราะความเป็นตัวแทนสามารถสะท้อนภาพที่แท้จริงของประชากรออกมาได้ เพื่อความเข้าใจที่ชัดเจนว่าความเป็นตัวแทนสามารถสะท้อนภาพที่แท้จริงของประชากรออกมาได้อย่างไรนั้น ขอให้พิจารณาตัวอย่างต่อไปนี้

                สมมุติว่าคนกรุงเทพซึ่งมี 6 ล้านคน มีความพึงพอใจต่อสิ่งใดสิ่งหนึ่งจำนวนครึ่งหนึ่งของประชากร ดังนั้น ถ้าเก็บข้อมูลมาจากคนกรุงเทพทุกคนแล้วจะมี 3 ล้านคน (หรือ 50%) ที่มีความพึงพอใจต่อสิ่งนั้น ถ้าเก็บข้อมูลมาจากตัวอย่างขนาด 2 ล้านคนและตัวอย่างนั้นเป็นตัวแทนที่ดีของประชากรแล้ว จะมี 1 ล้านคน (หรือ 50%) ที่มีความพึงพอใจต่อสิ่งนั้น

ในทำนองเดียวกัน ถ้าเก็บข้อมูลมาจากตัวอย่างขนาด 80 คนและตัวอย่างนั้นเป็นตัวแทนที่ดีของประชากรแล้ว จะมี 40 คน (หรือ 50%) ที่มีความพึงพอใจต่อสิ่งนั้น จะเห็นได้ว่า ไม่ว่าขนาดตัวอย่างจะใหญ่หรือเล็กก็ตาม ถ้าตัวอย่างนั้นเป็นตัวแทนที่ดีของประชากรแล้ว ความพึงพอใจต่อสิ่งนั้นจะมีค่าเท่ากับ 50% เสมอ ดังภาพ 1 ต่อไปนี้ (สมมุติว่าส่วนแรเงา คือ สัดส่วนของความพึงพอใจในเรื่องที่ทำการศึกษา)

ประชากร (6 ล้านคน)

ส่วนแรเงา = 50% ของวงกลม

 
 

 

 

 

 

 

 

 


ภาพ 1 กลุ่มตัวอย่างมีความเป็นตัวแทนที่ดีของประชากร (ทำให้สัดส่วนของส่วนแรเงาไม่เปลี่ยนแปลง)

 

                การที่กลุ่มตัวอย่างจะเป็นตัวแทนที่ดีของประชากรได้นั้น หน่วยตัวอย่าง (ในที่นี้คือ คน) แต่ละหน่วยจะต้องมีโอกาสถูกเลือกอย่างเท่าเทียมกัน ซึ่งจะทำเช่นนั้นได้ก็ต่อเมื่อ ใช้วิธีเลือกตัวอย่างโดยใช้หลักการของความน่าจะเป็น (Probability sampling) ซึ่งหลักการนี้มีกล่าวถึงในหนังสือสถิติโดยทั่วไป วิธีการสุ่มตัวอย่างที่ทำให้หน่วยตัวอย่างแต่ละหน่วยมีโอกาสถูกเลือกอย่างเท่าเทียมกันดังกล่าวมีสองวิธี คือ

หนึ่ง สุ่มตัวอย่างแบบเชิงเดียว (Simple random sampling)

สอง สุ่มตัวอย่างแบบมีระบบ (Systematic sampling)

ซึ่งผู้สนใจสามารถศึกษารายละเอียดได้จากหนังสือสถิติโดยทั่วไป สำหรับวิธีการเลือกตัวอย่างโดยไม่ใช้หลักการของความน่าจะเป็น (Non-probability sampling) ได้แก่ วิธีการสุ่มตัวอย่างแบบพบโดยบังเอิญ วิธีการสุ่มตัวอย่างตามความสะดวก วิธีการสุ่มตัวอย่างแบบเจาะจง และวิธีการสุ่มตัวอย่างแบบโควตา  ซึ่งหน่วยตัวอย่างแต่ละหน่วยมีโอกาสถูกเลือกแตกต่างกัน ดังนั้น กลุ่มตัวอย่างในกรณีเหล่านี้จึงไม่เป็นตัวแทนที่ดีของประชากร

ผลสรุปจากกลุ่มตัวอย่างที่ได้จากหลักการของความน่าจะเป็นสามารถอ้างอิงถึงประชากรได้ แต่ผลสรุปจากกลุ่มตัวอย่างที่ไม่ใช้หลักการของความน่าจะเป็นไม่ควรอ้างอิงถึงประชากร

                การสุ่มตัวอย่างไม่ว่าจะใช้วิธีการใดก็ตาม ย่อมมีความคลาดเคลื่อนเกิดขึ้นได้เสมอ ซึ่งเรียกว่า ความคลาดเคลื่อนอันเนื่องมาจากการสุ่มตัวอย่าง (Sampling error) เพียงแต่วิธีการสุ่มตัวอย่างโดยใช้หลักการความน่าจะเป็นนั้นสามารถควบคุมความคลาดเคลื่อนให้อยู่ในระดับที่กำหนดได้ และในการวิจัยทางสังคมศาสตร์ เราเต็มใจที่จะยอมรับความคลาดเคลื่อนดังกล่าว

                การสุ่มตัวอย่างโดยใช้หลักการความน่าจะเป็นนั้น ขนาดของตัวอย่างจะขึ้นอยู่กับช่วงความเชื่อมั่นและความคลาดเคลื่อนที่ยอมให้เกิด หากความเชื่อมั่นมีค่าสูงหรือความคลาดเคลื่อนมีค่าต่ำ จะส่งผลให้ตัวอย่างมีขนาดใหญ่ ในทางกลับกัน หากช่วงความเชื่อมั่นมีค่าต่ำหรือความคลาดเคลื่อนมีค่าสูง จะส่งผลให้ตัวอย่างมีขนาดเล็ก โดยช่วงความเชื่อมั่นและความคลาดเคลื่อนจะต้องพิจารณาไปพร้อม ๆ กัน ดังนั้น ถ้ากลุ่มตัวอย่างเป็นตัวแทนที่ดีของประชากรแล้ว ความสัมพันธ์ระหว่างความคลาดเคลื่อนกับจำนวนกลุ่มตัวอย่าง จะปรากฏดังภาพ 2

ภาพ 2 ความสัมพันธ์ระหว่างความคลาดเคลื่อนกับจำนวนกลุ่มตัวอย่าง

 

จากภาพ 2 อธิบายได้ว่า ในกรณีกลุ่มตัวอย่างเป็นตัวแทนที่ดีของประชากร ถ้าจำนวนกลุ่มตัวอย่างมีขนาดเล็ก ความผิดพลาดก็จะมีมาก ถ้าจำนวนกลุ่มตัวอย่างมีขนาดใหญ่ ความผิดพลาดก็จะน้อยลง แสดงว่า ความผิดพลาดแปรผกผันกับขนาดของกลุ่มตัวอย่าง แต่ถ้ากลุ่มตัวอย่างไม่เป็นตัวแทนที่ดีของประชากรแล้ว ความสัมพันธ์ดังกล่าวอาจไม่เป็นความจริง

 

สูตรที่ใช้ในการคำนวณจำนวนกลุ่มตัวอย่าง

                ตามทฤษฎีการสุ่มตัวอย่าง (Sampling theory) หากประเด็นหลักของงานวิจัยเกี่ยวข้องกับค่าเฉลี่ย (Mean) ให้ใช้สูตร (1) แต่ถ้าหากประเด็นหลักเกี่ยวข้องกับสัดส่วน (Proportion) ให้ใช้สูตร (2) หรือ (3) ดังต่อไปนี้

 

                                                                                                                       … (1)

 

                เมื่อ         n = จำนวนกลุ่มตัวอย่าง หรือ ขนาดตัวอย่าง

                                N = จำนวนประชากร

                                Z = คะแนนมาตรฐาน ซึ่งขึ้นอยู่กับช่วงความเชื่อมั่น

                                E = ความคลาดเคลื่อนที่ยอมให้เกิด

                                s = ค่าเบี่ยงเบนมาตรฐานของประชากร

 

                                                                                              … (2)

 

                เมื่อ         P = สัดส่วนของประชากร สัญลักษณ์นอกนั้นเหมือนกับใน (1)

 

จาก (2) ถ้าใช้ช่วงความเชื่อมั่น 95% (Z = 1.96 » 2), P = 0.50 (สัดส่วนที่ทำให้ “P(1-P)” มีค่ามากที่สุด) และจัดรูปใหม่แล้ว จะได้สูตรดังต่อไปนี้

 

                                                                                                                   … (3)

 

ตัวอย่าง จงคำนวณหาขนาดตัวอย่าง (n) ที่ระดับความเชื่อมั่น 95% จากจำนวนประชากร (N) เท่ากับ 3,000 และยอมให้มีความคลาดเคลื่อน (E) เท่ากับ 5%             

แทนค่า N และ E จะได้ขนาดตัวอย่าง ดังต่อไปนี้

 

                  

 

การแปลความความเชื่อมั่น 95% และความคลาดเคลื่อน 5%  

                ในการสุ่มตัวอย่างขนาดเดียวกันนี้ (n = 353) จำนวน 100 ครั้ง ถ้ากลุ่มตัวอย่างเป็นตัวแทนที่ดีของประชากรแล้ว จะมีจำนวน 95 ครั้ง ที่มีความคลาดเคลื่อนไม่เกิน 5%  

                ความคลาดเคลื่อนไม่เกิน 5%   หมายถึงว่า สัดส่วนของตัวอย่างแตกต่างจากสัดส่วนของประชากรไม่เกิน 5%   เช่น ถ้าสัดส่วนของประชากรคือ 60% จะได้สัดส่วนของตัวอย่างเท่ากับ 60% ± 5% หรือ สัดส่วนของตัวอย่างอยู่ระหว่าง 55% ถึง 65% เป็นต้น

 

หากใช้ช่วงความเชื่อมั่น 95% ในประชากรขนาดใหญ่ (เช่น ประชากรของกรุงเทพฯ) และใช้เทคนิคการสุ่มตัวอย่างโดยอาศัยความน่าจะเป็นแล้ว ขนาดตัวอย่างจะมีความสัมพันธ์กับความคลาดเคลื่อนดังนี้

                                ความคลาดเคลื่อน ± 1% ขนาดตัวอย่างคือ 10,000 คน

                                ความคลาดเคลื่อน ± 3% ขนาดตัวอย่างคือ 1,111 คน

                                ความคลาดเคลื่อน ± 5% ขนาดตัวอย่างคือ 400 คน

                                ความคลาดเคลื่อน ± 7% ขนาดตัวอย่างคือ 204 คน

                                ความคลาดเคลื่อน ± 10% ขนาดตัวอย่างคือ 100 คน

สำหรับงานสำรวจที่มีจำนวนประชากรขนาดต่าง ๆ ถ้าใช้ช่วงความเชื่อมั่น 95% แล้วสามารถเลือกขนาดตัวอย่าง ณ ความคลาดเคลื่อนระดับต่าง ๆ ได้จากตารางต่อไปนี้

 

ตาราง ขนาดตัวอย่างที่ระดับความเชื่อมั่น 95% ณ ความคลาดเคลื่อนที่ยอมให้เกิด (E) จาก 1% ถึง 10%

 

ขนาดประชากร

 (N)

ขนาดตัวอย่าง (n)

ณ ความคลาดเคลื่อนระดับต่างๆ

 

ขนาดประชากร

 (N)

ขนาดตัวอย่าง (n)

ณ ความคลาดเคลื่อนระดับต่างๆ

1%

3%

5%

7%

10%

1%

3%

5%

7%

10%

30

30

29

28

26

23

5,000

3,333

909

370

196

98

50

50

48

44

40

33

6,000

3,750

938

375

197

98

100

99

92

80

67

50

7,000

4,118

959

378

198

99

200

196

169

133

101

67

8,000

4,444

976

381

199

99

300

291

236

171

121

75

9,000

4,737

989

383

200

99

400

385

294

200

135

80

10,000

5,000

1,000

385

200

99

500

476

345

222

145

83

15,000

6,000

1,034

390

201

99

500

476

345

222

145

83

20,000

6,667

1,053

392

202

100

700

654

429

255

158

88

25,000

7,143

1,064

394

202

100

800

741

465

267

163

89

50,000

8,333

1,087

397

203

100

900

826

497

277

166

90

100,000

9,091

1,099

398

204

100

1,000

909

526

286

169

91

200,000

9,524

1,105

399

204

100

2,000

1,667

714

333

185

95

300,000

9,677

1,107

399

204

100

3,000

2,308

811

353

191

97

500,000

9,804

1,109

400

204

100

4,000

2,857

870

364

194

98

¥

10,000

1,111

400

204

100

 

ผลโพลล์ที่มาจากกลุ่มตัวอย่างที่มีความเป็นตัวแทนที่ดีของประชากร

ศูนย์วิจัยกรุงเทพโพลล์ มหาวิทยาลัยกรุงเทพ และสำนักวิจัยเอแบคโพลล์ มหาวิทยาลัยอัสสัมชัญ ได้ทำโพลล์ในช่วงเวลาที่ใกล้เคียงกัน โดยใช้ขนาดตัวอย่างที่แตกต่างกัน โดยศูนย์วิจัยกรุงเทพโพลล์ถามในประเด็น บุคคลในสังคมไทยที่มีพฤติกรรมน่าชื่นชมยกย่องมากที่สุดในปี 2548 และสำนักวิจัยเอแบคโพลล์ถามในประเด็น บุคคลแห่งปี 2548 แม้คำถามจะต่างกัน แต่มีความหมายใกล้เคียงกัน จึงสามารถนำผลมาเปรียบเทียบกันได้ ผลโพลล์ปรากฏดังนี้

ศูนย์วิจัยกรุงเทพโพลล์ สำรวจคนกรุงเทพมหานคร จำนวนตัวอย่างทั้งสิ้น 1,414 คน (คลาดเคลื่อนไม่เกิน +-3% ณ ระดับความเชื่อมั่น 95%) ระหว่างวันที่ 9-15 ธันวาคม 2548 ระบุว่าบุคคลในสังคมไทยที่มีพฤติกรรมน่าชื่นชมยกย่องมากที่สุดเป็นดังนี้

อันดับ 1 ...ทักษิณ ชินวัตร 31.1%

อันดับ 2 นายสนธิ ลิ้มทองกุล 15.7%

อันดับ 3 นายอภิรักษ์ โกษะโยธิน 5.9%

สำนักวิจัยเอแบคโพลล์ สำรวจคนใน 32 จังหวัดทั่วประเทศ จำนวนตัวอย่างทั้งสิ้น 14,538 (คลาดเคลื่อนไม่เกิน +-1% ณ ระดับความเชื่อมั่น 95%) คน ระหว่างวันที่ 9-24 ธันวาคม 2548 ระบุว่าบุคคลแห่งปีเป็นดังนี้

อันดับ 1 ...ทักษิณ ชินวัตร 31.5%

อันดับ 2 นายสนธิ ลิ้มทองกุล 15.4%

อันดับ 3 นายอภิสิทธิ์ เวชชาชีวะ 10.5%

ในทางสถิติ ถือว่าผลโพลล์ทั้งสองสำนักในสองลำดับแรกไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติ ซึ่งแสดงว่า ถ้ากลุ่มตัวอย่างมีความเป็นตัวแทนที่ดีของประชากรแล้ว ถือว่า ผลโพลล์มีค่าไม่แตกต่างกัน ส่วนที่แตกต่างกันก็คือ อันดับ 3 แต่ก็สอดคล้องตามความเป็นจริง ทั้งนี้ เพราะนายอภิรักษ์ โกษะโยธิน เป็นนักการเมืองระดับท้องถิ่น ทำประโยชน์ให้คนท้องถิ่น ตามผลโพลล์ของศูนย์วิจัยกรุงเทพจึงเห็นว่าคนท้องถิ่นชื่นชมนายอภิรักษ์เป็นอันดับ 3 ในขณะที่นายอภิสิทธิ์ เวชชาชีวะ เป็นนักการเมืองระดับประเทศ ทำประโยชน์ให้คนทั้งประเทศ ตามผลโพลล์ของสำนักวิจัยเอแบคโพลล์จึงเห็นว่าคนทั่วประเทศเลือกนายอภิสิทธิ์ เป็นอันดับ 3

ถ้าผลการสำรวจในเรื่องเดียวกันหรือเรื่องใกล้เคียงกันนี้หลาย ๆ ครั้ง และผลการสำรวจมีความใกล้เคียงกันเช่นนี้แล้ว เราสามารถกล่าวได้ว่า ความเห็นของคนกรุงเทพฯ สามารถสะท้อนภาพความเห็นของคนทั้งประเทศได้

สรุป

                การประเมินความแม่นยำของโพลล์โดยทั่วไปนั้น การพิจารณาขนาดตัวอย่างเพียงอย่างเดียวจะยังไม่เพียงพอ จะต้องพิจารณาถึงเทคนิคการเก็บข้อมูลด้วย โดยเฉพาะขบวนการตรวจสอบคุณภาพของข้อมูลเพื่อให้ได้ข้อมูลจากผู้ตอบที่ถูกเลือกเป็นหน่วยตัวอย่างอย่างแท้จริง เพื่อทำให้กลุ่มตัวอย่างเป็นตัวแทนที่ดีของประชากร เมื่อกลุ่มตัวอย่างเป็นตัวแทนที่ดีของประชากรแล้วก็จะส่งผลให้โพลล์มีความแม่นยำตามช่วงความเชื่อมั่นและความคลาดเคลื่อนที่กำหนด แต่เนื่องจากผู้บริโภคข่าวสารโดยทั่วไปไม่มีโอกาสตรวจสอบรายละเอียดดังกล่าว ดังนั้น การประเมินความแม่นยำของโพลล์จากสถาบันที่ทำโพลล์จึงเป็นอีกหนทางหนึ่งที่ควรพิจารณา K