การเปรียบเทียบคุณภาพของวิธีการตรวจให้คะแนนความรู้บางส่วน: การพัฒนาวิธีประยุกต์การให้คะแนนแบบตัดตัวลวง–เลือกตัวถูก

Main Article Content

ณัฐภรณ์ เลขะวัฒนพงษ์
ศิริเดช สุชีวะ

บทคัดย่อ

         การวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาวิธีการให้คะแนนความรู้บางส่วนวิธีประยุกต์ตัดตัวลวง–เลือกตัวถูก และเปรียบเทียบความยาก อำนาจจำแนกของข้อสอบ ความตรงเชิงโครงสร้างของแบบสอบ ความเที่ยงของแบบสอบ ฟังก์ชันสารสนเทศของแบบสอบ และความแม่นยำในการประมาณค่าความสามารถของผู้สอบที่ได้จากวิธีประยุกต์คูมบ์ วิธีตัดตัวลวง-เลือกตัวถูก และวิธีประยุกต์ตัดตัวลวง-เลือกตัวถูก เมื่อข้อสอบมี 4 ตัวเลือกและ 5 ตัวเลือก ตัวอย่างวิจัยเป็นนักเรียนชั้น มัธยมศึกษาปีที่ 4 จำนวน 1,251 คน ในโรงเรียนเขตกรุงเทพมหานคร เครื่องมือวิจัย ได้แก่ แบบสอบวัดผลสัมฤทธิ์ทางการเรียนวิชาเคมี เรื่อง พันธะโคเวเลนต์ เป็นแบบสอบหลายตัวเลือก จำนวน 40 ข้อ แบ่งเป็นข้อสอบ 4 ตัวเลือกและ 5 ตัวเลือกอย่างละ 20 ข้อ วิเคราะห์ข้อมูลความยาก อำนาจจำแนกของข้อสอบ และฟังก์ชันสารสนเทศของแบบสอบโดยใช้โปรแกรม IRTPRO 4 Student วิเคราะห์ความตรงเชิงโครงสร้างโดยใช้โปรแกรม Mplus วิเคราะห์ความเที่ยงโดยใช้โปรแกรม SPSS และเปรียบเทียบความแตกต่างของความเที่ยงโดยใช้ Feldt test


         ผลการวิจัย พบว่า (1) วิธีการให้คะแนนความรู้บางส่วนที่ต่างกันส่งผลให้ความยากของข้อสอบแตกต่างกัน อย่างมีนัยสำคัญทางสถิติที่ระดับ .05 โดยวิธีประยุกต์ของคูมบ์มีค่าความยากสูงสุด นอกจากนี้ วิธีการให้คะแนนความรู้บางส่วนและจำนวนตัวเลือกที่ต่างกันส่งผลต่ออำนาจจำแนกของข้อสอบแตกต่างกัน อย่างมีนัยสำคัญทางสถิติที่ระดับ .05 โดยวิธีประยุกต์คูมบ์มีค่าอำนาจจำแนกสูงสุด ส่วนวิธีตัดตัวลวง-เลือกตัวถูกและวิธีประยุกต์ตัดตัวลวง-เลือกตัวถูกมีค่าอำนาจจำแนกไม่แตกต่างกัน อย่างมีนัยสำคัญทางสถิติที่ระดับ .05  (2) วิธีประยุกต์คูมบ์และวิธีประยุกต์ตัดตัวลวง-เลือกตัว เมื่อข้อสอบมี 4 และ 5 ตัวเลือก มีความตรงเชิงโครงสร้าง ส่วนวิธีตัดตัวลวง-เลือกตัวถูก เมื่อข้อสอบมี 5 ตัวเลือกมีความตรงเชิงโครงสร้างแต่ 4 ตัวเลือกไม่มีความตรงเชิงโครงสร้าง (3) ความเที่ยงของทั้ง 3 วิธี เมื่อข้อสอบมี 4 ตัวเลือกและ 5 ตัวเลือก ไม่แตกต่างกัน โดยวิธีประยุกต์ตัดตัวลวง–เลือกตัวถูก เมื่อข้อสอบมี 4 ตัวเลือกมีค่าความเที่ยงสูงที่สุด (4) วิธีตัดตัวลวง–เลือกตัวถูก เมื่อข้อสอบมี 5 ตัวเลือกให้สารสนเทศสูงที่สุดในช่วงระดับความสามารถต่ำ วิธีประยุกต์ตัดตัวลวง–เลือกตัวถูก เมื่อข้อสอบมี 4 ตัวเลือกให้สารสนเทศสูงที่สุดในช่วงระดับความสามารถปานกลางและทั้ง 3 วิธีให้สารสนเทศใกล้เคียงกันในช่วงระดับความสามารถสูง วิธีประยุกต์ตัดตัวลวง-เลือกตัวถูก เมื่อข้อสอบมี 4 ตัวเลือกมีความแม่นยำในการประมาณค่าความสามารถของผู้สอบสูงสุด และ (5) วิธีประยุกต์ตัดตัวลวง-เลือกตัวถูก เมื่อข้อสอบมี 4 ตัวเลือกมีคุณภาพสูงที่สุด รองลงมา คือ วิธีประยุกต์ตัดตัวลวง-เลือกตัวถูก เมื่อข้อสอบมี 5 ตัวเลือก

Article Details

บท
บทความวิจัย

References

กระทรวงศึกษาธิการ. (2551). แนวปฏิบัติการวัดและประเมินผลการเรียนรู้ ตามหลักสูตรแกนกลางการศึกษาขั้นพื้นฐาน พุทธศักราช 2551. กรุงเทพฯ: สำนักวิชาการและมาตรฐานการศึกษา สำนักงานคณะกรรมการการศึกษาขั้นพื้นฐาน.

กระทรวงศึกษาธิการ. (2551). หลักสูตรแกนกลางการศึกษาขั้นพื้นฐาน พุทธศักราช 2551.

โชติกา ภาษีผล. (2554). การสร้างและพัฒนาเครื่องมือในการวัดและประเมินผลการศึกษา. กรุงเทพฯ: จุฬาลงกรณ์มหาวิทยาลัย.

โชติกา ภาษีผล ณัฏฐภรณ์ หลาวทอง และกมลวรรณ ตังธนกานนท์. (2558). การวัดและประเมินผลการเรียนรู้. กรุงเทพฯ: โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.

รณิดา เชยชุ่ม. (2551). การเปรียบเทียบคุณภาพของข้อสอบและแบบสอบหลายตัวเลือก ที่มีรูปแบบตัวเลือกแตกต่างกัน. กรุงเทพฯ: คณะครุศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย.

รัตนา ไชยตรี. (2546). การเปรียบเทียบคุณภาพและอัตราความคลาดเคลื่อนของการกำหนดเกรดแบบอิงกลุ่ม และอิงเกณฑ์ เมื่อใช้แบบสอบเลือกตอบที่มีการตอบ และการตรวจให้คะแนนความรู้บางส่วนด้วยวิธีแตกต่างกัน. (วิทยานิพนธ์ปริญญาดุษฎีบัณฑิต). บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย. กรุงเทพฯ

ศิริชัย กาญจนวาสี. (2556). ทฤษฎีการทดสอบแบบดั้งเดิม (Classical Test Theory). กรุงเทพฯ: โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.

สุพจน์ เกิดสุวรรณ์. (2545). การพัฒนาการวัดความรู้บางส่วนของผู้ตอบแบบสอบเลือกตอบ. (วิทยานิพนธ์ปริญญาดุษฎีบัณฑิต). บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย. กรุงเทพฯ.

สุรางค์ โค้วตระกูล. (2548). จิตวิทยาการศึกษา. กรุงเทพฯ: โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.

อานุภาพ เลขะกุล. (2559). การสร้างข้อสอบแบบเลือกตอบ (Multiple choice question).

เอมอร จังศิริพรปกรณ์. (2545a). การเปรียบเทียบคุณภาพของแบบสอบเลือกตอบเมื่อตรวจด้วยวิธีการให้คะแนนความรู้บางส่วนกับวิธีประเพณีนิยม. กรุงเทพฯ: จุฬาลงกรณ์มหาวิทยาลัย.

เอมอร จังศิริพรปกรณ์. (2545b). การให้คะแนนความรู้บางส่วนทำได้อย่างไร. วารสารครุศาสตร์, 23, 21-32.

เอมอร จังศิริพรปกรณ์. (2546). การเปรียบเทียบคุณภาพของแบบสอบเลือกตอบเมื่อตรวจด้วยวิธีการให้คะแนนความรู้บางส่วนกับวิธีประเพณีนิยม. วารสารครุศาสตร์, 31, 24-40.

Bahrami, G. G. (2011). The Role of Number of choices on the Parameters, Item's Goodness of Fit and Information Function of the Items in Different Levels of Ability in Multiple Choice Tests. Elsevier Ltd., 1305-1311.

Chang, S.-H., Lin, P.-C., & Lin, Z.-C. (2007). Measures of Partial Knowledge and Unexpected Responses in Multiple-Choice Tests. Educational Technology & Society, 10(4), 95-109.

Frey, A. S. (1989). A test validation study for capturing partial information in multiple-choice questions using polychotomous scoring. (PH.D Dissertation). University of San Francisco.

Lau, P. N. K., Lau, S. H., Hong, K. S., & Usop, H. (2011). Guessing, Partial Knowledge, and Misconceptions in Multiple-Choice Tests. Educational Technology & Society, 14(4), 99-110.

Lau, S. H., Hong, K. S., Lau, P. N. K., & Usop, H. (2014). Robustness of number right elimination testing (NRET) scoring method for multiple-choice items in computer adaptive assessment system (CAAS). Research and Practice in Technology Enhanced Learning, 9(2), 283-300.

Ma, X. (2004). An investigation of alternative approaches to scoring multiple response items on a certification examination. (PH.D Dissertation). University of Massachusetts.

MacCann, R. G. (2004). RELIABILITY AS A FUNCTION OF TttE NUMBER OF ITEM OPTIONS DERIVED FROM THE "KNOWLEDGE OR RANDOM GUESSING" MODEL. The Psychometric Society, 69, 147-157.

McMillan, J. H. (2014). Classroom Assessment .Pearson Education, Inc.

Muraki, E. (1992). A Generalized Partial Credit Model : Application of an EM Algorithm. APPLIED PSYCHOLOGICAL MEASUREMENT, 16, 159-176.

Nitko, A. J. (2004). Educational Assessment Of Students. Pearson Education, Inc.: Kevin M. Davis.

Pande, S. S., Santosh, P. R., Vrushali, P. R., Archana, N. P., & Sushil, A. H. (2013). Correlation between difficulty & discrimination indices of MCQs in formative exam in Physiology. Original Research Paper, 7.

Rodriguez, M. C. (2005). Three Options Are Optimal for Multiple-Choice Items: A Meta-Analysis of 80 Years of Research. Educational Measurement: Issues and Practice.

Sim, S. M., & Rasiah, R. I. (2006). Relationship between item difficulty and discrimination indices in true/false-type multiple choice questions of a para-clinical multidisciplinary paper. ResearchGate, 35, 67-71.