thongsek: 2010-01-10

จัดทำโดย

นาย จิรวัฒน์ เกษศิริ รหัส 5012252102
นาย สมปอง ทองเสก รหัส 5012252114
นาย วิทยา กาฬปักษ์ รหัส 5012252212
นาย ศรไกร เรืองศรี รหัส 5012252214

ความเชื่อมั่น
(Reliability)
นิยามสัมประสิทธิ์ความเชื่อมั่น

มีหลากหลายวิธีในการนิยามและแปลความหมายความเชื่อมั่นของแบบทดสอบ ตัวอย่างเช่น แบบทดสอบจะเชื่อมั่นได้ถ้าคะแนนสังเกตและคะแนนจริงมีความสัมพันธ์กันสูง นั่นคือ คะแนนที่สังเกตได้และคะแนนจริงที่ได้มาจากผู้สอบทุกๆ คนที่สอบแบบทดสอบฉบับหนึ่ง กำลังสองของสหสัมพันธ์ระหว่างคะแนนที่สังเกตได้และคะแนนจริง ( ) จะเรียกว่าสัมประสิทธิ์ความเชื่อมั่นของแบบทดสอบ หรือความเชื่อมั่นสามารถแสดงได้ด้วยสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนสังเกตของแบบทดสอบที่คู่ขนานแบบพาราเรล (Parellel) กันสองฉบับ ถ้าแบบทดสอบที่คู่ขนานกันสองฉบับนั้นใช้สอบกับประชากรผู้สอบและผลของคะแนนสังเกตของแบบทดสอบสองฉบับที่คู่ขนานนั้นนำมาหาความสัมพันธ์กัน ค่าสหสัมพันธ์นี้ (ใช้สัญลักษณ์ เมื่อ X และ X’ คือคะแนนสังเกตของแบบทดสอบสองฉบับที่คู่ขนานกันแบบพาราเรล) ก็คือค่าสัมประสิทธิ์ความเชื่อมั่น โดยปกติแล้วเราไม่สามารถทราบคะแนนจริงได้ และเป็นไปไม่ได้ที่จะใช้แบบทดสอบที่คู่ขนานกันแบบพาราเรล ดังนั้นความเชื่อมั่นต้องประมาณค่าด้วยวิธีอื่น ๆ แต่หลังจากที่ได้ตรวจสอบวิธีการโดยทั่วไปในการประมาณค่าความเชื่อมั่นแล้ว มี 6 วิธีสำหรับนิยามหรือแปลความหมายของสัมประสิทธิ์ความเชื่อมั่น ดังนี้

การนิยามและแปลความหมายสัมประสิทธิ์ความเชื่อมั่น
มี 6 วิธีต่อไปนี้สำหรับนิยามสัมประสิทธิ์ความเชื่อมั่นไว้ คือ
1. rXX¢ = สหสัมพันธ์ระหว่างคะแนนที่สังเกตได้จากแบบทดสอบคู่ขนาน
2. = สัดส่วนของความแปรปรวนใน X ที่อธิบายโดยสหสัมพันธ์เชิงเส้นกับ X¢
3. rXX¢ =
4. rXX¢ =
5. rXX¢ =
6. rXX¢ =
การแปลความหมายในนิยามที่ 1 คือความเชื่อมั่นของแบบทดสอบจะเท่ากับสหสัมพันธ์ของคะแนนสังเกตที่ได้จากแบบทดสอบฉบับหนึ่งกับคะแนนสังเกตที่ได้จากแบบทดสอบอีกฉบับหนึ่งที่คู่ขนานกัน ผู้สอบจะได้คะแนนสังเกตเท่ากันก็ต่อเมื่อแบบทดสอบมีความคู่ขนานและมีความแปรปรวนของคะแนนสังเกตในการสอบแต่ละครั้งเท่ากัน ดังนั้นแบบทดสอบจะมีความเชื่อมั่นที่สมบูรณ์ (rXX¢ = 1) แต่ถ้าผู้สอบมีคะแนนสังเกตในแบบทดสอบฉบับหนึ่งไม่สัมพันธ์กับคะแนนสังเกตอีกฉบับหนึ่งที่คู่ขนานกัน (rXX¢ = 0) แบบทดสอบย่อมเชื่อมั่นไม่ได้
การแปลความหมายในนิยามที่ 2 คือการแปลผลโดยใช้สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน กำลังสองของสหสัมพันธ์จะแปลความหมายได้ว่าเป็นสัดส่วนของความแปรปรวนของตัวแปรหนึ่งสามารถอธิบายได้ด้วยสหสัมพันธ์เชิงเส้นกับอีกตัวแปรหนึ่ง ดังนั้น จะเท่ากับสัดส่วนของความแปรปรวนของคะแนนแบบทดสอบฉบับหนึ่งที่อธิบายได้ด้วยสหสัมพันธ์เชิงเส้นกับคะแนนในแบบทดสอบอีกฉบับหนึ่งที่คู่ขนานกัน
การแปลความหมายในนิยามที่ 3 rXX¢ = คือสัมประสิทธิ์ความเชื่อมั่นเป็นอัตราส่วนของความแปรปรวนของคะแนนจริงกับความแปรปรวนของคะแนนที่สังเกตได้ สำหรับแบบทดสอบที่มีความเชื่อมั่นอย่างสมบูรณ์ rXX¢ = 1 ดังนั้น = 1 และความแปรปรวนของคะแนนที่สังเกตได้ทั้งหมดสะท้อนให้เห็นความแปรปรวนของคะแนนจริง ถ้า rXX¢ = 1 ความแตกต่างระหว่างคะแนนที่สังเกตได้มาจากความแตกต่างระหว่างคะแนนจริง ถ้า แล้ว ต้องเป็น 0 ดังนั้น e(E) = 0, ความคลาดเคลื่อนทั้งหมดจะเท่ากับ 0 เมื่อ = 0 แล้วการวัดจะต้องปราศจากความคลาดเคลื่อน ถ้า rXX¢ < 1 แล้วความคลาดเคลื่อนในการวัดยังคงมีอยู่ ถ้า rXX¢ = 0 แล้ว ซึ่งหมายความว่าคะแนนที่สังเกตได้ทั้งหมดจะสะท้อนให้เห็นเฉพาะความคลาดเคลื่อนเท่านั้น
ขณะที่ความเชื่อมั่นของแบบทดสอบเพิ่มขึ้น ความแปรปรวนของคะแนนความคลาดเคลื่อนจะน้อยลง เมื่อความแปรปรวนของความคลาดเคลื่อนมีน้อยแล้ว คะแนนที่สังเกตของผู้สอบจะมีค่าเข้าใกล้คะแนนจริงของเขามาก อย่างไรก็ตามเมื่อความแปรปรวนของความคลาดเคลื่อนมีมาก คะแนนที่สังเกตได้จะให้การประมาณค่าคะแนนจริงที่ไม่ดี ภาพประกอบ 1 จะแสดงความสัมพันธ์นี้ โค้งจะแสดงการแจกแจงเชิงทฤษฎีของคะแนนสังเกตเมื่อคะแนนจริงค่าหนึ่งคงที่ นั่นคือการแจกแจงของคะแนนสังเกตสำหรับผู้สอบคนหนึ่ง คะแนนจริงของผู้สอบจะแสดงด้วยสัญลักษณ์ T ในรูปภาพ เมื่อคะแนนจริงถูกกำหนดให้คงที่ = 0 และความแปรปรวนของคะแนนสังเกตจะเท่ากับความแปรปรวนของคะแนนความคลาดเคลื่อน ภายใต้โค้ง A ซึ่งมีความแปรปรวนของความคลาดเคลื่อนน้อย คะแนนที่สังเกตได้จะมีค่าเข้าใกล้คะแนนจริง T มาก ภายใต้โค้ง B ซึ่งมีความแปรปรวนของความคลาดเคลื่อนมาก คะแนนที่สังเกตได้จะอยู่ไกลออกจากคะแนนจริง T

ภาพประกอบ 1 แสดงอิทธิพลของความแปรปรวนของความคลาดเคลื่อนกับคะแนนจริง

การแปลความหมายในนิยามที่ 4 rXX¢ = สัมประสิทธิ์ความเชื่อมั่นเท่ากับกำลังสองของสหสัมพันธ์ระหว่างคะแนนที่สังเกตได้กับคะแนนจริง ตัวอย่างเช่น ถ้า rxx¢ = 0.81 ดังนั้น
rXT = 0.9 ถ้า rXX¢ = 0.25 ดังนั้น rXT = 0.5 ความสัมพันธ์นี้จะแสดงในภาพประกอบ 2 เมื่อ
0 <> 1 เราจะได้ว่า rXT > rXX¢ คะแนนสังเกตจะสัมพันธ์กันสูงกับคะแนนจริงและสูงกว่าคะแนนที่สังเกตได้จากแบบทดสอบคู่ขนาน ในความเป็นจริง คะแนนจากแบบทดสอบจะไม่สัมพันธ์กันสูงกับแบบทดสอบอื่น ๆ มากไปกว่าคะแนนจริงของตัวมันเอง สหสัมพันธ์ที่สูงมากระหว่างคะแนนที่สังเกตได้กับแบบทดสอบอื่น ๆ คือ ถ้าแบบทดสอบ X ใช้สำหรับทำนายแบบทดสอบเกณฑ์ Y แล้ว rXY จะเรียกว่า สัมประสิทธิ์ความเที่ยงตรง เพราะว่า rXY ไม่สามารถจะมีค่าสูงไปกว่า rXT และ rXY ก็จะไม่สูงไปกว่า ดังนั้นความเชื่อมั่นมีผลต่อความเที่ยงตรง แม้ว่าสัมประสิทธิ์ความเที่ยงตรงไม่สามารถมีค่าสูงไปกว่ากำลังสองของรากที่สองของสัมประสิทธิ์ความเชื่อมั่น ตัวอย่างเช่น ถ้า rXX¢ = 0.49 แล้ว rXT = 0.7

ภาพประกอบ 2 ความสัมพันธ์ระหว่าง rXX¢ และ rXT

ภาพประกอบ 3 ความสัมพันธ์ระหว่าง rXX¢ และ rXE

การแปลความหมายในนิยามที่ 5 rXX¢ = สัมประสิทธิ์ความเชื่อมั่นมีค่าเท่ากับ 1 ลบด้วยกำลังสองของสหสัมพันธ์ระหว่างคะแนนที่สังเกตได้กับคะแนนความคลาดเคลื่อน ในแนวคิดนี้ rXE ควรจะมีค่า 0 แต่ rXE = 0 เมื่อ rXX¢ = 1.0 ความสัมพันธ์ระหว่าง rXE และ rXX¢ จะแสดงในภาพประกอบ 3
การแปลความหมายในนิยามที่ 6 rXX¢ = ความเชื่อมั่นเป็นความสัมพันธ์ของความแปรปรวนของคะแนนความคลาดเคลื่อนและความแปรปรวนของคะแนนที่สังเกตได้ ดังที่อธิบายไปแล้วในตอนต้น เมื่อ rXX¢ = 1, = 0 และเมื่อ rXX¢ = 0, ระดับของความแปรปรวนที่เป็นวิวิธพันธ์ของคะแนนสังเกตได้มาจากกลุ่มของผู้สอบซึ่งมีผลกระทบต่อความเชื่อมั่นเป็นสำคัญ ถ้าแบบทดสอบใช้กับกลุ่มประชากรที่ทำแบบทดสอบได้พิสัยของคะแนนสังเกตน้อย (เช่น ใช้แบบทดสอบ IQ กับกลุ่มประชากรที่มีสมองช้า) จะมีค่าน้อยลง ถ้าความแปรปรวนของความคลาดเคลื่อนในกลุ่มที่มีช่วงคะแนนน้อยเท่ากับกลุ่มที่เป็นวิวิธพันธ์แล้วความเชื่อมั่นของกลุ่มที่มีพิสัยของคะแนนน้อยจะมีค่าความเชื่อมั่นน้อยกว่า กล่าวอีกอย่างว่า ความเชื่อมั่นที่ประมาณได้จากกลุ่มที่เป็นวิวิธพันธ์จะมีแนวโน้มสูงกว่าการประมาณจากกลุ่มที่เป็นเอกพันธ์
โดยสรุปแล้ว เมื่อ rXX¢ = 1 มีสาเหตุจาก
1) การวัดปราศจากความคลาดเคลื่อน (E = 0)
2) X = T ในผู้สอบทุก ๆ คน
3) ความแปรปรวนของคะแนนสังเกตทั้งหมดสะท้อนให้เห็นความแปรปรวนของ
คะแนนจริง ( )
4) ความแตกต่างทั้งหมดระหว่างคะแนนสังเกตสะท้อนถึงความแตกต่างของ
คะแนนจริง
5) สหสัมพันธ์ระหว่างคะแนนสังเกตกับคะแนนจริงมีค่า 1 (rXT = 1) และ
6) สหสัมพันธ์ระหว่างคะแนนสังเกตกับคะแนนคลาดเคลื่อนมีค่า 0 (rXE = 0)
เมื่อ rXX¢ = 0 มีสาเหตุจาก
1) เกิดเฉพาะความคลาดเคลื่อนอย่างสุ่มในการวัด
2) X = E สำหรับผู้สอบทุก ๆ คน
3) ความแปรปรวนของคะแนนสังเกตทั้งหมดสะท้อนถึงความแปรปรวนของคะแนน
คลาดเคลื่อน ( )
4) ความแตกต่างทั้งหมดระหว่างคะแนนสะท้อนถึงความคลาดเคลื่อนในการวัด
5) สหสัมพันธ์ระหว่างคะแนนสังเกตกับคะแนนจริงมีค่า 0 (rXT = 0) และ
6) สหสัมพันธ์ระหว่างคะแนนสังเกตกับคะแนนคลาดเคลื่อนมีค่า 1 (rXE = 1)

เมื่อ 0 £ rXX¢ £ 1 มีสาเหตุจาก
1) การวัดจะรวมความคลาดเคลื่อนบางอย่างเข้าไว้ด้วย
2) X = T + E
3) ความแปรปรวนของคะแนนสังเกตประกอบด้วยความแปรปรวนของคะแนนจริง
บางส่วนรวมกับความแปรปรวนของคะแนนคลาดเคลื่อนบางอย่าง
( )
4) ความแตกต่างระหว่างคะแนนสามารถสะท้อนให้เห็นความคลาดเคลื่อนของการวัด
เช่นเดียวกับความแตกต่างของคะแนนจริง
5) สหสัมพันธ์ระหว่างคะแนนสังเกตและคะแนนจริง rXT เท่ากับ
6) สหสัมพันธ์ระหว่างคะแนนสังเกตและคะแนนความคลาดเคลื่อน rXE คือ
7) ความเชื่อมั่นก็คือสัดส่วนของความแปรปรวนของคะแนนสังเกตได้ในส่วนที่เป็น
ความแปรปรวนของคะแนนจริง (rXX¢ = ) และ
8) ค่า rXX¢ ที่สูงจะช่วยก่อให้เกิดความเชื่อมั่นในการประมาณค่า T จาก X เพราะ
ความแปรปรวนของความคลาดเคลื่อนมีค่าน้อยลง

การประมาณค่าความเชื่อมั่นด้วยวิธีการสอบซ้ำ

ความเชื่อมั่นของการสอบซ้ำ จะนิยามอยู่บนพื้นฐานของการใช้กลุ่มผู้สอบกลุ่มเดียวกันที่ใช้แบบทดสอบฉบับเดียวกันซ้ำสองครั้งแล้วมานำหาความสัมพันธ์กัน ถ้าผู้สอบแต่ละคนได้คะแนนสอบเหมือนกันในการสอบซ้ำสองครั้ง และมีความแปรปรวนของคะแนนสังเกตเท่ากันแล้ว สหสัมพันธ์จะได้เท่ากับ 1.0 บ่งชี้ถึงความสัมพันธ์กันอย่างสมบูรณ์ หรือในอีกกรณีหนึ่ง ถ้าคะแนนสังเกตสำหรับผู้สอบทุกคนอ้างอิงมาจากการทดสอบฉบับที่หนึ่งที่มีความสัมพันธ์ของคะแนนสังเกตเป็นเชิงเส้นตรงอย่างสมบูรณ์กับแบบทดสอบฉบับที่สองแล้ว การประมาณค่าความเชื่อมั่นจะเท่ากับ 1.0 แต่ถ้าชุดของคะแนนจากแบบทดสอบฉบับแรกไม่มีความสัมพันธ์กับชุดของคะแนนจากแบบทดสอบฉบับที่สอง การประมาณค่าความเชื่อมั่นจะได้ 0.0 วิธีการสอบซ้ำดูเหมือนจะมีเหตุมีผลมากในการประมาณค่าความเชื่อมั่นของแบบทดสอบ แต่มันเป็นวิธีการที่ยุ่งยาก
ปัญหาที่สำคัญมากกับการประมาณค่าความเชื่อมั่นแบบสอบซ้ำคือผลของการเกิด carry-over effect ระหว่างการทดสอบ การทดสอบครั้งแรกอาจจะมีอิทธิพลต่อการสอบครั้งที่สอง เกิดความคลาดเคลื่อนของคะแนนสำหรับการสอบ ผู้สอบเมื่อสอบครั้งที่สองอาจจะจำคำตอบได้ที่ตอบไปในครั้งแรกได้ และก็ง่ายที่ตอบคำตอบเดิมซ้ำ หรือในบางการทดสอบ carry-over effects อาจจะเนื่องมาจากการฝึกฝน เช่นผู้สอบส่วนใหญ่มีแนวโน้มที่ได้รับการฝึกฝนจากการทดสอบซ้ำทำให้มีความคล่องแคล่วในการทำแบบทดสอบและในบางความสามารถที่แบบทดสอบวัด ถ้ามีผู้สอบบางคนที่ได้รับการฝึกฝนมากกว่าผู้สอบคนอื่น
การเปลี่ยนเจตคติของผู้สอบหรือระดับของข้อสอบสามารถมีสาเหตุให้เกิด carry-over effects ได้ การไม่ให้ความร่วมมือของผู้สอบ ผู้สอบอาจจะไม่ยอมทำแบบทดสอบในครั้งที่สองและจงใจจะเดาหรือตอบผิดในการสอบครั้งที่สอง ผลนี้จะทำให้สัมประสิทธิ์ความเชื่อมั่นต่ำระหว่างการสอบทั้งสองครั้ง หรือหลังจากการสอบครั้งแรก ผู้สอบบางคนอาจจะไปค้นหาข้อมูลเพิ่มเติมเพื่อช่วยให้คะแนนของตนเองเพิ่มขึ้น ดังนั้นสัมประสิทธิ์สหสัมพันธ์ระหว่างการทดสอบซ้ำสองครั้งควรจะมีแนวโน้มต่ำ carry-over effects สามารถมีผลต่อการประมาณค่าความเชื่อมั่น ช่วยให้การประมาณค่าความเชื่อมั่นแบบสอบซ้ำต่ำหรือสูงกว่าความเป็นจริง
ปัญหาประการที่สองกับการประมาณค่าความเชื่อมั่นแบบสอบซ้ำจะเกี่ยวข้องกับระยะเวลาที่เว้นช่วงห่างระหว่างการสอบทั้งสองครั้ง การเว้นช่วงห่างที่สั้นมากจะมีผลให้เกิด carry-over effects อันเนื่องมาจากความจำข้อสอบได้ การฝึกฝน หรืออารมณ์ การเว้นช่วงห่างที่ยาวนานอาจจะมีผลเนื่องมาจากการเปลี่ยนแปลงของความรู้หรืออารมณ์ ถ้าคุณลักษณะที่แบบทดสอบวัดมีการเปลี่ยนแปลงไปตามระยะเวลา เช่นความสามารถทางสมองของเด็ก การเว้นช่วงเวลาระหว่างการสอบยาวนานเกินไปจะมีแนวโน้มการประมาณค่าความเชื่อมั่นต่ำ ความแตกต่างของการเว้นช่วงระยะเวลาจะมีอิทธิพลต่อการประมาณค่าความเชื่อมั่น ในบางครั้งจะมีผลการประมาณค่าความเชื่อมั่นต่ำหรือสูงเกินไป
การประมาณค่าความเชื่อมั่นของการสอบซ้ำอยู่บนพื้นฐานของการออกแบบที่ตรงไปตรงมา สัมพันธ์กันง่ายกับผลของการใช้แบบทดสอบซ้ำ carry-over effects และการเว้นระยะเวลาสอบซ้ำมีอิทธิพลต่อการประมาณค่าความเชื่อมั่นแบบสอบซ้ำ การประมาณค่าความเชื่อมั่นของการสอบซ้ำจะมีความเหมาะสมมากสำหรับแบบทดสอบที่วัดคุณลักษณะที่ไม่อ่อนไหวต่อ carry-over effects และมีความคงที่เมื่อเว้นช่วงห่างของการสอบซ้ำ เช่น ใช้การประมาณค่าความเชื่อมั่นกับแบบทดสอบที่ใช้โสตประสาทสัมผัสทั้งห้า (เช่นแบบทดสอบวัดการมองเห็น หรือการฟัง)

การประมาณค่าความเชื่อมั่นด้วยการใช้แบบทดสอบคู่ขนานและแบบทดสอบทางเลือก

ความเชื่อมั่นของการใช้แบบทดสอบคู่ขนานสามารถคำนวณได้ด้วยสูตร เป็นสหสัมพันธ์ระหว่างคะแนนที่สังเกตของแบบทดสอบสองฉบับที่คู่ขนานกันแบบพาราเรล (parelle) ในทางปฏิบัติเป็นไปไม่ได้ที่จะมีแบบทดสอบสองฉบับที่คู่ขนานกัน และแบบทดสอบทางเลือกที่มักนำมาใช้แทนที่แบบทดสอบคู่ขนานเสมอ แบบทดสอบทางเลือกคือแบบทดสอบอีกฉบับหนึ่งที่มีโครงสร้างที่มีผลต่อแบบทดสอบคู่ขนาน แบบทดสอบคู่ขนานและแบบทดสอบทางเลือกนี้จะมีความเท่ากันในค่าเฉลี่ยของคะแนนสังเกต ความแปรปรวนของคะแนนสังเกต และสหสัมพันธ์กับแบบทดสอบอื่น อย่างไรก็ตาม ซึ่งยากที่จะหาแบบทดสอบสองฉบับที่มีคุณลักษณะแบบนี้ สหสัมพันธ์ระหว่างคะแนนสังเกตบนแบบทดสอบทางเลือกคือ rXZ เป็นการประมาณค่าความเชื่อมั่นของแบบทดสอบฉบับหนึ่งกับแบบทดสอบทางเลือก สหสัมพันธ์นี้จะมีอิทธิพลต่อความเชื่อมั่นของแบบทดสอบ หรืออีกกรณีหนึ่งก็คือมันคู่ขนานกัน ดังนั้นแบบทดสอบอื่นจะมีแนวโน้มในการประมาณค่าความเชื่อมั่นที่แตกต่างไปจากการทดสอบแบบสอบซ้ำ หรือการประมาณค่าความเชื่อมั่นแบบคู่ขนานจะไม่มีผลต่อช่วงระยะเวลา อย่างไรก็ตามในการใช้แบบทดสอบทางเลือกหรือแบบทดสอบคู่ขนานจะไม่สามารถขจัด carry-over effect ให้หมดไปได้ ซึ่งยังคงมีผลต่อรูปแบบการตอบ อารมณ์หรือเจตคติ carry-over effects ยังคงมีผลต่อการประมาณค่า หรือ ให้สูงกว่าหรือต่ำกว่าความเป็นจริง ช่วงเวลายังคงมีปัญหา การเว้นช่วงเวลาที่สั้นไประหว่างการสอบสองฉบับจะมีผลเนื่องมาจากความจำ การฝึกฝนและอารมณ์ การเว้นช่วงเวลาที่นานเกินไปจะไม่เหมาะกับแบบทดสอบที่วัดคุณลักษณะที่เปลี่ยนแปลงไปตามเวลา
เมื่อแบบทดสอบทางเลือก X และ Z ไม่มีความคู่ขนานกันแล้ว rXZ โดยทั่วไปจะเป็นตัวประมาณค่าที่ไม่ถูกต้องของ หรือ ตัวอย่างเช่น ให้ X = TX + EX และ Z = TZ + EZ ถ้า TX = TZ แต่ แล้ว X จะมีความเชื่อมั่นน้อยกว่า Z สหสัมพันธ์ rXZ จะมีแนวโน้มประมาณค่าได้สูงกว่า และประมาณค่าได้ต่ำกว่า ถ้า TX ¹ TZ เป็นไปได้ว่าแบบทดสอบสองฉบับนี้จะวัดคุณลักษณะที่แตกต่างกัน และ rXZ จะมีแนวโน้มประมาณค่าได้ต่ำกว่า และ ตัวอย่างเช่น ถ้า X คือคะแนนของแบบทดสอบคณิตศาสตร์คำนวณ และ Z คือคะแนนของแบบทดสอบคณิตศาสตร์เหตุผล rXZ คือสหสัมพันธ์ระหว่างคะแนนคณิตศาสตร์คำนวณและคณิตศาสตร์เหตุผล และไม่จำเป็นว่าจะต้องเป็นตัวประมาณค่าที่ดีของความเชื่อมั่นในแบบทดสอบทั้งสองฉบับ
เป็นไปได้ที่แบบทดสอบทางเลือกจะมีความไม่เท่ากันของคะแนนจริงและความแปรปรวนของคะแนนคลาดเคลื่อน แม้ว่าสหสัมพันธ์ระหว่างคะแนนสังเกตจะเท่ากับความสัมพันธ์ของแบบทดสอบคู่ขนาน ตัวอย่างเช่น ให้ X = TX + EX และ X’ = TX’ + EX’ เมื่อ X และ X’ คือคะแนนของแบบทดสอบคู่ขนาน ให้ Z = aX’ + b เมื่อ a และ b คือค่าคงที่ และ a > 0 นั่นคือ Z เป็นฟังก์ชันเชิงเส้นของ X’ แม้ว่า Z และ X จะไม่ใช่แบบทดสอบคู่ขนาน (TZ ¹ TX และ ) rXZ = rXX’ เมื่อ Z คือฟังก์ชันเชิงเส้นของ X’ สหสัมพันธ์ของ X และ Z จะเท่ากับสหสัมพันธ์ของ X กับ X’
สรุป สหสัมพันธ์ระหว่างคะแนนสังเกตบนแบบทดสอบทางเลือกให้การประมาณค่าความเชื่อมั่นที่ดีถ้าแบบทดสอบทางเลือกมีความคู่ขนานกันหรือคะแนนมีความสัมพันธ์กันเชิงเส้นตรง และถ้า carry-over effect และการเปลี่ยนแปลงของคะแนนที่ขึ้นอยู่กับช่วงเวลาห่างไม่มีผลต่อสหสัมพันธ์

การประมาณค่าความเชื่อมั่นด้วยวิธีหาความสอดคล้องภายใน : แบบแบ่งครึ่ง

ความเชื่อมั่นแบบสอดคล้องภายในจะถูกประมาณค่าด้วยการใช้แบบทดสอบเพียงฉบับเดียวสอบเพียงครั้งเดียว ดังนั้นจึงเป็นการหลีกเลี่ยงปัญหาที่เกิดขึ้นจากวิธีสอบซ้ำ วิธีนี้เป็นที่นิยมใช้กันอย่างแพร่หลาย แบบทดสอบจะถูกแบ่งครึ่งออกเป็นสองส่วน ซึ่งแต่ละส่วนจะคู่ขนานกันแบบพาราเรล (parelle) การประมาณค่าความเชื่อมั่นของแบบทดสอบจะใช้สูตรสเปียร์แมนบราวน์ (Spearman-Brown formula) แต่ถ้าทั้งสองส่วนนั้นคู่ขนานกันแบบทอ (essentially t–equivalent) จะใช้สัมประสิทธิ์แอลฟา (a-coefficient) ในการประมาณค่าความเชื่อมั่นของแบบทดสอบ
การใช้สูตรสเปียร์แมนบราวน์ คะแนนจากแบบทดสอบแบ่งครึ่ง (เรียกว่า Y และ Y’) จะนำมาหาสหสัมพันธ์กัน ผลที่ได้คือ rYY’ สหสัมพันธ์นี้จะเป็นการวัดความเชื่อมั่นของแบบทดสอบเพียงครึ่งฉบับ ความเชื่อมั่นของแบบทดสอบทั้งฉบับ X = Y + Y’ ควรจะมีค่ามากกว่าความเชื่อมั่นของแบบทดสอบเพียงแค่ครึ่งฉบับ สูตรสเปียร์แมนบราวน์จะให้ค่าความเชื่อมั่นของแบบทดสอบทั้งฉบับ คือ

ตาราง 1 จะแสดงค่าความเชื่อมั่น โดยปกติ rXX’ จะมีค่าสูงกว่า rYY’ เพราะ rXX’ เป็นค่าความเชื่อมั่นของแบบทดสอบทั้งฉบับ และ rYY’ เป็นค่าความเชื่อมั่นของแบบทดสอบเพียงครึ่งฉบับ

ตาราง 1 สหสัมพันธ์ระหว่างแบบทดสอบที่แบ่งครึ่งฉบับ (rYY’) และความเชื่อมั่นของแบบทดสอบทั้งฉบับ (rXX’)

rXX’
rYY’
0.00
0.33
0.57
0.75
0.89
1.00
0.00
0.20
0.40
0.60
0.80
1.00

สูตรสเปียร์แมนบราวน์สามารถใช้หาความเชื่อมั่นของแบบทดสอบที่แบ่งครึ่งฉบับแล้วมีความคู่ขนานกันแบบพาราเรล (parallel) แต่ถ้าคะแนนแบ่งครึ่งนั้นไม่มีความเท่ากันในความแปรปรวนหรืออื่น ๆ ที่บ่งชี้ว่าไม่คู่ขนานกันแบบพาราเรล (parallel) แล้ว ก็จะใช้สัมประสิทธิ์แอลฟา ในการประมาณค่าความเชื่อมั่น ถ้าสองส่วนที่แบ่งครึ่งนั้นมีความคู่ขนานกันแบบทอ (essentially t–equivalent) แต่ถ้าทั้งสองส่วนที่แบ่งครึ่งไม่มีความคู่ขนานกันแบบทอแล้ว ค่าสัมประสิทธิ์แอลฟาก็จะประมาณค่าความเชื่อมั่นได้ต่ำ (นั่นคือความเชื่อมั่นของแบบทดสอบต้องสูงกว่าหรือเท่ากับผลที่ได้จากสูตรสัมประสิทธิ์แอลฟา) ถ้าผลของสัมประสิทธิ์แอลฟามีค่าสูงแน่นอนว่าค่าความเชื่อมั่นของแบบทดสอบต้องมีค่าสูง ถ้าสัมประสิทธิ์แอลฟามีค่าต่ำ คุณไม่รู้ว่าความเชื่อมั่นของแบบทดสอบต่ำหรือแบบทดสอบที่แบ่งครึ่งไม่คู่ขนานกันแบบทอ สูตรสำหรับสัมประสิทธิ์แอลฟาแบ่งครึ่งคือ

เมื่อ และ คือความแปรปรวนของคะแนนแบบทดสอบที่แบ่งครึ่งฉบับเป็นส่งที่ 1 และส่วนที่ 2 และ คือความแปรปรวนของคะแนนบนแบบทดสอบทั้งฉบับ กับ X = Y1 + Y2
สมการคำนวณสัมประสิทธิ์แอลฟาและสูตรสเปียร์แมนบราวน์จะมีค่ามากถ้าแบบทดสอบที่แบ่งครึ่งมีความสัมพันธ์กันสูงและจะมีค่าต่ำเมื่อแบบทดสอบที่แบ่งครึ่งไม่มีความสัมพันธ์กัน แบบทดสอบที่แบ่งครึ่งจะมีความสัมพันธ์กันสูงเมื่อแบบทดสอบวัดคุณลักษณะเดียวกัน ดังนั้นความเชื่อมั่นแบบสเปียร์แมนบราวน์และสัมประสิทธิ์แอลฟาจะบ่งชี้ถึงแบบทดสอบที่มีความสอดคล้องภายในหรือเป็นเอกพันธ์กัน
ถ้าความแปรปรวนของคะแนนสังเกตของแบบทดสอบที่แบ่งครึ่งเท่ากัน สูตรสเปียร์แมนบราวน์และสูตรสัมประสิทธิ์แอลฟาจะมีค่าเท่ากัน ถ้าความแปรปรวนของคะแนนสังเกตของแบบทดสอบที่แบ่งครึ่งเท่ากันแต่ครึ่งนั้นไม่คู่ขนานกันแบบทอ ทั้งสูตรสเปียร์แมนบราวน์และสัมประสิทธิ์แอลฟาจะมีค่าความเชื่อมั่นต่ำกว่าความจริง ถ้าความแปรปรวนของคะแนนสังเกตของแบบทดสอบแบ่งครึ่งเท่ากันและสองส่วนนั้นคู่ขนานกันแบบทอแล้ว สูตรสเปียร์แมนบราวน์และสัมประสิทธิ์แอลฟาจะได้ค่าความเชื่อมั่นเท่ากัน
การใช้การประมาณค่าความเชื่อมั่นแบบแบ่งครึ่งสามารถแสดงได้ด้วยตัวอย่างดังนี้
สมมติว่าสหสัมพันธ์ระหว่างแบบทดสอบครึ่งฉบับเป็น 0.5 ความแปรปรวนของคะแนนคือ 7 และ 5 และความแปรปรวนของคะแนนรวมคือ 17.9 ใช้สูตรสเปียร์แมนบราวน์คำนวณค่าความเชื่อมั่นโดยรวมทั้งฉบับได้

ความเชื่อมั่นของแบบทดสอบทั้งฉบับประมาณค่าด้วยสัมประสิทธิ์แอลฟาได้ดังนี้

ตัวอย่างนี้สัมประสิทธิ์แอลฟาประมาณค่าความเชื่อมั่นได้ต่ำกว่าสูตรสเปียร์แมนบราวน์เพียงเล็กน้อย
ประโยชน์หลักของการประมาณค่าความเชื่อมั่นด้วยวิธีหาความสอดคล้องภายในคือใช้แบบทดสอบเพียงฉบับเดียวสอบเพียงครั้งเดียว อย่างไรก็ตามวิธีหาความสอดคล้องภายในไม่เหมาะสมเมื่อแบบทดสอบไม่สามารถแบ่งออกเป็นส่วน ๆ ที่คู่ขนานกันแบบพาราเรล (parallel) หรือแบบทอ (essentially t–equivalent) ได้ หรือเมื่อแบบทดสอบไม่มีข้อสอบที่เป็นอิสระจากกันทำให้ไม่สามารถแบ่งออกเป็นส่วน ๆ ได้ ตัวอย่างเช่น ในบางแบบทดสอบผู้สอบต้องจัดการกับวัตถุในช่วงเวลาที่กำหนดไม่สามารถจะแยกออกเป็นส่วน ๆ ได้ เพราะว่าการจัดการกับวัตถุในแต่ละชิ้นขึ้นอยู่กับเวลาและความคลาดเคลื่อนในขณะทำงานกับวัตถุชิ้นอื่น ๆ ในสถานการณ์นี้ การประมาณค่าความเชื่อมั่นแบบสอบซ้ำกับการใช้แบบทดสอบอื่นจะเหมาะสมมากกว่า
มีสามวิธีในการแบ่งครึ่งแบบทดสอบที่นิยมใช้กัน วิธีแรกจะเรียกว่า วิธีแบ่งข้อคู่ข้อคี่ (odd/even method) เป็นการจัดแบ่งข้อสอบออกเป็นสองกลุ่มโดยอาศัยตัวเลขข้อเป็นหลักในการแบ่ง ผู้สอบแต่ละคนจะมีคะแนนของแบบทดสอบในกลุ่มข้อคู่และข้อคี่ วิธีที่สองคือแบบเรียงอันดับ (order method) คือจะแบ่งข้อสอบออกเป็นครึ่งแรกกับครึ่งหลัง ผู้สอบแต่ละคนจะมีคะแนนของแบบทดสอบในครึ่งแรกและครึ่งหลังของแบบทดสอบ โดยทั่วไปการแบ่งครึ่งแรกกับครึ่งหลังจะมีความเหมาะสมน้อยกว่าแบบแบ่งข้อคู่และข้อคี่ เพราะว่าผู้สอบบางคนอาจจะได้รับอิทธิพลของการฝึกฝนจากข้อสอบที่เพิ่งทำผ่านมา (มีอิทธิพลกับแบบทดสอบครึ่งหลังให้คะแนนสูงกว่าปกติ) และผู้สอบบางคนทำแบบทดสอบไม่เสร็จ (มีอิทธิพลกับแบบทดสอบครึ่งหลังให้คะแนนต่ำกว่าปกติ) อย่างไรก็ตาม ปัญหาของผู้สอบบางคนที่ทำไม่เสร็จในครึ่งหลังของแบบทดสอบสามารถแก้ไขได้ด้วยการแบ่งครึ่งเวลา นั่นคือผู้สอบทำแบบทดสอบไปจนเสร็จครึ่งแรกและเมื่อเวลาหมด ผู้สอบทั้งหมดจึงค่อยลงมือทำแบบทดสอบครึ่งที่สอง จะช่วยให้ผู้สอบได้ทำแบบทดสอบสมบูรณ์ในทั้งครึ่งแรกและครึ่งหลัง การแบ่งครึ่งชนิดนี้จะมีความเท่าเทียมกับการใช้แบบทดสอบทางเลือกฉบับสั้น 2 ฉบับ
วิธีที่สามสำหรับการแบ่งครึ่งแบบทดสอบให้เท่าเทียมกันนี้เป็นวิธีที่ใหม่กว่าสองวิธีแรก วิธีนี้เรียกว่าการจับคู่แบบทดสอบย่อยอย่างสุ่ม (matched random subsets) ซึ่งมีอยู่หลายขั้นตอน ดังนี้
1. ต้องคำนวณสถิติของข้อสอบสองตัวคือ
1.1 สัดส่วนของผู้สอบที่ทำข้อสอบนั้นถูก (ความยากง่ายของข้อสอบ)
1.2 สหสัมพันธ์ไบซีเรียบหรือพอยท์ไบซีเรียลระหว่างคะแนนแบบทดสอบกับคะแนนรวม (อำนาจจำแนกของข้อสอบ)
2. ในข้อสอบแต่ละข้อพล็อตกราฟโดยใช้สถิติสองตัวนี้ ข้อสอบจะถูกจับคู่กันบนกราฟ โดยสองจุดใด ๆ ที่อยู่ใกล้กันให้จับทั้งคู่สุ่มไปใส่ในกลุ่มครึ่งฉบับ ตัวอย่างในภาพประกอบ 4 แสดงข้อสอบ 6 ข้อที่ถูกพล็อตลงบนกราฟ และจับกลุ่มเป็นคู่ ถ้าข้อ A ถูกเลือกเข้ากลุ่มครึ่งแรกแล้ว ข้อสอบ B ก็จะปรากฏอยู่ในอีกครึ่งหนึ่ง ความเป็นไปได้ของแบบทดสอบที่จะถูกสุ่มเข้ากลุ่มเป็นดังนี้ ACE และ BDF, ADE และ BCF, ACF และ BDE และอื่น ๆ วิธีนี้จะช่วยให้แน่ใจว่าสองส่วนนั้นมีความยากง่ายและอำนาจจำแนกเหมือนกันและการวัดนั้นก็วัดในสิ่งเดียวกัน (ดังนั้นคะแนนจริงจึงเท่ากัน)

ภาพประกอบ 4 การเลือกแบบทดสอบย่อยโดยใช้วิธีจับคู่สุ่มด้วยกราฟ

แบบทดสอบที่พิจารณาถึงมิติของความเร็ว (speed test) ตั้งแต่เริ่มทำจนเสร็จและแบบทดสอบที่ใช้เวลาในการคิดนาน (power test) แบบทดสอบที่ใช้ความเร็ว (speed test) สอดคล้องกับข้อสอบที่ผู้สอบทุก ๆ คนสามารถตอบได้ถูกหมดในเวลาที่พอเพียง แต่แบบทดสอบที่ให้เวลาน้อยเกินไปผู้สอบจะต้องพยายามตอบข้อสอบให้ได้โดยเร็ว ตัวอย่างเช่น แบบทดสอบที่ให้คำมาเป็นคู่ จำนวน 100 ข้อแล้วบอกถึงความแตกต่างควรจะทำให้เสร็จภายในเวลา 60 นาที หรืออีกแบบหนึ่งเป็นแบบทดสอบที่ต้องใช้ความสามารถมาก (power test) ซึ่งข้อสอบจะมีความยากให้เวลาไม่จำกัดในการสอบ การตอบได้หรือไม่ได้จึงขึ้นอยู่กับความสามารถของผู้สอบ สามารถตอบคำถามได้ถูกต้องเฉพาะข้อที่แน่ใจ การจำกัดเวลาในการสอบโดยทั่วไปต้องให้แน่ใจว่าผู้สอบแต่ละคนจะสามารถทำข้อสอบแต่ละข้อได้เสร็จ การทดสอบความสามารถหรือผลสัมฤทธิ์โดยมากมักจะใช้ทั้ง speed test และ power test
การประมาณค่าความเชื่อมั่นแบบแบ่งครึ่งไม่ควรใช้กับ speed test เพราะว่าผู้สอบโดยมากจะต้องพยายามตอบให้ถูกต้องภายในเวลาที่จำกัด ถ้าข้อสอบมี 30 ข้อการแบ่งข้อคู่ข้อคี่โดยปกติก็คือ 15 ข้อ และทั้งสองส่วนนี้ควรจะคู่ขนานกัน จะทำให้การประมาณค่าความเชื่อมั่นแบบแบ่งครึ่งมีค่าเข้าใกล้ 1 และถ้าการประมาณค่าความเชื่อมั่นแบบแบ่งครึ่งอยู่บนพื้นฐานของคะแนนที่สัมพันธ์กันระหว่างครึ่งแรกและครึ่งสองของแบบทดสอบ speed test การประมาณค่าความเชื่อมั่นจะเข้าใกล้ 0 ผู้สอบส่วนใหญ่ควรจะทำได้คะแนนดีมากในครึ่งแรก และได้คะแนนไม่ดีในครึ่งหลัง ในกรณีนี้ สหสัมพันธ์ระหว่างคะแนนบนแบบทดสอบที่แบ่งครึ่งควรจะเป็นผลสะท้อนให้เห็นความสมพันธ์ระหว่างความคลาดเคลื่อนของแบบทดสอบครึ่งแรกและความเร็วในการทำแบบทดสอบครึ่งหลัง การประมาณค่าความเชื่อมั่นด้วยวิธีวิธีการจับคู่ข้อสอบก็ไม่เหมาะสมกับ speed test เพราะว่าความยากของข้อสอบและความสัมพันธ์ของข้อสอบกับคะแนนรวมควรจะทำหน้าที่ในการบ่งบอกตำแหน่งของข้อสอบในแบบทดสอบมากกว่าจะบอกคุณลักษณะของข้อสอบ

ความเชื่อมั่นแบบความสอดคล้องภายใน : กรณีทั่วไป

เทคนิคการแบ่งครึ่งข้อสอบ (แบ่งข้อคู่ข้อคี่ แบบเรียงอันดับ และแบบจับคู่อย่างสุ่ม) สามารถทำให้อยู่ในรูปทั่วไปโดยการแบ่งแบบทดสอบออกมากกว่าสองส่วน เช่น วิธีแบ่งข้อคู่ข้อคี่สามารถปรับใช้โดยการแบ่งออกเป็นสามส่วน สำหรับแบบทดสอบที่มี 9 ข้อ โดยอาจจะให้ข้อหนึ่ง สี่ และเจ็ด เป็นส่วนแรก ข้อสอง ห้า และแปด เป็นส่วนที่สอง และข้อสาม หก และเก้า เป็นส่วนที่สาม วิธีการจับคู่อย่างสุ่มอาจจะใช้สามส่วน โดยการเลือกสามข้อที่อยู่ใกล้กันแล้วสุ่มแบ่งออกเป็นสามส่วน
ในหัวข้อนี้จะสมมติว่าแบบทดสอบถูกแบ่งออกเป็น N ส่วน ความแปรปรวนของคะแนนในแต่ละส่วนและความแปรปรวนของคะแนนรวมของแบบทดสอบจะใช้ในการประมาณค่าความเชื่อมั่นของแบบทดสอบ ถ้าในแต่ละส่วน (ข้อสอบ หรือชุดของข้อสอบ) มีความคู่ขนานกันแบบทอ (t-equivalent) สูตรที่นำเสนอในหัวข้อนี้จะให้ค่าความเชื่อมั่นของแบบทดสอบ ถ้าแต่ละส่วนไม่คู่ขนานกันแบบทอ (t-equivalent) สูตรในหัวข้อนี้จะประมาณค่าความเชื่อมั่นได้ต่ำกว่าความเป็นจริง นอกจากนี้ สูตรจะประมาณค่าความเชื่อมั่นได้ดีเมื่อแบบทดสอบวัดคุณลักษณะเดียว นั่นคือเมื่อแบบทดสอบมีเนื้อหาเป็นเอกพันธ์ (homogeneos) แต่แบบทดสอบวัดเชาวน์ปัญญาซึ่งวัดความสามารถทางภาษา มิติสัมพันธ์ และอื่น ๆ ควรจะเป็นวิวิธพันธ์ (heterogeneos) การวัดความเชื่อมั่นแบบความสอดคล้องภายในไม่เหมาะที่จะใช้กับแบบทดสอบที่เป็นวิวิธพันธ์
สูตรสำหรับความเชื่อมั่นแบบความสอดคล้องภายในกรณีทั่วไปคือสัมประสิทธิ์แอลฟา (-coefficient)

เมื่อ X คือ คะแนนรวมของแบบทดสอบที่รวมกัน N ส่วน
X =
คือ ความแปรปรวนของแบบทดสอบที่รวมกัน N ส่วน
คือ ความแปรปรวนของส่วนที่ i , Yi
N คือ จำนวนส่วนที่รวมกันเป็นคะแนน X เช่น ถ้า N = 3
คะแนนของแบบทดสอบ X ก็จะมาจากผลรวมของคะแนน
ในสามส่วน
สัมประสิทธิ์แอลฟาโดยทั่วไป นิยมเขียนเป็นสมการว่า

ถ้าในแต่ละส่วนเป็นข้อสอบแบบ 0, 1 (dichotomous) สมการข้างต้นสามารถเขียนในรูปแบบเฉพาะได้ว่า

เมื่อ pi คือสัดส่วนของผู้สอบที่ตอบข้อสอบข้อที่ i ได้ถูกต้องหรือก็คือความยากง่ายนั่นเอง สมการ KR20 ข้างต้นสะท้อนให้เห็นความแปรปรวนของคะแนนในข้อที่ i เมื่อคะแนนของข้อสอบให้คะแนนเป็น 0, 1 เท่ากับ pi(1 - pi) เมื่อ pi คือสัดส่วนของผู้สอบที่ได้ 1 คะแนนในข้อ i (นั่นคือสอบผ่านในข้อนั้น) สมการ KR20 ข้างต้นก็คือสูตร Kuder-Richardson formula 20 เขียนย่อว่า KR20 เพราะว่า Kuder-Richardson นำเสนอสูตรนี้เป็นสูตรที่ 20 อีกชื่อหนึ่งของสูตรนี้ก็คือ coefficient -20 สูตร KR-20 โดยทั่วไปนิยมเขียนเป็นสมการว่า

อีกสูตรหนึ่งของ Kuder-Richardson ก็คือสูตร KR21

เมื่อ`p คือค่าเฉลี่ยของความยากข้อสอบ เพราะว่า`p สามารถคำนวณได้โดยใช้`p = S(X)/N สมการ KR21 สามารถคำนวณโดยใช้ค่าเฉลี่ยและความแปรปรวนของข้อสอบ N ข้อในแบบทดสอบ ซึ่งเป็นกรณีเฉพาะของสูตร KR20 และสูตรนี้ นิยมเขียนเป็นสมการว่า

โดยปกติสูตร KR20 และ KR21 จะเกี่ยวข้องกันโดยที่
KR20 ³ KR21
ทั้งสองสูตรนี้จะมีค่าเท่ากันเมื่อความยากง่ายของข้อสอบเท่ากันทุกข้อ ถ้าข้อสอบมีค่าความยากง่ายไม่เท่ากันแล้ว KR21 จะประมาณค่าได้ต่ำกว่า KR20 และเป็นการประมาณค่าความเชื่อมั่นที่ต่ำกว่าความเป็นจริง
ผลต่างของสูตร KR20 และ KR21 เสนอโดย Tucker (1949) ดังนี้
KR20 - KR21 = =
ผลจากสูตร  และ KR20 จะประมาณค่าได้ต่ำกว่าหรือเท่ากับความเชื่อมั่นแท้จริงของแบบทดสอบ จะประมาณค่าได้เท่ากับความเชื่อมั่นแท้จริงของแบบทดสอบเมื่อในแต่ละองค์ประกอบ (Yi) มีความคู่ขนานกันแบบทอ (t-equivalent) (นั่นคือจำเป็นที่คะแนนจริงจะต้องเท่ากัน) ส่วน KR21 จะเท่ากับความเชื่อมั่นแท้จริงของแบบทดสอบถ้าข้อสอบมีความยากง่ายเท่ากันและคู่ขนานกันแบบทอ (t-equivalent) และทั้งสามสูตรที่นำเสนอข้างต้นนี้จะให้ค่าความเชื่อมั่นสูงถ้าคะแนนในแต่ละส่วนกับคะแนนรวมมีความสัมพันธ์กันสูง และจะให้ค่าความเชื่อมั่นต่ำถ้าคะแนนในแต่ละส่วนกับคะแนนรวมมีความสัมพันธ์กันต่ำ ในแต่ละส่วนจะมีความสัมพันธ์กันสูงถ้าแบบทดสอบนั้นวัดคุณลักษณะเดียวกัน ดังนั้นสูตรที่นำเสนอในหัวข้อนี้จะเป็นตัวบ่งชี้ถึงความสอดคล้องภายในของแบบทดสอบหรือความเป็นเอกพันธ์ของแบบทดสอบ

ตัวอย่างคำนวณ
ต่อไปนี้จะเป็นตัวอย่างในการใช้สูตรที่นำเสนอในหัวข้อนี้มาประมาณค่าความเชื่อมั่นแบบความสอดคล้องภายใน

ตาราง 2 ข้อมูลสำหรับประมาณค่าความเชื่อมั่น

ข้อสอบ

ผู้สอบ
1
2
3
4
5
6
รวม
1
2
3
4
5
6
7
8
9
10
0
0
1
1
1
0
0
0
1
0
0
0
0
1
1
0
0
0
0
1
0
0
1
1
1
1
1
0
1
0
0
0
1
1
1
0
1
1
1
1
0
1
1
1
1
0
1
0
1
0
0
0
0
1
1
0
0
0
0
1
0
1
4
6
6
1
3
1
4
3

ค่าเฉลี่ย
ส่วนเบี่ยงเบนมาตรฐาน
2.9
2.02

1. กรณีแบบทดสอบถูกแบ่งครึ่งออกเป็น 2 ส่วน โดยส่วนแรกประกอบด้วยข้อ 1 - 3 และส่วนที่สองประกอบด้วยข้อ 4 - 6 และสมมติทั้ง 2 ส่วนคู่ขนานกันแบบพาราเรล (Parallel) สัมประสิทธิ์สหสัมพันธ์ระหว่างสองส่วนเท่ากับ 0.82 ประมาณค่าความเชื่อมั่นด้วยสูตรของสเปียร์แมนบราวน์
SB = = 0.90
2. กรณีแบบทดสอบถูกแบ่งออก 6 ส่วน โดยแต่ละข้อถือเป็น 1 ส่วน และทุกข้อคู่ขนานกันแบบทอ ประมาณค่าสัมประสิทธิแอลฟา KR20 และ KR21
= = 0.80
= = 0.84
= = 0.80
ผลต่างของ KR20 และ KR21 คำนวณได้ด้วยสูตรของทัคเกอร์ (Tucker) ดังนี้
KR20 - KR21 = = = 0.04

สูตรสเปียร์แมนบราวน์ : กรณีทั่วไป

อีกวิธีการหนึ่งในการประมาณค่าความเชื่อมั่นของแบบทดสอบก็คือสูตรสเปียร์แมน
บราวน์ สูตรสเปียร์แมนบราวน์จะใช้ในการทำนายอิทธิพลที่เปลี่ยนแปลงไปของความยาวของแบบทดสอบที่จะมีต่อค่าความเชื่อมั่น สูตรนี้จะอ้างอิงกับการประมาณค่าความเชื่อมั่นแบบแบ่งครึ่ง สูตรสเปียร์แมนบราวน์โดยทั่วไปคือ

เมื่อ X คือคะแนนรวมของแบบทดสอบที่สังเกตได้จากการรวมคะแนนในแต่ละองค์ประกอบที่คู่ขนานกันแบบพาราเรลของแบบทดสอบ, X =
Yi คือคะแนนของแบบทดสอบในแต่ละองค์ประกอบ
คือความเชื่อมั่นของแบบทดสอบทั้งฉบับ (X)
คือความเชื่อมั่นของในแต่ละองค์ประกอบ (Yi) และ
N คือจำนวนขององค์ประกอบที่คู่ขนานกันแบบพาราเรลที่รวมกันเป็นฉบับ X

ภาพประกอบ 5 ความสัมพันธ์ระหว่างความยาวของแบบทดสอบและความเชื่อมั่น

สูตรสเปียร์แมนบราวน์จะแสดงค่าความเชื่อมั่นของแบบทดสอบ ในเทอมของความเชื่อมั่นในแต่ละองค์ประกอบที่คู่ขนานกันของแบบทดสอบ สังเกตว่าในสูตรนี้ จะมีค่ามากกว่าหรือเท่ากับ เสมอ ค่าความเชื่อมั่นของแบบทดสอบที่เกิดจากการรวมองค์ประกอบที่คู่ขนานกันต้องมีค่ามากกว่าหรือเท่ากับค่าความเชื่อมั่นขององค์ประกอบใดองค์ประกอบหนึ่ง ซึ่งค่าความเชื่อมั่น ในบางครั้งเรียกว่า Stepped-up reliability เพราะคือการปรับแก้ค่าความเชื่อมั่นให้สูงขึ้นจากความเชื่อมั่นในฉบับที่สั้นกว่า
ภาพประกอบ 5 จะแสดงอิทธิพลโดยทั่วไปของการเปลี่ยนแปลงความยาวแบบทดสอบที่จะมีผลกับ สำหรับแบบทดสอบที่แต่ละองค์ประกอบมีค่าความเชื่อมั่น เป็น 0.2, 0.4, 0.6 และ 0.8 เมื่อเราทราบค่าของสองจำนวนจากสามจำนวนคือ N, และ แล้ว เราสามารถหาจำนวนที่สามได้ ถ้า = 0.4 และ = 0.8 แบบทดสอบนี้จะยาวกว่าแบบทดสอบเดิม 6 เท่า (N = 6) ภาพประกอบ 5 จะแสดงการเพิ่มขึ้นของความยาวแบบทดสอบที่สัมพันธ์กับความเชื่อมั่นของแบบทดสอบ เมื่อ N -> µ แล้ว ความเชื่อมั่นของแบบทดสอบที่มี N องค์ประกอบจะมีค่าถึง 1.0 โดยที่ ¹ 0
สมการข้างต้นจะใช้เมื่อเรารู้ N และ และต้องการหาค่า เมื่อเรารู้ความเชื่อมั่นของแบบทดสอบ และต้องการกำหนดความเชื่อมั่นของแบบทดสอบในฉบับที่สั้นกว่า ( ) และมีความยาวเป็น 1/N เท่าของฉบับเต็ม สูตรสเปียร์แมนบราวน์จะเขียนได้ใหม่เป็น

ในกรณีที่รู้ค่า และ เราสามารถแก้สมการของสเปียร์แมนบราวน์ใหม่ได้ว่า

ต่อไปนี้จะแสดงตัวอย่างของการประยุกต์ใช้สูตรสเปียร์แมนบราวน์ในการประมาณค่าความเชื่อมั่น (rXX’ และ rYY’) แทนค่าความเชื่อมั่นของประชากร ( และ ) การประมาณค่าความเชื่อมั่นนี้ สามารถใช้ควบคู่ไปกับการประมาณค่าความเชื่อมั่นแบบสอบซ้ำ แบบคู่ขนาน แบบทดสอบทางเลือก หรือแบบความสอดคล้องภายใน
1. คุณมีแบบทดสอบที่ใช้เวลาในการสอบเพียง 5 นาทีและประมาณค่าความเชื่อมั่นได้ 0.6 ถ้าคุณต้องการเพิ่มแบบทดสอบอีก 3 เท่าที่คู่ขนาน ความเชื่อมั่นของแบบทดสอบที่ยาวกว่าคืออะไร ในที่นี้ N = 3, rYY’ = 0.6 ใช้สมการสเปียร์แมนบราวน์คำนวณได้

ความเชื่อมั่นนี้อ้างอิงได้จากภาพประกอบ 5
2. คุณมีข้อสอบ 50 ข้อที่ประมาณค่าความเชื่อมั่นได้ 0.9 ถ้าคุณเอาข้อสอบออกมา 10 ข้อแล้ว ความเชื่อมั่นของแบบทดสอบ 10 ข้อนั้นคือเท่าไหร่ ในที่นี้ N = 5, rXX’ = 0.9 และเราจะคำนวณ rYY’ ได้ดังนี้

3. คุณมีแบบทดสอบฉบับสั้น 10 ข้อที่มีค่าความเชื่อมั่น 0.8 แบบทดสอบควรจะยาวเท่าไหร่จึงจะมีค่าความเชื่อมั่น 0.9 ในที่นี้ rYY’ = 0.8, rXX’ = 0.9 และเราจะคำนวณหาความยาวของแบบทดสอบได้ดั้งนี้

แบบทดสอบใหม่ควรจะมีความยาวเป็น 2.25 เท่าของแบบทดสอบเดิมหรือก็คือ 23 ข้อ
สูตรสเปียร์แมนบราวนี้จะอยู่บนพื้นฐานขององค์ประกอบแต่ละองค์ประกอบในแบบทดสอบต้องคู่ขนานกันแบบพาราเรล รวมทั้งชุดของข้อสอบหรือองค์ประกอบที่เพิ่มเข้าไปในแบบทดสอบด้วย ถ้าเพิ่มอย่างระมัดระวังข้อสอบที่เพิ่มมีความคู่ขนานกับข้อสอบเดิมในฉบับ ความเชื่อมั่นควรจะสูงขึ้น แต่ถ้าเพิ่มอย่างไม่ระวัง ความเชื่อมั่นจะลดต่ำลง อย่างไรก็ตาม แบบทดสอบที่ยาวกว่าย่อมมีความเชื่อมั่นสูงกว่า เพราะว่าข้อตกลงเบื้องต้นของทฤษฏีคะแนนจริงมาตรฐานเดิม เมื่อ N เพิ่มขึ้น ความแปรปรวนของคะแนนจริงจะเพิ่มมากกว่าความแปรปรวนของความคลาดเคลื่อน
ถ้าข้อสอบหรือองค์ประกอบของแบบทดสอบไม่คู่ขนานกันแล้ว สูตรสเปียร์แมนบราวน์จะประมาณค่าได้ต่ำกว่าหรือสูงกว่าความเป็นจริง ตัวอย่างเช่น แบบทดสอบ 10 ข้อคำนวณค่าความเชื่อมั่นได้ 0.6 เมื่อเพิ่มข้อสอบที่คู่ขนานกับข้อสอบเดิมอีกเท่าตัว จะได้ค่าความเชื่อมั่น [2(0.6)]/[1+(0.6)] = 0.75 อย่างไรก็ตาม ถ้าข้อสอบที่เพิ่มเข้าไปไม่คู่ขนานกับข้อสอบเดิม โดยข้อสอบ 10 ข้อใหม่ที่เพิ่มเข้าไปนั้นไม่มีความแปรปรวน จึงไม่มีผลต่อคะแนนของผู้สอบ จึงไม่ช่วยเพิ่มค่าความเชื่อมั่นให้สูงขึ้น ในกรณีนี้ข้อสอบ 20 ข้อจะได้ค่าความเชื่อมั่นเท่ากับ 0.6 (เท่ากับแบบทดสอบฉบับเดิม)
ในอีกสถานการณ์หนึ่ง สูตรสเปียร์แมนบราวน์สามารถประมาณค่าความเชื่อมั่นได้ต่ำกว่าความเป็นจริง ตัวอย่างเช่น สมมติว่าข้อสอบ 10 ข้อมีความเชื่อมั่น 0.0 สูตรสเปียร์แมนบราวน์คำนวณค่าความเชื่อมั่นเมื่อเพิ่มข้อสอบอีกเท่าตัวที่คู่ขนานกับข้อสอบเดิมได้ [2(0.0)]/[1+(0.0)] = 0.0 อย่างไรก็ตาม ถ้าข้อสอบที่เพิ่มเข้าไปไม่มีความคู่ขนานกับแบบทดสอบเดิมแล้ว ความเชื่อมั่นใหม่ที่คำนวณได้จะได้เท่ากับ 0.7 ความเชื่อมั่นของข้อสอบฉบับใหม่ 20 ข้อจะประมาณค่าได้มากกว่า 0.0 ในกรณีนี้การใช้สูตรสเปียร์แมนบราวน์ที่ไม่เหมาะสมจะทำให้ประมาณค่าความเชื่อมั่นได้ต่ำกว่าความเป็นจริง ผลของความเชื่อมั่นที่ใช้สูตรสเปียร์แมนบราวน์จะมีความถูกต้องเมื่อข้อสอบหรือองค์ประกอบที่เพิ่มเข้าไปมีความคู่ขนานกัน
สามารถประยุกต์ใช้สูตรสเปีรย์แมนบราวน์ได้ในอีกสองสถานการณ์คือ สถานการณ์แรก เมื่อต้องการเปรียบเทียบความเชื่อมั่นของแบบทดสอบสองฉบับที่มีความยาวของแบบทดสอบต่างกัน แบบทดสอบที่ยาวมากกว่าดูเหมือนจะมีค่าความเชื่อมั่นสูงกว่า การประยุกต์ใช้สูตรสเปียร์แมนบราวน์จะช่วยให้เราประมาณค่าความเชื่อมั่นของแบบทดสอบถ้าสองฉบับนั้นมีความยาวเท่ากัน สถานการณ์ที่สอง เพราะว่าแบบทดสอบที่สั้นมากมีแนวโน้มจะมีค่าความเชื่อมั่นที่ต่ำกว่าแบบทดสอบที่ยาวกว่า ซึ่งควรจะมีความระมัดระวังเมื่อมีการเปรียบเทียบคะแนนจากแบบทดสอบฉบับสั้น

เปรียบเทียบวิธีการประมาณค่าความเชื่อมั่น

เราได้อธิบายความแตกต่างของวิธีการประมาณค่าความเชื่อมั่นของแบบทดสอบและวิธีการที่แตกต่างกันนี้จะคำนวณค่าความเชื่อมั่นได้ต่างกัน ในการประมาณค่าความเชื่อมั่นของแบบทดสอบ speed test นั้น ควรจะใช้การประมาณค่าความเชื่อมั่นแบบสอบซ้ำ แบบทดสอบทางเลือกหรือแบบทดสอบคู่ขนาน เพราะว่าถ้าจะใช้การประมาณค่าความเชื่อมั่นด้วยวิธีหาความสอดคล้องภายในจะไม่ถูกต้อง การใช้สัมประสิทธิ์แอลฟาและสูตรคูเดอร์ริชาร์ดสันจะให้ค่าความเชื่อมั่นขั้นต่ำ ซึ่งค่าความเชื่อมั่นขั้นต่ำนี้จะเท่ากับค่าความเชื่อมั่นของแบบทดสอบ ถ้าข้อสอบหรือแต่ละส่วนในแบบทดสอบมีความคู่ขนานกันแบบทอ (essentially t-equivalent) สัมประสิทธิ์แอลฟาและสูตรคูเดอร์ริชาร์ดสันควรจะใช้เมื่อข้อสอบเป็นเอกพันธ์กัน ถ้าแบบทดสอบที่วัดมีหลายคุณลักษณะ สูตรสัมประสิทธิ์แอลฟาและคูเดอร์ริชาร์ดสันก็จะไม่เหมาะ สูตรสเปียร์แมนบราวน์สามารถประมาณค่าได้ต่ำกว่าหรือสูงกว่าความเป็นจริงถ้าข้อสอบหรือองค์ประกอบในแบบทดสอบไม่คู่ขนานกันแบบพาราเรล เมื่อข้อสอบหรือองค์ประกอบในแบบทดสอบมีความคู่ขนานกันแบบพาราเรลแล้ว สูตรสเปียร์แมนบราวน์จะมีประโยชน์ในการประมาณค่าความเชื่อมั่นของแบบทดสอบเมื่อความยาวเปลี่ยนไป

ความเชื่อมั่นของแบบทดสอบแบบอิงเกณฑ์

ผลการวัดควรจะต้องมีความถูกต้องแม่นยำ ปราศจากความคลาดเคลื่อน มีผู้เสนอวิธีการคำนวณหาความเชื่อมั่นของข้อสอบอิงเกณฑ์หลายวิธีดังนี้

1. วิธีของคาร์เวอร์ (Carver) ใช้แบบทดสอบคู่ขนาน โดยให้ข้อสอบคล้ายกันข้อต่อข้อ แล้วนำไปสอบนักเรียน แล้วนำข้อมูลที่ได้มาสร้างตารางดังนี้

ฉบับ B
ฉบับ A
สอบไม่ผ่าน
สอบผ่าน
สอบผ่าน
b
a
สอบไม่ผ่าน
c
d

ค่าความเชื่อมั่น =

ตัวอย่างคำนวณ
นักเรียน 8 คน ทำแบบทดสอบอิงเกณฑ์ 2 ฉบับ ฉบับละ 10 ข้อ คะแนนจุดตัดคือ 5 คะแนน มีผลการสอบดังนี้

คนที่
1
2
3
4
5
6
7
8
ฉบับที่ 1
7
8
9
4
5
3
4
5
ฉบับที่ 2
6
8
7
5
6
4
4
3

คำนวณค่าความเชื่อมั่นของแบบทดสอบอิงเกณฑ์ ดังตาราง

ฉบับ 2
ฉบับ 1
สอบไม่ผ่าน
สอบผ่าน
สอบผ่าน
1
4
สอบไม่ผ่าน
2
1

พบว่ามีผู้สอบผ่านทั้ง 2 ฉบับจำนวน 4 คน และสอบไม่ผ่านทั้ง 2 ฉบับจำนวน 2 คน แทนค่าคำนวณค่าความเชื่อมั่นดังนี้
ค่าความเชื่อมั่น = = 0.75

2. วิธีของลิวิงสตัน (Livingston) ใช้การสอบครั้งเดียวหลังเรียนจบ แล้วคำนวณด้วยสูตร
rcc =

เมื่อ rtt คือความเชื่อมั่นของแบบทดสอบที่คำนวณด้วยวิธีอิงกลุ่ม
(เช่น KR-20, KR-21 ฯลฯ)
2 คือความแปรปรวนของคะแนนสอบทั้งฉบับ
`X คือคะแนนเฉลี่ยของคะแนนสอบทั้งฉบับ
c คือคะแนนจุดตัด
วิธีใช้ได้ผลดีเมื่อคะแนนมีการกระจายแบบฐานนิยมเดียว

ตัวอย่างคำนวณ
ผลการสอบข้อสอบจำนวน 10 ข้อ มีคะแนนเฉลี่ย 6.4 และความแปรปรวนคือ 1.8 มีคะแนนจุดตัดคือ 5 มีค่าความเชื่อมั่นที่คำนวณจากสูตร KR-20 คือ 0.86 คำนวณค่าความเชื่อมั่นแบบอิงเกณฑ์ได้ดังนี้
rcc =
=
= 3.508/3.76
= 0.9329

3. วิธีของสวามินาทานและคณะ (Swaminathan) วิธีนี้ใช้แบบทดสอบฉบับเดียวแต่สอบซ้ำ 2 ครั้งหลังจากสิ้นสุดการสอน เพื่อดูความคงเส้นคงวา

สอบครั้งที่ 1
สอบครั้งที่ 2
สอบผ่าน
สอบไม่ผ่าน
สอบผ่าน
a
b
สอบไม่ผ่าน
c
d

ค่าความเชื่อมั่น (K) =
เมื่อ

ตัวอย่างคำนวณ
จากข้อมูลในตัวอย่างคำนวณค่าความเชื่อมั่นด้วยวิธีของคาร์เวอร์

ฉบับ 2
ฉบับ 1
สอบผ่าน
สอบไม่ผ่าน
สอบผ่าน
4
1
สอบไม่ผ่าน
1
2

คำนวณค่าความเชื่อมั่นด้วยวิธีสอบสวามินาธานและคณะ ได้ดังนี้
= 0.75
= = 0.53
ค่าความเชื่อมั่น (K) =
= = 0.468

4. วิธีของโลเวทท์ (Lovett) ใช้การสอบครั้งเดียวหลังเรียน มีสูตรดังนี้

rcc =

เมื่อ xi คือคะแนนของแต่ละคน
k คือจำนวนข้อสอบทั้งฉบับ
c คือคะแนนจุดตัด

ตัวอย่างคำนวณ
แบบทดสอบอิงเกณฑ์ฉบับหนึ่งมี 10 ข้อ มีคะแนนจุดตัดที่ 5 คะแนน ไปสอบกับนักเรียนจำนวน 8 คน ปรากฏผลดังนี้

คนที่
1
2
3
4
5
6
7
8
ผลรวม
คะแนน (X)
7
8
9
4
5
3
4
5
45
X2
49
64
81
16
25
9
16
25
285
(X - c)
2
3
4
-1
0
-2
-1
0
5
(X - c)2
4
9
16
1
0
4
1
0
35

แทนค่าในสูตรคำนวณค่าความเชื่อมั่นของโลเวท ได้ค่าดังนี้
rcc =
=
= 1-0.5238
= 0.4763

อิทธิพลที่มีต่อความเชื่อมั่น

ความเป็นเอกพันธ์ของกลุ่มตัวอย่าง
ขนาดของสัมประสิทธิ์ความเชื่อมั่นขึ้นอยู่กับความแปรปรวนของแต่ละบุคคลบนคะแนนจริงและคะแนนความคลาดเคลื่อน ดังนั้น ความเป็นเอกพันธ์ของกลุ่มผู้สอบมีความสำคัญในการพัฒนาแบบทดสอบและเลือกใช้แบบทดสอบ สมมติว่าแบบทดสอบที่พัฒนาขึ้นวัดความวิตกกังวลในวิชาคณิตศาสตร์ ถ้าแบบทดสอบนี้ใช้กับกลุ่มตัวอย่างกลุ่มหนึ่งที่เลือกเรียนคณิตศาสตร์แล้ว แน่นอนว่านักเรียนแต่ละคนจะต้องได้คะแนนความวิตกกังวลในระดับต่ำ ดังนั้นความแปรปรวนของคะแนนจริงจะต่ำและความเชื่อมั่นก็จะต่ำด้วย ถ้าใช้แบบทดสอบเดียวกันนี้กับอีกกลุ่มตัวอย่างหนึ่งที่มีลักษณะแตกต่างกันออกไป คะแนนจริงจะมีความแปรปรวนสูงมาก สมมติว่าควบคุมความแปรปรวนของความคลาดเคลื่อนให้คงที่ และขนาดของกลุ่มตัวอย่างเท่ากัน สัมประสิทธิ์ความเชื่อมั่นของกลุ่มที่สองย่อมสูงกว่ากลุ่มแรก ตาราง 1 แสดงสถานการณ์ในตัวอย่างนี้ ในการใช้แบบทดสอบที่มีประสิทธิภาพนั้น จะต้องแสดงวิธีการหาความเชื่อมั่นในคู่มือสอบด้วยและแสดงค่าสถิติต่าง ๆ ของกลุ่มที่ใช้ ถ้าแบบทดสอบที่ผลิตออกมามีความเป็นวิวิธพันธ์มากในลักษณะของผู้สอบที่ใช้วัด ความเชื่อมั่นจะสูง และความเชื่อมั่นจะลดลงเมื่อใช้กับกลุ่มตัวอย่างที่เป็นเอกพันธ์มาก

ตาราง 1 สัมประสิทธิ์ความเชื่อมั่นของกลุ่มตัวอย่าง 2 กลุ่มที่แตกต่างกันในความแปรปรวนของคะแนนจริง

กลุ่ม 1
กลุ่ม 2
ความแปรปรวนของคะแนนจริง
ความแปรปรวนของคะแนนคลาดเคลื่อน
ความแปรปรวนของคะแนนสังเกต
20
10
30
60
10
70
สัมประสิทธิ์ความเชื่อมั่น
.67
.85

แมกนิลสัน (1967) ได้เสนอสูตรสำหรับการทำนายค่าความเชื่อมั่นที่เปลี่ยนไปเมื่อความแปรปรวนของกลุ่มตัวอย่างเปลี่ยนไป
เมื่อ คือความแปรปรวนของกลุ่มใหม่ คือความแปรปรวนของกลุ่มเดิม คือความเชื่อมั่นของกลุ่มเดิม และ คือค่าความเชื่อมั่นใหม่ที่ถูกทำนาย สิ่งสำคัญที่ควรสังเกตคือ สูตรนี้ได้มีข้อตกลงว่า ความแปรปรวนของคะแนนความคลาดเคลื่อนเท่ากันในทั้งสองกลุ่ม และความเปลี่ยนแปลงของคะแนนที่สังเกตได้เนื่องมาจากความแตกต่างของคะแนนจริง ผู้ที่ใช้แบบทดสอบสามารถตรวจสอบข้อตกลงได้เมื่อนำแบบทดสอบไปใช้กับกลุ่มตัวอย่างและตรวจสอบเชิงประจักษ์โดยประมาณค่าความเชื่อมั่นของกลุ่มตัวอย่างใหม่

ความยาวของแบบทดสอบ
คุณลักษณะหนึ่งของแบบทดสอบที่มีอิทธิพลต่อความแปรปรวนของคะแนนจริงและความแปรปรวนของคะแนนที่สังเกตได้คือ ความยาวของแบบทดสอบ ลองพิจารณาสถานการณ์ที่ผู้สอบใช้แบบทดสอบที่มีข้อสอบ 1 ข้อ กับที่ใช้ข้อสอบ 10 ข้อวัดเนื้อหาเดียว แบบทดสอบฉบับไหนจะน่าเชื่อถือได้มากกว่ากัน ย่อมเป็นแบบทดสอบที่ใช้จำนวนข้อมาก ๆ ความสัมพันธ์ระหว่างความยาวของแบบทดสอบและความเชื่อมั่นแสดงดังสูตร
เมื่อ คือความเชื่อมั่นของแบบทดสอบเดิม k คือจำนวนเท่าของข้อสอบที่เพิ่มเข้าไปในแบบทดสอบ คือความเชื่อมั่นใหม่ ดังนั้น ถ้าความเชื่อมั่นของแบบทดสอบย่อยฉบับหนึ่งมีค่าเป็น 0.75 ความเชื่อมั่นของแบบทดสอบที่เพิ่มจำนวนข้อสอบเข้าไป 5 เท่า จะคำนวณได้ค่าความเชื่อมั่น
หรือถ้าแบบทดสอบย่อย j มี 50 ข้อแบบทดสอบย่อยใหม่มี 150 ข้อ แบบทดสอบย่อยใหม่มีจำนวนข้อเพิ่มเป็น 3 เท่าของฉบับเดิม หรือ k = 3 ยิ่งกว่านั้น k ไม่จำเป็นต้องเป็นจำนวนเต็มเสมอไป และไม่จำเป็นต้องมากกว่า 1.00 เช่น แบบทดสอบ 100 ข้อ และพัฒนาแบบทดสอบต่อไปจนเหลือแค่เพียง 75 ข้อ และ k คือความยาวของแบบทดสอบที่ต้องคูณเมื่อมีความยาวใหม่ 100(k) = 75 ข้อ k = .75 ดังนั้นถ้า = 60 ความเชื่อมั่นสำหรับแบบทดสอบฉบับสั้นกว่าคือ
เมื่อความยาวของแบบทดสอบเพิ่มขึ้น ค่า k ก็จะมีค่าเกิน 1 เสมอ เมื่อความยาวของแบบทดสอบลดลง ค่า k มีค่าต่ำกว่า 1 เสมอ สังเกตว่าการเพิ่มขึ้นของความเชื่อมั่นมีผลมาจากการเพิ่มขึ้นของความยาวข้อสอบ นั่นคือถ้าเพิ่มความยาวเท่าตัวของแบบทดสอบที่มีความเชื่อมั่น .60 แล้ว ความเชื่อมั่นจะเพิ่มเป็น .75 ถ้าเพิ่มเป็นสามเท่า ความเชื่อมั่นจะเพิ่มเป็น .81 ถ้าเพิ่มถึงห้าเท่า ความเชื่อมั่นจะเพิ่มเป็น .88 ดังนั้นการเพิ่มข้อสอบเพื่อให้ได้ความเชื่อมั่นเพิ่มขึ้นบางครั้งก็ต้องพิจารณาถึงต้นทุนในการเขียนและการใช้แบบทดสอบด้วย

การจำกัดเวลาในการสอบ
เมื่อการทดสอบมีการจำกัดเวลาที่ตายตัวเช่น กลุ่มผู้สอบจำนวนหนึ่งทำข้อสอบเสร็จ แต่คนอื่น ๆ ยังทำไม่เสร็จ เวลาที่ให้ในการทำข้อสอบจะมีอิทธิพลต่อความคลาดเคลื่อนอย่างเป็นระบบต่อการทำข้อสอบของนักเรียนทั้งหมด ดังนั้น ความแปรปรวนจากระยะเวลาที่ผู้สอบได้ทำข้อสอบกลายมาเป็นส่วนหนึ่งของความแปรปรวนของคะแนนจริง ในบางแบบทดสอบ (เช่น แบบทดสอบวัดความถนัด) เป้าหมายในการทำข้อสอบต้องการประเมินความสามารถในทางปฏิบัติที่ว่องไวในการทำงาน แต่แบบทดสอบนั้น ระยะเวลาการตอบข้อสอบอาจจะเกี่ยวข้องกับลักษณะที่ถูกวัด ในแบบทดสอบหลาย ๆ ชนิดมีการจำกัดเวลา ซึ่งควรจะให้เวลานานเพียงพอที่เด็กทั้งหมดสามารถทำเสร็จได้พอดีเวลา

คุณลักษณะของข้อสอบ
ความเชื่อมั่นของคะแนนแบบทดสอบที่มีข้อสอบตั้งแต่ 2 ข้อขึ้นไปต้องขึ้นอยู่กับคุณลักษณะบางประการของข้อสอบ ในหัวข้อนี้เราจะพิจารณาตัวบ่งชี้ที่มีผลต่อความเชื่อมั่นของคะแนนแบบทดสอบ ก็คือ ดัชนีความเชื่อมั่นและดัชนีอำนาจจำแนก และดัชนีทางอ้อมที่เกี่ยวข้องกับความเชื่อมั่นก็คือ ดัชนีความยากง่าย ในที่นี้ ดัชนีความยากง่ายก็คือค่าเฉลี่ยหรือค่าคาดหวังของคะแนนที่สังเกตได้ของข้อสอบ ดัชนีอำนาจจำแนกสำหรับข้อสอบเป็นนิยามของสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนที่สังเกตได้ของข้อสอบและคะแนนรวม ดัชนีความเชื่อมั่นของข้อสอบเป็นผลคูณของส่วนเบี่ยงเบนมาตรฐานของคะแนนสังเกตของข้อสอบและดัชนีอำนาจจำแนกของข้อสอบ ซึ่งเราจะพิจารณาแต่ละดัชนีในรายละเอียดต่อไปนี้

ดัชนีความเชื่อมั่นและดัชนีอำนาจจำแนก
เริ่มต้นจากสูตรสัมประสิทธิ 
(1)
เมื่อ n คือจำนวนของข้อสอบในแบบทดสอบ ; คือความแปรปรวนของคะแนนข้อสอบที่ i และ คือความแปรปรวนของคะแนนรวมของแบบทดสอบ เราสามารถเขียนความแปรปรวนได้ว่า
=
=
= (2)
จำได้ว่านิยามของสัมประสิทธิ์สหสัมพันธ์คือ เราสามารถจัดการกับสมการ (2) ได้ดังนี้
=
= (3)
เมื่อหารทั้ง 2 ข้างด้วย จะเห็นว่า ส่วนเบี่ยงเบนมาตรฐานของคะแนนรวมบนแบบทดสอบได้เท่ากับผลรวมของส่วนเบี่ยงเบนมาตรฐานของข้อสอบและสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนของแบบทดสอบรายข้อกับคะแนนรวม
= (4)
ผลคูณของส่วนเบี่ยงเบนมาตรฐานและสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวมเรียกว่า ดัชนีความเชื่อมั่น
พิจารณา (1) และ (4) จะเห็นสัมประสิทธิ์แอลฟาเป็นดัชนีความเชื่อมั่นของข้อสอบสำหรับ สัมประสิทธิ์แอลฟาจะมีความเกี่ยวข้องมากกว่าผลรวมของความแปรปรวนข้อสอบในสมการ (1) นั่นคือผลรวมของกำลังสองของส่วนเบี่ยงเบนมาตรฐานของแบบทดสอบ ต้องสัมพันธ์กันน้อยและผลรวมของดัชนีความเชื่อมั่นของข้อสอบต้องสัมพันธ์กันมาก สำหรับค่าส่วนเบี่ยงเบนมาตรฐานของข้อสอบ เงื่อนไขจะต้องดีที่สุดเมื่อค่าสหสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวมมีค่ามาก ดังนั้นเป็นเครื่องบ่งชี้ว่าเป็นข้อสอบที่ดี
ในโครงสร้างของแบบทดสอบ สัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวมอ้างอิงว่าเป็นดัชนีอำนาจจำแนก ซึ่งมาจากข้อเท็จจริงที่ว่า คะแนนข้อสอบจะเกี่ยวข้องสัมพันธ์กันอย่างมาก สัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวมมีความแตกต่างหรือจำแนกระหว่างผู้สอบที่มีคุณลักษณะที่วัดมากหรือน้อยออกจากกันได้โดยใช้คะแนนรวม

ตาราง 2 สถิติพื้นฐานของข้อสอบ 36 ข้อ และผู้สอบ 498 คน

ข้อสอบ
ค่าเฉลี่ย
ส่วนเบี่ยงเบนมาตรฐาน
Item-Total Correlation
Index of Reliability
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
0.81
0.55
0.84
0.38
0.59
0.76
0.82
0.28
0.77
0.90
0.30
0.55
0.93
0.11
0.67
0.52
0.72
0.45
0.76
0.36
0.67
0.51
0.45
0.72
0.27
0.26
0.37
0.21
0.53
0.34
0.19
0.21
0.50
0.41
0.24
0.06
0.40
0.50
0.36
0.49
0.49
0.43
0.38
0.45
0.42
0.31
0.46
0.50
0.26
0.32
0.47
0.50
0.45
0.50
0.43
0.48
0.47
0.50
0.50
0.45
0.44
0.44
0.48
0.41
0.50
0.47
0.69
0.41
0.50
0.49
0.43
0.24
0.25
0.27
0.17
0.43
0.45
0.20
0.29
0.34
0.26
0.30
0.32
0.44
0.24
0.21
0.34
0.28
0.26
0.30
0.37
0.38
0.23
0.42
0.42
0.31
0.31
0.34
0.45
0.25
0.26
0.34
0.27
0.31
0.42
0.33
0.29
0.09
0.10
0.14
0.06
0.21
0.22
0.09
0.11
0.15
0.11
0.09
0.15
0.22
0.06
0.07
0.16
0.14
0.12
0.15
0.16
0.18
0.11
0.21
0.21
0.14
0.14
0.15
0.22
0.10
0.13
0.16
0.11
0.13
0.21
0.16
0.12
0.02
หมายเหตุ สัมประสิทธิ์ความเชื่อมั่นคือผลคูณระหว่างส่วนเบี่ยงเบนมาตรฐานกับความสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวม

จากข้อมูลในตาราง 2 จะแสดงการใช้ดัชนีความเชื่อมั่น เราพิจารณาผลของข้อสอบ 36 ข้อ ใช้กับผู้สอบ 498 คน สถิติพื้นฐานแสดงดังตาราง 1 สังเกตว่า ผลรวมกำลังสองของส่วนเบี่ยงเบนมาตรฐานของทั้ง 36 ข้อมีค่า 7.03 ผลรวมดัชนีความเชื่อมั่น 5.01 ซึ่งเท่ากับส่วนเบี่ยงเบนมาตรฐานของคะแนนรวม เมื่อเอาค่านี้ไปแทนที่ในสมการ (1) เราจะได้ค่าความเชื่อมั่น 0.74
สังเกตว่ามีอยู่ 16 ข้อที่มีค่าสหสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวมน้อยกว่า 0.30 สมมติว่าทั้ง 16 ข้อนี้มีค่า 0.30 ทั้งหมดในขณะที่ส่วนเบี่ยงเบนมาตรฐานมีค่าคงที่ ดัชนีความเชื่อมั่นจะเพิ่มขึ้น ซึ่งผลรวมของความเชื่อมั่นรายข้อมีค่า 5.36 (จากเดิม 5.01) มีผลทำให้ค่าความเชื่อมั่นทั้งฉบับเพิ่มสูงขึ้นเป็น 0.78 ซึ่งเพิ่มขึ้นจากเดิม 0.04 ถึงแม้ว่าจะไม่มากนักแต่ก็สามารถทำให้ความเชื่อมั่นเพิ่มขึ้นได้โดยไม่ต้องเพิ่มความยาวของแบบทดสอบ ยิ่งกว่านั้น ถ้าลองเพิ่มความยาวของแบบทดสอบเพื่อช่วยให้ความเชื่อมั่นเพิ่มขึ้น เราพบว่าจากสมการ (1) ถ้าเพิ่มความยาวของแบบทดสอบ 20% คือเพิ่มข้อสอบอีก 8 ข้อ แน่นอนว่า ความเชื่อมั่นก็จะเพิ่มสูงขึ้น
นอกจากนี้ยังควรที่จะพิจารณาองค์ประกอบอื่น ๆ ที่ช่วยให้ความเชื่อมั่นสูงขึ้นก็คือ

ความเที่ยงตรงของข้อสอบ
มันไม่ง่ายที่จะเลือกข้อสอบเพื่อจัดฉบับเป็นแบบทดสอบโดยใช้ดัชนีความเชื่อมั่น โดยไม่คำนึงถึงความเที่ยงตรงของข้อสอบ ในประการแรก ข้อสอบต้องเที่ยงตรง นั่นคือต้องทดสอบความเที่ยงตรงแบบต่าง ๆ ของข้อสอบเสียก่อน แต่เมื่อมีข้อสอบ 2 ข้อในแบบทดสอบที่มีความเที่ยงตรงและวัดความรู้และทักษะเดียวกันแล้ว ในการเลือกข้อสอบนั้นควรจะเลือกข้อสอบที่มีดัชนีความเชื่อมั่นที่สูงกว่า

ข้อสอบถูกรวมอยู่ในคะแนนรวมหรือไม่
ดัชนีอำนาจจำแนก เป็นค่าความสัมพันธ์ระหว่างคะแนนของข้อสอบกับคะแนนรวมของคุณลักษณะที่ต้องการวัด คำถามที่เกิดขึ้นก็คือ ความสัมพันธ์ระหว่างคะแนนของข้อสอบกับคะแนนรวมควรจะอยู่บนพื้นฐานของคะแนนรวมทุกข้อในองค์ประกอบที่วัดหรือคะแนนรวมทุกข้อที่ยกเว้นข้อที่นำมาคำนวณหาความสัมพันธ์ เมื่อข้อสอบที่นำมาหาความสัมพันธ์ข้อนั้นถูกรวมอยู่ในคะแนนรวม สัมประสิทธิ์สหสัมพันธ์ (หรือดัชนีอำนาจจำแนก) ของข้อสอบข้อนั้นจะลำเอียงสูง (มีค่าเพิ่มขึ้น) เพราะว่าคะแนนของข้อสอบจะสัมพันธ์กันอย่างสมบูรณ์กับคะแนนรวมในองค์ประกอบที่วัด ดังนั้นในแบบทดสอบที่มี n ข้อ สัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนของข้อสอบข้อนั้นกับคะแนนรวมที่คำนวณบนพื้นฐานของข้อสอบ n – 1 ข้อ หรือสหสัมพันธ์ระหว่างคะแนนของข้อสอบข้อนั้นกับคะแนนรวมที่หักข้อนั้นออก

ดัชนีความยากง่าย
ดัชนีความยากง่ายของข้อสอบ (pi) ซึ่งมีพิสัยอยู่ระหว่าง 0 ถึง 1 สำหรับข้อสอบที่ให้คะแนนแบบ 0-1 แม้ว่าดัชนีไม่สัมพันธ์โดยตรงกับความเที่ยงตรงของคะแนนแบบทดสอบ แต่สัมพันธ์โดยตรงกับคะแนนเฉลี่ยของคะแนนรวม การเลือกข้อสอบที่ง่าย n ข้อ เราคาดหวังว่าคะแนนเฉลี่ยของแบบทดสอบจะสูง มีค่าเข้าใกล้ n และ pi มีค่าเข้าใกล้ 1 การแจกแจงของคะแนนจะเป็นเบ้ลบ ในทางตรงข้าม ถ้าหากเป็นข้อสอบที่ยาก การแจกแจงของคะแนนจะเบ้บวก คะแนนเฉลี่ยจะใกล้ 0 และค่า pi เข้าใกล้ 0 ถ้าเลือกข้อสอบที่มีความยากง่ายปานกลาง คะแนนเฉลี่ยจะอยู่กึ่งกลาง ค่า pi จะเข้าใกล้ 0.5 กรณีข้อสอบ 0-1 ค่า pi เข้าใกล้ 0.5 จะมีความเป็นไปได้สูงสุดที่คะแนนจะมีความแปรปรวนรวม และความแปรปรวนของคะแนนสังเกตของข้อสอบ 0-1 ในข้อที่ i ก็คือ pi (1-pi) และมีค่าสูงสุดเท่ากับ 0.25 เมื่อ pi = 0.5
พิจารณาค่าความยากง่ายของข้อสอบ แบบทดสอบประกอบด้วยข้อสอบทั้งหมดที่มีความง่ายมากหรือยากมากอย่างใดอย่างหนึ่งมีแนวโน้มว่าค่าความเชื่อมั่นจะต่ำ ในกรณีนี้ ความแปรปรวนของคะแนนจริงจะต่ำ ความแปรปรวนของคะแนนสังเกตได้จะเกิดความคลาดเคลื่อนในการวัด เมื่อเราต้องการให้ค่าความเชื่อมั่นมีค่าสูงแล้ว แนะนำว่าข้อสอบในแบบทดสอบควรเลือกข้อที่มีค่าความยากง่ายปานกลาง แล้วความแปรปรวนของคะแนนจริงจะสูงย่อมส่งผลให้ความเชื่อมั่นของแบบทดสอบมีค่าสูงด้วย

ความคลาดเคลื่อนมาตรฐานของการวัด

ความเชื่อมั่นคือสัดส่วนของความแปรปรวนคะแนนจริงกับคะแนนที่สังเกตได้ อย่างไรก็ตาม ผู้ใช้แบบทดสอบมักแน่ใจว่าความคลาดเคลื่อนของการวัดย่อมมีผลต่อการแปลความหมายคะแนนสอบของผู้เขาสอบ แต่ว่ามันเป็นไปไม่ได้ที่จะทราบจำนวนของความคลาดเคลื่อนที่มีอยู่ในคะแนนที่สังเกตได้ ในทฤษฎีมาตรฐานเดิมกำหนดวิธีการสำหรับอธิบายความแปรปรวนที่คาดหวังของคะแนนที่สังเกตของแต่ละบุคคล ซึ่งจะเกี่ยวข้องกับคะแนนจริงของผู้สอบแต่ละบุคคล จำได้ว่าคะแนนจริงจะนิยามว่าเป็นค่าเฉลี่ยหรือค่าคาดหวังของคะแนนที่สังเกตได้ของผู้สอบจากการสอบซ้ำ ๆ กันหลาย ๆ ครั้งด้วยข้อสอบเดิม ตามทฤษฎีผู้สอบแต่ละคนก็จะมีการแจกแจงที่เป็นไปได้ของคะแนนที่สังเกตได้ซึ่งจะรวมคะแนนจริงเอาไว้ด้วยและก็จะมีส่วนเบี่ยงเบนมาตรฐานของคะแนน เมื่อนำส่วนเบี่ยงเบนมาตรฐานของแต่ละบุคคลมาเฉลี่ยทั้งกลุ่มแล้ว ผลที่ได้ก็คือความคลาดเคลื่อนมาตรฐานของการวัด (Standard error of measurement) ใช้สัญลักษณ์ว่า ซึ่งการแสดงสูตรการคำนวณความคลาดเคลื่อนมาตรฐานในการวัดสามารถได้มาโดยใช้ความสัมพันธ์ของ

หารทั้งสองข้างของสมการนี้ด้วย จะได้

สังเกตว่าเทอมแรกทางซ้ายมือสามารถแสดงได้ด้วยนิยามของความเชื่อมั่น ดังนั้น

แก้สมการเพื่อให้ได้ นั่นคือ

และ

ดังนั้น ถ้าส่วนเบี่ยงเบนมาตรฐานของชุดคะแนนที่สังเกตได้คือ 10 และสัมประสิทธิ์ความเชื่อมั่นหรือ = 0.91 ค่าความคลาดเคลื่อนมาตรฐานของการวัดควรจะคำนวณได้ค่า

สมมติว่าความคลาดเคลื่อนของการวัดเป็นไปอย่างสุ่มที่มีการแจกแจงเป็นโค้งปกติ เราควรจะคาดหวังว่าประมาณ 68% ของคะแนนที่สังเกตได้ของผู้สอบนั้นตกอยู่ในช่วง T ± 1 และประมาณ 95% ของคะแนนที่สังเกตได้ของผู้สอบตกอยู่ในช่วง T ± 1.96 และประมาณ 99% ของคะแนนที่สังเกตได้ของผู้สอบตกอยู่ในช่วง T ± 2.58
ในสถานการณ์การทดสอบโดยมาก คือผู้สอบจะได้รับการทดสอบเพียงครั้งเดียวและมีคะแนนที่สังเกตได้เพียงค่าเดียว ดังนั้นถ้าเรามีการประมาณค่าความคลาดเคลื่อนมาตรฐานของการวัดสำหรับแบบทดสอบเอาไว้ เราไม่สามารถกำหนดช่วงของคะแนนจริงของผู้สอบได้เพราะว่าในทางปฏิบัตินั้นเราไม่รู้คะแนนจริง ดังนั้น เราจึงใช้การประมาณค่าของความคลาดเคลื่อนมาตรฐานสร้างช่วงความเชื่อมั่นที่อยู่รอบคะแนนที่สังเกตได้จาก X ± 1 เราสามารถเชื่อมั่นได้ 68% ว่าคะแนนจริงจะตกอยู่ภายในช่วงนี้ ถ้าเป็นไปได้เราอาจจะใช้คะแนนจริงแทนที่คะแนนที่สังเกตได้ แต่ก็เป็นไปไม่ได้ สมมติว่าสุชาติมีคะแนนจริงของมาตรวัดเจตคติเท่ากับ 50 และความคลาดเคลื่อนมาตรฐานของการวัดเท่ากับ 5 ตามทฤษฎีถ้าสุชาติทำข้อสอบ 100 ครั้งแล้ว จะมีประมาณ 68 ครั้งที่คะแนนที่สังเกตได้จะตกอยู่ระหว่าง 45 ถึง 55 ซึ่งคะแนน 32 จะตกอยู่นอกขอบเขต 45 ถึง 55 นี้
นั้นคือช่วงความเชื่อมั่นที่สร้างจากคะแนนสังเกตได้ของสุชาติ 100 ค่า จะมีประมาณ 68 ค่าที่ตกอยู่ในช่วงระหว่าง 45 ถึง 55 และช่วงนี้จะรวมคะแนนจริงของสุชาติเอาไว้ด้วย ในการทดสอบของสุชาติเพียงครั้งเดียว (ในความเป็นจริงย่อมสอบเพียงครั้งเดียว) โดยดึงมาอย่างสุ่มจากคะแนนที่สังเกตได้ 100 ค่า จะมีโอกาส 68% ที่คะแนนจะตกอยู่ในช่วง 45 ถึง 55 ถ้าเราไม่โชคร้ายดึงได้คะแนน 32 ที่ตกอยู่นอกช่วง 45 ถึง 55 ซึ่งช่วง 5 คะแนนที่อยู่รอบคะแนนจริงนี้ไม่ใช่คะแนนจริง สำหรับเหตุผลนี้มันมีความสำคัญที่จะต้องจำว่าคะแนนจริงที่สังเกตได้เพียงค่าเดียวอาจจะไม่สามารถประมาณค่าของคะแนนจริงได้ใกล้เคียง ค่าความคลาดเคลื่อนมาตรฐานของการวัดมีประโยชน์สำหรับการจัดเตรียมการประมาณค่าคะแนนจริงที่อาจจะตกอยู่ห่างจากคะแนนเฉลี่ยที่สังเกตได้ของกลุ่มประชากร แต่มันก็ไม่สามารถประกันได้ว่าคะแนนจริงของและบุคตคลจะตกอยู่ในช่วงความเชื่อมั่นที่ได้ นอกจากนี้ควรจะสังเกตว่าค่าของ สะท้อนให้เห็นถึงค่าเฉลี่ยของความคลาดเคลื่อนมาตรฐานของผู้เข้าสอบ

ความคลาดเคลื่อนมาตรฐานของการประมาณค่า

เป็นความคลาดเคลื่อนมาตรฐานสำหรับทำนายคะแนนของผู้สอบบนแบบทดสอบ 2 ฉบับที่คู่ขนานกันในกรณีที่รู้คะแนนของแบบทดสอบฉบับหนึ่ง มีสูตรในการคำนวณคือ

เช่น มาตรวัดเจตคติที่คู่ขนานกัน 2 ฉบับ มาตรวัดเจตคติฉบับที่ 2 มีคะแนนเบี่ยงเบนมาตรฐาน 10 และสัมประสิทธิ์สหสัมพันธ์ระหว่างแบบทดสอบคู่ขนานทั้งสองฉบับคือ 0.75 ความคลาดเคลื่อนในการประมาณค่าจะเท่ากับ = 6.6 ดังนั้นสุชาติที่ทำคะแนนบนมาตรวัดเจตคติฉบับที่ 1 ได้ 50 คะแนน สามารถทำนายคะแนนของสุชาติบนมาตรวัดเจตคติฉบับที่ 2 อยู่ระหว่าง 50 ± หรือประมาณ 43.4 ถึง 56.6 คะแนน ที่ระดับความเชื่อมั่น 68%

บรรณานุกรม

ภาควิชาการวัดผลและวิจัยการศึกษา. การสร้างเครื่องมือวัดผลที่ใช้ในการวิจัย. กรุงเทพฯ :
คณะศึกษาศาสตร์ มหาวิทยาลัยศรีนครินทรวิโรฒ, 2538.
ฉัตรศิริ ปิยะพิมลสิทธิ์. “การวิเคราะห์องค์ประกอบ,” ใน วารสารการวัดผลการศึกษา.
สำนักทดสอบทางการศึกษาและจิตวิทยา มหาวิทยาลัยศรีนครินทรวิโรฒ. 20 (58) :
พฤษภาคม-สิงหาคม, 2541.
ทวีศักดิ์ ญาณประทีป และคณะ. พจนานุกรม ฉบับเฉลิมพระเกียรติ พ.ศ.2530. กรุงเทพฯ :
วัฒนาพานิช, 2534.
ล้วน และอังคณา สายยศ. เทคนิคการวัดผลการเรียนรู้. กรุงเทพฯ : สุวีริยาสาส์น, 2539.
สุรศักดิ์ อมรรัตนศักดิ์. ทฤษฎีทางการทดสอบ. กรุงเทพฯ : โรงพิมพ์มหาวิทยาลัยรามคำแหง,
2536.
Allen, Marry J. and Yen, Wendy M. Introduction to Measurement Theory. U.S.A. :
Brooks/Cole Publishing Company, 1979.
Anastasi, Anne. Psychological Testing. U.S.A. : Macmillan Publishing Company, 1982.
Gulliksen, Harold. Theory of MENTAL TESTS. U.S.A. : John Willy & Sons, Inc., 1950.
Hair, Joseph F., JR. and Other. Multivariate Data Analysis with Readings. U.S.A. :
Prentice-Hall, Inc., 1995.
Lyman, Howard B. Test Scores and What They Mean. U.S.A. : Prentice-Hall, INC.,
1963.
Messick, Samuel. “Validity,” in Educational Measurement. Linn, Robert L. (Ed.).
Third Edition. U.S.A. : Macmillan Publishing Company, 1989.
Popham, W. James. Modern Educational Measurement : A Practitioner’s
Perspective. U.S.A. : Prentice-Hall, INC., 1990.
Traub, Ross E. Reliability for the Social Sciences : Theory and Applications.
Thousand Oaks : SAGE Publications, 1994.
Trochim, William M.K. Research Methods Knowledge Base.
http://trochim.human.cornell.edu/kb/. 1999.
Wainer, Howard and Braun, Henry I. Test Validity. U.S.A. Lawrence Erlbaum
Associates, Inc., 1988.

thongsek

วันพฤหัสบดีที่ 14 มกราคม พ.ศ. 2553

ช่วงความเชื่อมั่น

เกี่ยวกับฉัน

คลังบทความของบล็อก