วันพฤหัสบดีที่ 14 มกราคม พ.ศ. 2553

ช่วงความเชื่อมั่น

จัดทำโดย

นาย จิรวัฒน์ เกษศิริ รหัส 5012252102
นาย สมปอง ทองเสก รหัส 5012252114
นาย วิทยา กาฬปักษ์ รหัส 5012252212
นาย ศรไกร เรืองศรี รหัส 5012252214













ความเชื่อมั่น
(Reliability)
นิยามสัมประสิทธิ์ความเชื่อมั่น

มีหลากหลายวิธีในการนิยามและแปลความหมายความเชื่อมั่นของแบบทดสอบ ตัวอย่างเช่น แบบทดสอบจะเชื่อมั่นได้ถ้าคะแนนสังเกตและคะแนนจริงมีความสัมพันธ์กันสูง นั่นคือ คะแนนที่สังเกตได้และคะแนนจริงที่ได้มาจากผู้สอบทุกๆ คนที่สอบแบบทดสอบฉบับหนึ่ง กำลังสองของสหสัมพันธ์ระหว่างคะแนนที่สังเกตได้และคะแนนจริง ( ) จะเรียกว่าสัมประสิทธิ์ความเชื่อมั่นของแบบทดสอบ หรือความเชื่อมั่นสามารถแสดงได้ด้วยสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนสังเกตของแบบทดสอบที่คู่ขนานแบบพาราเรล (Parellel) กันสองฉบับ ถ้าแบบทดสอบที่คู่ขนานกันสองฉบับนั้นใช้สอบกับประชากรผู้สอบและผลของคะแนนสังเกตของแบบทดสอบสองฉบับที่คู่ขนานนั้นนำมาหาความสัมพันธ์กัน ค่าสหสัมพันธ์นี้ (ใช้สัญลักษณ์ เมื่อ X และ X’ คือคะแนนสังเกตของแบบทดสอบสองฉบับที่คู่ขนานกันแบบพาราเรล) ก็คือค่าสัมประสิทธิ์ความเชื่อมั่น โดยปกติแล้วเราไม่สามารถทราบคะแนนจริงได้ และเป็นไปไม่ได้ที่จะใช้แบบทดสอบที่คู่ขนานกันแบบพาราเรล ดังนั้นความเชื่อมั่นต้องประมาณค่าด้วยวิธีอื่น ๆ แต่หลังจากที่ได้ตรวจสอบวิธีการโดยทั่วไปในการประมาณค่าความเชื่อมั่นแล้ว มี 6 วิธีสำหรับนิยามหรือแปลความหมายของสัมประสิทธิ์ความเชื่อมั่น ดังนี้

การนิยามและแปลความหมายสัมประสิทธิ์ความเชื่อมั่น
มี 6 วิธีต่อไปนี้สำหรับนิยามสัมประสิทธิ์ความเชื่อมั่นไว้ คือ
1. rXX¢ = สหสัมพันธ์ระหว่างคะแนนที่สังเกตได้จากแบบทดสอบคู่ขนาน
2. = สัดส่วนของความแปรปรวนใน X ที่อธิบายโดยสหสัมพันธ์เชิงเส้นกับ X¢
3. rXX¢ =
4. rXX¢ =
5. rXX¢ =
6. rXX¢ =
การแปลความหมายในนิยามที่ 1 คือความเชื่อมั่นของแบบทดสอบจะเท่ากับสหสัมพันธ์ของคะแนนสังเกตที่ได้จากแบบทดสอบฉบับหนึ่งกับคะแนนสังเกตที่ได้จากแบบทดสอบอีกฉบับหนึ่งที่คู่ขนานกัน ผู้สอบจะได้คะแนนสังเกตเท่ากันก็ต่อเมื่อแบบทดสอบมีความคู่ขนานและมีความแปรปรวนของคะแนนสังเกตในการสอบแต่ละครั้งเท่ากัน ดังนั้นแบบทดสอบจะมีความเชื่อมั่นที่สมบูรณ์ (rXX¢ = 1) แต่ถ้าผู้สอบมีคะแนนสังเกตในแบบทดสอบฉบับหนึ่งไม่สัมพันธ์กับคะแนนสังเกตอีกฉบับหนึ่งที่คู่ขนานกัน (rXX¢ = 0) แบบทดสอบย่อมเชื่อมั่นไม่ได้
การแปลความหมายในนิยามที่ 2 คือการแปลผลโดยใช้สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน กำลังสองของสหสัมพันธ์จะแปลความหมายได้ว่าเป็นสัดส่วนของความแปรปรวนของตัวแปรหนึ่งสามารถอธิบายได้ด้วยสหสัมพันธ์เชิงเส้นกับอีกตัวแปรหนึ่ง ดังนั้น จะเท่ากับสัดส่วนของความแปรปรวนของคะแนนแบบทดสอบฉบับหนึ่งที่อธิบายได้ด้วยสหสัมพันธ์เชิงเส้นกับคะแนนในแบบทดสอบอีกฉบับหนึ่งที่คู่ขนานกัน
การแปลความหมายในนิยามที่ 3 rXX¢ = คือสัมประสิทธิ์ความเชื่อมั่นเป็นอัตราส่วนของความแปรปรวนของคะแนนจริงกับความแปรปรวนของคะแนนที่สังเกตได้ สำหรับแบบทดสอบที่มีความเชื่อมั่นอย่างสมบูรณ์ rXX¢ = 1 ดังนั้น = 1 และความแปรปรวนของคะแนนที่สังเกตได้ทั้งหมดสะท้อนให้เห็นความแปรปรวนของคะแนนจริง ถ้า rXX¢ = 1 ความแตกต่างระหว่างคะแนนที่สังเกตได้มาจากความแตกต่างระหว่างคะแนนจริง ถ้า แล้ว ต้องเป็น 0 ดังนั้น e(E) = 0, ความคลาดเคลื่อนทั้งหมดจะเท่ากับ 0 เมื่อ = 0 แล้วการวัดจะต้องปราศจากความคลาดเคลื่อน ถ้า rXX¢ < 1 แล้วความคลาดเคลื่อนในการวัดยังคงมีอยู่ ถ้า rXX¢ = 0 แล้ว ซึ่งหมายความว่าคะแนนที่สังเกตได้ทั้งหมดจะสะท้อนให้เห็นเฉพาะความคลาดเคลื่อนเท่านั้น
ขณะที่ความเชื่อมั่นของแบบทดสอบเพิ่มขึ้น ความแปรปรวนของคะแนนความคลาดเคลื่อนจะน้อยลง เมื่อความแปรปรวนของความคลาดเคลื่อนมีน้อยแล้ว คะแนนที่สังเกตของผู้สอบจะมีค่าเข้าใกล้คะแนนจริงของเขามาก อย่างไรก็ตามเมื่อความแปรปรวนของความคลาดเคลื่อนมีมาก คะแนนที่สังเกตได้จะให้การประมาณค่าคะแนนจริงที่ไม่ดี ภาพประกอบ 1 จะแสดงความสัมพันธ์นี้ โค้งจะแสดงการแจกแจงเชิงทฤษฎีของคะแนนสังเกตเมื่อคะแนนจริงค่าหนึ่งคงที่ นั่นคือการแจกแจงของคะแนนสังเกตสำหรับผู้สอบคนหนึ่ง คะแนนจริงของผู้สอบจะแสดงด้วยสัญลักษณ์ T ในรูปภาพ เมื่อคะแนนจริงถูกกำหนดให้คงที่ = 0 และความแปรปรวนของคะแนนสังเกตจะเท่ากับความแปรปรวนของคะแนนความคลาดเคลื่อน ภายใต้โค้ง A ซึ่งมีความแปรปรวนของความคลาดเคลื่อนน้อย คะแนนที่สังเกตได้จะมีค่าเข้าใกล้คะแนนจริง T มาก ภายใต้โค้ง B ซึ่งมีความแปรปรวนของความคลาดเคลื่อนมาก คะแนนที่สังเกตได้จะอยู่ไกลออกจากคะแนนจริง T


ภาพประกอบ 1 แสดงอิทธิพลของความแปรปรวนของความคลาดเคลื่อนกับคะแนนจริง

การแปลความหมายในนิยามที่ 4 rXX¢ = สัมประสิทธิ์ความเชื่อมั่นเท่ากับกำลังสองของสหสัมพันธ์ระหว่างคะแนนที่สังเกตได้กับคะแนนจริง ตัวอย่างเช่น ถ้า rxx¢ = 0.81 ดังนั้น
rXT = 0.9 ถ้า rXX¢ = 0.25 ดังนั้น rXT = 0.5 ความสัมพันธ์นี้จะแสดงในภาพประกอบ 2 เมื่อ
0 <> 1 เราจะได้ว่า rXT > rXX¢ คะแนนสังเกตจะสัมพันธ์กันสูงกับคะแนนจริงและสูงกว่าคะแนนที่สังเกตได้จากแบบทดสอบคู่ขนาน ในความเป็นจริง คะแนนจากแบบทดสอบจะไม่สัมพันธ์กันสูงกับแบบทดสอบอื่น ๆ มากไปกว่าคะแนนจริงของตัวมันเอง สหสัมพันธ์ที่สูงมากระหว่างคะแนนที่สังเกตได้กับแบบทดสอบอื่น ๆ คือ ถ้าแบบทดสอบ X ใช้สำหรับทำนายแบบทดสอบเกณฑ์ Y แล้ว rXY จะเรียกว่า สัมประสิทธิ์ความเที่ยงตรง เพราะว่า rXY ไม่สามารถจะมีค่าสูงไปกว่า rXT และ rXY ก็จะไม่สูงไปกว่า ดังนั้นความเชื่อมั่นมีผลต่อความเที่ยงตรง แม้ว่าสัมประสิทธิ์ความเที่ยงตรงไม่สามารถมีค่าสูงไปกว่ากำลังสองของรากที่สองของสัมประสิทธิ์ความเชื่อมั่น ตัวอย่างเช่น ถ้า rXX¢ = 0.49 แล้ว rXT = 0.7

ภาพประกอบ 2 ความสัมพันธ์ระหว่าง rXX¢ และ rXT


ภาพประกอบ 3 ความสัมพันธ์ระหว่าง rXX¢ และ rXE




การแปลความหมายในนิยามที่ 5 rXX¢ = สัมประสิทธิ์ความเชื่อมั่นมีค่าเท่ากับ 1 ลบด้วยกำลังสองของสหสัมพันธ์ระหว่างคะแนนที่สังเกตได้กับคะแนนความคลาดเคลื่อน ในแนวคิดนี้ rXE ควรจะมีค่า 0 แต่ rXE = 0 เมื่อ rXX¢ = 1.0 ความสัมพันธ์ระหว่าง rXE และ rXX¢ จะแสดงในภาพประกอบ 3
การแปลความหมายในนิยามที่ 6 rXX¢ = ความเชื่อมั่นเป็นความสัมพันธ์ของความแปรปรวนของคะแนนความคลาดเคลื่อนและความแปรปรวนของคะแนนที่สังเกตได้ ดังที่อธิบายไปแล้วในตอนต้น เมื่อ rXX¢ = 1, = 0 และเมื่อ rXX¢ = 0, ระดับของความแปรปรวนที่เป็นวิวิธพันธ์ของคะแนนสังเกตได้มาจากกลุ่มของผู้สอบซึ่งมีผลกระทบต่อความเชื่อมั่นเป็นสำคัญ ถ้าแบบทดสอบใช้กับกลุ่มประชากรที่ทำแบบทดสอบได้พิสัยของคะแนนสังเกตน้อย (เช่น ใช้แบบทดสอบ IQ กับกลุ่มประชากรที่มีสมองช้า) จะมีค่าน้อยลง ถ้าความแปรปรวนของความคลาดเคลื่อนในกลุ่มที่มีช่วงคะแนนน้อยเท่ากับกลุ่มที่เป็นวิวิธพันธ์แล้วความเชื่อมั่นของกลุ่มที่มีพิสัยของคะแนนน้อยจะมีค่าความเชื่อมั่นน้อยกว่า กล่าวอีกอย่างว่า ความเชื่อมั่นที่ประมาณได้จากกลุ่มที่เป็นวิวิธพันธ์จะมีแนวโน้มสูงกว่าการประมาณจากกลุ่มที่เป็นเอกพันธ์
โดยสรุปแล้ว เมื่อ rXX¢ = 1 มีสาเหตุจาก
1) การวัดปราศจากความคลาดเคลื่อน (E = 0)
2) X = T ในผู้สอบทุก ๆ คน
3) ความแปรปรวนของคะแนนสังเกตทั้งหมดสะท้อนให้เห็นความแปรปรวนของ
คะแนนจริง ( )
4) ความแตกต่างทั้งหมดระหว่างคะแนนสังเกตสะท้อนถึงความแตกต่างของ
คะแนนจริง
5) สหสัมพันธ์ระหว่างคะแนนสังเกตกับคะแนนจริงมีค่า 1 (rXT = 1) และ
6) สหสัมพันธ์ระหว่างคะแนนสังเกตกับคะแนนคลาดเคลื่อนมีค่า 0 (rXE = 0)
เมื่อ rXX¢ = 0 มีสาเหตุจาก
1) เกิดเฉพาะความคลาดเคลื่อนอย่างสุ่มในการวัด
2) X = E สำหรับผู้สอบทุก ๆ คน
3) ความแปรปรวนของคะแนนสังเกตทั้งหมดสะท้อนถึงความแปรปรวนของคะแนน
คลาดเคลื่อน ( )
4) ความแตกต่างทั้งหมดระหว่างคะแนนสะท้อนถึงความคลาดเคลื่อนในการวัด
5) สหสัมพันธ์ระหว่างคะแนนสังเกตกับคะแนนจริงมีค่า 0 (rXT = 0) และ
6) สหสัมพันธ์ระหว่างคะแนนสังเกตกับคะแนนคลาดเคลื่อนมีค่า 1 (rXE = 1)

เมื่อ 0 £ rXX¢ £ 1 มีสาเหตุจาก
1) การวัดจะรวมความคลาดเคลื่อนบางอย่างเข้าไว้ด้วย
2) X = T + E
3) ความแปรปรวนของคะแนนสังเกตประกอบด้วยความแปรปรวนของคะแนนจริง
บางส่วนรวมกับความแปรปรวนของคะแนนคลาดเคลื่อนบางอย่าง
( )
4) ความแตกต่างระหว่างคะแนนสามารถสะท้อนให้เห็นความคลาดเคลื่อนของการวัด
เช่นเดียวกับความแตกต่างของคะแนนจริง
5) สหสัมพันธ์ระหว่างคะแนนสังเกตและคะแนนจริง rXT เท่ากับ
6) สหสัมพันธ์ระหว่างคะแนนสังเกตและคะแนนความคลาดเคลื่อน rXE คือ
7) ความเชื่อมั่นก็คือสัดส่วนของความแปรปรวนของคะแนนสังเกตได้ในส่วนที่เป็น
ความแปรปรวนของคะแนนจริง (rXX¢ = ) และ
8) ค่า rXX¢ ที่สูงจะช่วยก่อให้เกิดความเชื่อมั่นในการประมาณค่า T จาก X เพราะ
ความแปรปรวนของความคลาดเคลื่อนมีค่าน้อยลง

การประมาณค่าความเชื่อมั่นด้วยวิธีการสอบซ้ำ

ความเชื่อมั่นของการสอบซ้ำ จะนิยามอยู่บนพื้นฐานของการใช้กลุ่มผู้สอบกลุ่มเดียวกันที่ใช้แบบทดสอบฉบับเดียวกันซ้ำสองครั้งแล้วมานำหาความสัมพันธ์กัน ถ้าผู้สอบแต่ละคนได้คะแนนสอบเหมือนกันในการสอบซ้ำสองครั้ง และมีความแปรปรวนของคะแนนสังเกตเท่ากันแล้ว สหสัมพันธ์จะได้เท่ากับ 1.0 บ่งชี้ถึงความสัมพันธ์กันอย่างสมบูรณ์ หรือในอีกกรณีหนึ่ง ถ้าคะแนนสังเกตสำหรับผู้สอบทุกคนอ้างอิงมาจากการทดสอบฉบับที่หนึ่งที่มีความสัมพันธ์ของคะแนนสังเกตเป็นเชิงเส้นตรงอย่างสมบูรณ์กับแบบทดสอบฉบับที่สองแล้ว การประมาณค่าความเชื่อมั่นจะเท่ากับ 1.0 แต่ถ้าชุดของคะแนนจากแบบทดสอบฉบับแรกไม่มีความสัมพันธ์กับชุดของคะแนนจากแบบทดสอบฉบับที่สอง การประมาณค่าความเชื่อมั่นจะได้ 0.0 วิธีการสอบซ้ำดูเหมือนจะมีเหตุมีผลมากในการประมาณค่าความเชื่อมั่นของแบบทดสอบ แต่มันเป็นวิธีการที่ยุ่งยาก
ปัญหาที่สำคัญมากกับการประมาณค่าความเชื่อมั่นแบบสอบซ้ำคือผลของการเกิด carry-over effect ระหว่างการทดสอบ การทดสอบครั้งแรกอาจจะมีอิทธิพลต่อการสอบครั้งที่สอง เกิดความคลาดเคลื่อนของคะแนนสำหรับการสอบ ผู้สอบเมื่อสอบครั้งที่สองอาจจะจำคำตอบได้ที่ตอบไปในครั้งแรกได้ และก็ง่ายที่ตอบคำตอบเดิมซ้ำ หรือในบางการทดสอบ carry-over effects อาจจะเนื่องมาจากการฝึกฝน เช่นผู้สอบส่วนใหญ่มีแนวโน้มที่ได้รับการฝึกฝนจากการทดสอบซ้ำทำให้มีความคล่องแคล่วในการทำแบบทดสอบและในบางความสามารถที่แบบทดสอบวัด ถ้ามีผู้สอบบางคนที่ได้รับการฝึกฝนมากกว่าผู้สอบคนอื่น
การเปลี่ยนเจตคติของผู้สอบหรือระดับของข้อสอบสามารถมีสาเหตุให้เกิด carry-over effects ได้ การไม่ให้ความร่วมมือของผู้สอบ ผู้สอบอาจจะไม่ยอมทำแบบทดสอบในครั้งที่สองและจงใจจะเดาหรือตอบผิดในการสอบครั้งที่สอง ผลนี้จะทำให้สัมประสิทธิ์ความเชื่อมั่นต่ำระหว่างการสอบทั้งสองครั้ง หรือหลังจากการสอบครั้งแรก ผู้สอบบางคนอาจจะไปค้นหาข้อมูลเพิ่มเติมเพื่อช่วยให้คะแนนของตนเองเพิ่มขึ้น ดังนั้นสัมประสิทธิ์สหสัมพันธ์ระหว่างการทดสอบซ้ำสองครั้งควรจะมีแนวโน้มต่ำ carry-over effects สามารถมีผลต่อการประมาณค่าความเชื่อมั่น ช่วยให้การประมาณค่าความเชื่อมั่นแบบสอบซ้ำต่ำหรือสูงกว่าความเป็นจริง
ปัญหาประการที่สองกับการประมาณค่าความเชื่อมั่นแบบสอบซ้ำจะเกี่ยวข้องกับระยะเวลาที่เว้นช่วงห่างระหว่างการสอบทั้งสองครั้ง การเว้นช่วงห่างที่สั้นมากจะมีผลให้เกิด carry-over effects อันเนื่องมาจากความจำข้อสอบได้ การฝึกฝน หรืออารมณ์ การเว้นช่วงห่างที่ยาวนานอาจจะมีผลเนื่องมาจากการเปลี่ยนแปลงของความรู้หรืออารมณ์ ถ้าคุณลักษณะที่แบบทดสอบวัดมีการเปลี่ยนแปลงไปตามระยะเวลา เช่นความสามารถทางสมองของเด็ก การเว้นช่วงเวลาระหว่างการสอบยาวนานเกินไปจะมีแนวโน้มการประมาณค่าความเชื่อมั่นต่ำ ความแตกต่างของการเว้นช่วงระยะเวลาจะมีอิทธิพลต่อการประมาณค่าความเชื่อมั่น ในบางครั้งจะมีผลการประมาณค่าความเชื่อมั่นต่ำหรือสูงเกินไป
การประมาณค่าความเชื่อมั่นของการสอบซ้ำอยู่บนพื้นฐานของการออกแบบที่ตรงไปตรงมา สัมพันธ์กันง่ายกับผลของการใช้แบบทดสอบซ้ำ carry-over effects และการเว้นระยะเวลาสอบซ้ำมีอิทธิพลต่อการประมาณค่าความเชื่อมั่นแบบสอบซ้ำ การประมาณค่าความเชื่อมั่นของการสอบซ้ำจะมีความเหมาะสมมากสำหรับแบบทดสอบที่วัดคุณลักษณะที่ไม่อ่อนไหวต่อ carry-over effects และมีความคงที่เมื่อเว้นช่วงห่างของการสอบซ้ำ เช่น ใช้การประมาณค่าความเชื่อมั่นกับแบบทดสอบที่ใช้โสตประสาทสัมผัสทั้งห้า (เช่นแบบทดสอบวัดการมองเห็น หรือการฟัง)

การประมาณค่าความเชื่อมั่นด้วยการใช้แบบทดสอบคู่ขนานและแบบทดสอบทางเลือก

ความเชื่อมั่นของการใช้แบบทดสอบคู่ขนานสามารถคำนวณได้ด้วยสูตร เป็นสหสัมพันธ์ระหว่างคะแนนที่สังเกตของแบบทดสอบสองฉบับที่คู่ขนานกันแบบพาราเรล (parelle) ในทางปฏิบัติเป็นไปไม่ได้ที่จะมีแบบทดสอบสองฉบับที่คู่ขนานกัน และแบบทดสอบทางเลือกที่มักนำมาใช้แทนที่แบบทดสอบคู่ขนานเสมอ แบบทดสอบทางเลือกคือแบบทดสอบอีกฉบับหนึ่งที่มีโครงสร้างที่มีผลต่อแบบทดสอบคู่ขนาน แบบทดสอบคู่ขนานและแบบทดสอบทางเลือกนี้จะมีความเท่ากันในค่าเฉลี่ยของคะแนนสังเกต ความแปรปรวนของคะแนนสังเกต และสหสัมพันธ์กับแบบทดสอบอื่น อย่างไรก็ตาม ซึ่งยากที่จะหาแบบทดสอบสองฉบับที่มีคุณลักษณะแบบนี้ สหสัมพันธ์ระหว่างคะแนนสังเกตบนแบบทดสอบทางเลือกคือ rXZ เป็นการประมาณค่าความเชื่อมั่นของแบบทดสอบฉบับหนึ่งกับแบบทดสอบทางเลือก สหสัมพันธ์นี้จะมีอิทธิพลต่อความเชื่อมั่นของแบบทดสอบ หรืออีกกรณีหนึ่งก็คือมันคู่ขนานกัน ดังนั้นแบบทดสอบอื่นจะมีแนวโน้มในการประมาณค่าความเชื่อมั่นที่แตกต่างไปจากการทดสอบแบบสอบซ้ำ หรือการประมาณค่าความเชื่อมั่นแบบคู่ขนานจะไม่มีผลต่อช่วงระยะเวลา อย่างไรก็ตามในการใช้แบบทดสอบทางเลือกหรือแบบทดสอบคู่ขนานจะไม่สามารถขจัด carry-over effect ให้หมดไปได้ ซึ่งยังคงมีผลต่อรูปแบบการตอบ อารมณ์หรือเจตคติ carry-over effects ยังคงมีผลต่อการประมาณค่า หรือ ให้สูงกว่าหรือต่ำกว่าความเป็นจริง ช่วงเวลายังคงมีปัญหา การเว้นช่วงเวลาที่สั้นไประหว่างการสอบสองฉบับจะมีผลเนื่องมาจากความจำ การฝึกฝนและอารมณ์ การเว้นช่วงเวลาที่นานเกินไปจะไม่เหมาะกับแบบทดสอบที่วัดคุณลักษณะที่เปลี่ยนแปลงไปตามเวลา
เมื่อแบบทดสอบทางเลือก X และ Z ไม่มีความคู่ขนานกันแล้ว rXZ โดยทั่วไปจะเป็นตัวประมาณค่าที่ไม่ถูกต้องของ หรือ ตัวอย่างเช่น ให้ X = TX + EX และ Z = TZ + EZ ถ้า TX = TZ แต่ แล้ว X จะมีความเชื่อมั่นน้อยกว่า Z สหสัมพันธ์ rXZ จะมีแนวโน้มประมาณค่าได้สูงกว่า และประมาณค่าได้ต่ำกว่า ถ้า TX ¹ TZ เป็นไปได้ว่าแบบทดสอบสองฉบับนี้จะวัดคุณลักษณะที่แตกต่างกัน และ rXZ จะมีแนวโน้มประมาณค่าได้ต่ำกว่า และ ตัวอย่างเช่น ถ้า X คือคะแนนของแบบทดสอบคณิตศาสตร์คำนวณ และ Z คือคะแนนของแบบทดสอบคณิตศาสตร์เหตุผล rXZ คือสหสัมพันธ์ระหว่างคะแนนคณิตศาสตร์คำนวณและคณิตศาสตร์เหตุผล และไม่จำเป็นว่าจะต้องเป็นตัวประมาณค่าที่ดีของความเชื่อมั่นในแบบทดสอบทั้งสองฉบับ
เป็นไปได้ที่แบบทดสอบทางเลือกจะมีความไม่เท่ากันของคะแนนจริงและความแปรปรวนของคะแนนคลาดเคลื่อน แม้ว่าสหสัมพันธ์ระหว่างคะแนนสังเกตจะเท่ากับความสัมพันธ์ของแบบทดสอบคู่ขนาน ตัวอย่างเช่น ให้ X = TX + EX และ X’ = TX’ + EX’ เมื่อ X และ X’ คือคะแนนของแบบทดสอบคู่ขนาน ให้ Z = aX’ + b เมื่อ a และ b คือค่าคงที่ และ a > 0 นั่นคือ Z เป็นฟังก์ชันเชิงเส้นของ X’ แม้ว่า Z และ X จะไม่ใช่แบบทดสอบคู่ขนาน (TZ ¹ TX และ ) rXZ = rXX’ เมื่อ Z คือฟังก์ชันเชิงเส้นของ X’ สหสัมพันธ์ของ X และ Z จะเท่ากับสหสัมพันธ์ของ X กับ X’
สรุป สหสัมพันธ์ระหว่างคะแนนสังเกตบนแบบทดสอบทางเลือกให้การประมาณค่าความเชื่อมั่นที่ดีถ้าแบบทดสอบทางเลือกมีความคู่ขนานกันหรือคะแนนมีความสัมพันธ์กันเชิงเส้นตรง และถ้า carry-over effect และการเปลี่ยนแปลงของคะแนนที่ขึ้นอยู่กับช่วงเวลาห่างไม่มีผลต่อสหสัมพันธ์


การประมาณค่าความเชื่อมั่นด้วยวิธีหาความสอดคล้องภายใน : แบบแบ่งครึ่ง

ความเชื่อมั่นแบบสอดคล้องภายในจะถูกประมาณค่าด้วยการใช้แบบทดสอบเพียงฉบับเดียวสอบเพียงครั้งเดียว ดังนั้นจึงเป็นการหลีกเลี่ยงปัญหาที่เกิดขึ้นจากวิธีสอบซ้ำ วิธีนี้เป็นที่นิยมใช้กันอย่างแพร่หลาย แบบทดสอบจะถูกแบ่งครึ่งออกเป็นสองส่วน ซึ่งแต่ละส่วนจะคู่ขนานกันแบบพาราเรล (parelle) การประมาณค่าความเชื่อมั่นของแบบทดสอบจะใช้สูตรสเปียร์แมนบราวน์ (Spearman-Brown formula) แต่ถ้าทั้งสองส่วนนั้นคู่ขนานกันแบบทอ (essentially t–equivalent) จะใช้สัมประสิทธิ์แอลฟา (a-coefficient) ในการประมาณค่าความเชื่อมั่นของแบบทดสอบ
การใช้สูตรสเปียร์แมนบราวน์ คะแนนจากแบบทดสอบแบ่งครึ่ง (เรียกว่า Y และ Y’) จะนำมาหาสหสัมพันธ์กัน ผลที่ได้คือ rYY’ สหสัมพันธ์นี้จะเป็นการวัดความเชื่อมั่นของแบบทดสอบเพียงครึ่งฉบับ ความเชื่อมั่นของแบบทดสอบทั้งฉบับ X = Y + Y’ ควรจะมีค่ามากกว่าความเชื่อมั่นของแบบทดสอบเพียงแค่ครึ่งฉบับ สูตรสเปียร์แมนบราวน์จะให้ค่าความเชื่อมั่นของแบบทดสอบทั้งฉบับ คือ

ตาราง 1 จะแสดงค่าความเชื่อมั่น โดยปกติ rXX’ จะมีค่าสูงกว่า rYY’ เพราะ rXX’ เป็นค่าความเชื่อมั่นของแบบทดสอบทั้งฉบับ และ rYY’ เป็นค่าความเชื่อมั่นของแบบทดสอบเพียงครึ่งฉบับ

ตาราง 1 สหสัมพันธ์ระหว่างแบบทดสอบที่แบ่งครึ่งฉบับ (rYY’) และความเชื่อมั่นของแบบทดสอบทั้งฉบับ (rXX’)

rXX’
rYY’
0.00
0.33
0.57
0.75
0.89
1.00
0.00
0.20
0.40
0.60
0.80
1.00








สูตรสเปียร์แมนบราวน์สามารถใช้หาความเชื่อมั่นของแบบทดสอบที่แบ่งครึ่งฉบับแล้วมีความคู่ขนานกันแบบพาราเรล (parallel) แต่ถ้าคะแนนแบ่งครึ่งนั้นไม่มีความเท่ากันในความแปรปรวนหรืออื่น ๆ ที่บ่งชี้ว่าไม่คู่ขนานกันแบบพาราเรล (parallel) แล้ว ก็จะใช้สัมประสิทธิ์แอลฟา ในการประมาณค่าความเชื่อมั่น ถ้าสองส่วนที่แบ่งครึ่งนั้นมีความคู่ขนานกันแบบทอ (essentially t–equivalent) แต่ถ้าทั้งสองส่วนที่แบ่งครึ่งไม่มีความคู่ขนานกันแบบทอแล้ว ค่าสัมประสิทธิ์แอลฟาก็จะประมาณค่าความเชื่อมั่นได้ต่ำ (นั่นคือความเชื่อมั่นของแบบทดสอบต้องสูงกว่าหรือเท่ากับผลที่ได้จากสูตรสัมประสิทธิ์แอลฟา) ถ้าผลของสัมประสิทธิ์แอลฟามีค่าสูงแน่นอนว่าค่าความเชื่อมั่นของแบบทดสอบต้องมีค่าสูง ถ้าสัมประสิทธิ์แอลฟามีค่าต่ำ คุณไม่รู้ว่าความเชื่อมั่นของแบบทดสอบต่ำหรือแบบทดสอบที่แบ่งครึ่งไม่คู่ขนานกันแบบทอ สูตรสำหรับสัมประสิทธิ์แอลฟาแบ่งครึ่งคือ

เมื่อ และ คือความแปรปรวนของคะแนนแบบทดสอบที่แบ่งครึ่งฉบับเป็นส่งที่ 1 และส่วนที่ 2 และ คือความแปรปรวนของคะแนนบนแบบทดสอบทั้งฉบับ กับ X = Y1 + Y2
สมการคำนวณสัมประสิทธิ์แอลฟาและสูตรสเปียร์แมนบราวน์จะมีค่ามากถ้าแบบทดสอบที่แบ่งครึ่งมีความสัมพันธ์กันสูงและจะมีค่าต่ำเมื่อแบบทดสอบที่แบ่งครึ่งไม่มีความสัมพันธ์กัน แบบทดสอบที่แบ่งครึ่งจะมีความสัมพันธ์กันสูงเมื่อแบบทดสอบวัดคุณลักษณะเดียวกัน ดังนั้นความเชื่อมั่นแบบสเปียร์แมนบราวน์และสัมประสิทธิ์แอลฟาจะบ่งชี้ถึงแบบทดสอบที่มีความสอดคล้องภายในหรือเป็นเอกพันธ์กัน
ถ้าความแปรปรวนของคะแนนสังเกตของแบบทดสอบที่แบ่งครึ่งเท่ากัน สูตรสเปียร์แมนบราวน์และสูตรสัมประสิทธิ์แอลฟาจะมีค่าเท่ากัน ถ้าความแปรปรวนของคะแนนสังเกตของแบบทดสอบที่แบ่งครึ่งเท่ากันแต่ครึ่งนั้นไม่คู่ขนานกันแบบทอ ทั้งสูตรสเปียร์แมนบราวน์และสัมประสิทธิ์แอลฟาจะมีค่าความเชื่อมั่นต่ำกว่าความจริง ถ้าความแปรปรวนของคะแนนสังเกตของแบบทดสอบแบ่งครึ่งเท่ากันและสองส่วนนั้นคู่ขนานกันแบบทอแล้ว สูตรสเปียร์แมนบราวน์และสัมประสิทธิ์แอลฟาจะได้ค่าความเชื่อมั่นเท่ากัน
การใช้การประมาณค่าความเชื่อมั่นแบบแบ่งครึ่งสามารถแสดงได้ด้วยตัวอย่างดังนี้
สมมติว่าสหสัมพันธ์ระหว่างแบบทดสอบครึ่งฉบับเป็น 0.5 ความแปรปรวนของคะแนนคือ 7 และ 5 และความแปรปรวนของคะแนนรวมคือ 17.9 ใช้สูตรสเปียร์แมนบราวน์คำนวณค่าความเชื่อมั่นโดยรวมทั้งฉบับได้

ความเชื่อมั่นของแบบทดสอบทั้งฉบับประมาณค่าด้วยสัมประสิทธิ์แอลฟาได้ดังนี้

ตัวอย่างนี้สัมประสิทธิ์แอลฟาประมาณค่าความเชื่อมั่นได้ต่ำกว่าสูตรสเปียร์แมนบราวน์เพียงเล็กน้อย
ประโยชน์หลักของการประมาณค่าความเชื่อมั่นด้วยวิธีหาความสอดคล้องภายในคือใช้แบบทดสอบเพียงฉบับเดียวสอบเพียงครั้งเดียว อย่างไรก็ตามวิธีหาความสอดคล้องภายในไม่เหมาะสมเมื่อแบบทดสอบไม่สามารถแบ่งออกเป็นส่วน ๆ ที่คู่ขนานกันแบบพาราเรล (parallel) หรือแบบทอ (essentially t–equivalent) ได้ หรือเมื่อแบบทดสอบไม่มีข้อสอบที่เป็นอิสระจากกันทำให้ไม่สามารถแบ่งออกเป็นส่วน ๆ ได้ ตัวอย่างเช่น ในบางแบบทดสอบผู้สอบต้องจัดการกับวัตถุในช่วงเวลาที่กำหนดไม่สามารถจะแยกออกเป็นส่วน ๆ ได้ เพราะว่าการจัดการกับวัตถุในแต่ละชิ้นขึ้นอยู่กับเวลาและความคลาดเคลื่อนในขณะทำงานกับวัตถุชิ้นอื่น ๆ ในสถานการณ์นี้ การประมาณค่าความเชื่อมั่นแบบสอบซ้ำกับการใช้แบบทดสอบอื่นจะเหมาะสมมากกว่า
มีสามวิธีในการแบ่งครึ่งแบบทดสอบที่นิยมใช้กัน วิธีแรกจะเรียกว่า วิธีแบ่งข้อคู่ข้อคี่ (odd/even method) เป็นการจัดแบ่งข้อสอบออกเป็นสองกลุ่มโดยอาศัยตัวเลขข้อเป็นหลักในการแบ่ง ผู้สอบแต่ละคนจะมีคะแนนของแบบทดสอบในกลุ่มข้อคู่และข้อคี่ วิธีที่สองคือแบบเรียงอันดับ (order method) คือจะแบ่งข้อสอบออกเป็นครึ่งแรกกับครึ่งหลัง ผู้สอบแต่ละคนจะมีคะแนนของแบบทดสอบในครึ่งแรกและครึ่งหลังของแบบทดสอบ โดยทั่วไปการแบ่งครึ่งแรกกับครึ่งหลังจะมีความเหมาะสมน้อยกว่าแบบแบ่งข้อคู่และข้อคี่ เพราะว่าผู้สอบบางคนอาจจะได้รับอิทธิพลของการฝึกฝนจากข้อสอบที่เพิ่งทำผ่านมา (มีอิทธิพลกับแบบทดสอบครึ่งหลังให้คะแนนสูงกว่าปกติ) และผู้สอบบางคนทำแบบทดสอบไม่เสร็จ (มีอิทธิพลกับแบบทดสอบครึ่งหลังให้คะแนนต่ำกว่าปกติ) อย่างไรก็ตาม ปัญหาของผู้สอบบางคนที่ทำไม่เสร็จในครึ่งหลังของแบบทดสอบสามารถแก้ไขได้ด้วยการแบ่งครึ่งเวลา นั่นคือผู้สอบทำแบบทดสอบไปจนเสร็จครึ่งแรกและเมื่อเวลาหมด ผู้สอบทั้งหมดจึงค่อยลงมือทำแบบทดสอบครึ่งที่สอง จะช่วยให้ผู้สอบได้ทำแบบทดสอบสมบูรณ์ในทั้งครึ่งแรกและครึ่งหลัง การแบ่งครึ่งชนิดนี้จะมีความเท่าเทียมกับการใช้แบบทดสอบทางเลือกฉบับสั้น 2 ฉบับ
วิธีที่สามสำหรับการแบ่งครึ่งแบบทดสอบให้เท่าเทียมกันนี้เป็นวิธีที่ใหม่กว่าสองวิธีแรก วิธีนี้เรียกว่าการจับคู่แบบทดสอบย่อยอย่างสุ่ม (matched random subsets) ซึ่งมีอยู่หลายขั้นตอน ดังนี้
1. ต้องคำนวณสถิติของข้อสอบสองตัวคือ
1.1 สัดส่วนของผู้สอบที่ทำข้อสอบนั้นถูก (ความยากง่ายของข้อสอบ)
1.2 สหสัมพันธ์ไบซีเรียบหรือพอยท์ไบซีเรียลระหว่างคะแนนแบบทดสอบกับคะแนนรวม (อำนาจจำแนกของข้อสอบ)
2. ในข้อสอบแต่ละข้อพล็อตกราฟโดยใช้สถิติสองตัวนี้ ข้อสอบจะถูกจับคู่กันบนกราฟ โดยสองจุดใด ๆ ที่อยู่ใกล้กันให้จับทั้งคู่สุ่มไปใส่ในกลุ่มครึ่งฉบับ ตัวอย่างในภาพประกอบ 4 แสดงข้อสอบ 6 ข้อที่ถูกพล็อตลงบนกราฟ และจับกลุ่มเป็นคู่ ถ้าข้อ A ถูกเลือกเข้ากลุ่มครึ่งแรกแล้ว ข้อสอบ B ก็จะปรากฏอยู่ในอีกครึ่งหนึ่ง ความเป็นไปได้ของแบบทดสอบที่จะถูกสุ่มเข้ากลุ่มเป็นดังนี้ ACE และ BDF, ADE และ BCF, ACF และ BDE และอื่น ๆ วิธีนี้จะช่วยให้แน่ใจว่าสองส่วนนั้นมีความยากง่ายและอำนาจจำแนกเหมือนกันและการวัดนั้นก็วัดในสิ่งเดียวกัน (ดังนั้นคะแนนจริงจึงเท่ากัน)

ภาพประกอบ 4 การเลือกแบบทดสอบย่อยโดยใช้วิธีจับคู่สุ่มด้วยกราฟ

แบบทดสอบที่พิจารณาถึงมิติของความเร็ว (speed test) ตั้งแต่เริ่มทำจนเสร็จและแบบทดสอบที่ใช้เวลาในการคิดนาน (power test) แบบทดสอบที่ใช้ความเร็ว (speed test) สอดคล้องกับข้อสอบที่ผู้สอบทุก ๆ คนสามารถตอบได้ถูกหมดในเวลาที่พอเพียง แต่แบบทดสอบที่ให้เวลาน้อยเกินไปผู้สอบจะต้องพยายามตอบข้อสอบให้ได้โดยเร็ว ตัวอย่างเช่น แบบทดสอบที่ให้คำมาเป็นคู่ จำนวน 100 ข้อแล้วบอกถึงความแตกต่างควรจะทำให้เสร็จภายในเวลา 60 นาที หรืออีกแบบหนึ่งเป็นแบบทดสอบที่ต้องใช้ความสามารถมาก (power test) ซึ่งข้อสอบจะมีความยากให้เวลาไม่จำกัดในการสอบ การตอบได้หรือไม่ได้จึงขึ้นอยู่กับความสามารถของผู้สอบ สามารถตอบคำถามได้ถูกต้องเฉพาะข้อที่แน่ใจ การจำกัดเวลาในการสอบโดยทั่วไปต้องให้แน่ใจว่าผู้สอบแต่ละคนจะสามารถทำข้อสอบแต่ละข้อได้เสร็จ การทดสอบความสามารถหรือผลสัมฤทธิ์โดยมากมักจะใช้ทั้ง speed test และ power test
การประมาณค่าความเชื่อมั่นแบบแบ่งครึ่งไม่ควรใช้กับ speed test เพราะว่าผู้สอบโดยมากจะต้องพยายามตอบให้ถูกต้องภายในเวลาที่จำกัด ถ้าข้อสอบมี 30 ข้อการแบ่งข้อคู่ข้อคี่โดยปกติก็คือ 15 ข้อ และทั้งสองส่วนนี้ควรจะคู่ขนานกัน จะทำให้การประมาณค่าความเชื่อมั่นแบบแบ่งครึ่งมีค่าเข้าใกล้ 1 และถ้าการประมาณค่าความเชื่อมั่นแบบแบ่งครึ่งอยู่บนพื้นฐานของคะแนนที่สัมพันธ์กันระหว่างครึ่งแรกและครึ่งสองของแบบทดสอบ speed test การประมาณค่าความเชื่อมั่นจะเข้าใกล้ 0 ผู้สอบส่วนใหญ่ควรจะทำได้คะแนนดีมากในครึ่งแรก และได้คะแนนไม่ดีในครึ่งหลัง ในกรณีนี้ สหสัมพันธ์ระหว่างคะแนนบนแบบทดสอบที่แบ่งครึ่งควรจะเป็นผลสะท้อนให้เห็นความสมพันธ์ระหว่างความคลาดเคลื่อนของแบบทดสอบครึ่งแรกและความเร็วในการทำแบบทดสอบครึ่งหลัง การประมาณค่าความเชื่อมั่นด้วยวิธีวิธีการจับคู่ข้อสอบก็ไม่เหมาะสมกับ speed test เพราะว่าความยากของข้อสอบและความสัมพันธ์ของข้อสอบกับคะแนนรวมควรจะทำหน้าที่ในการบ่งบอกตำแหน่งของข้อสอบในแบบทดสอบมากกว่าจะบอกคุณลักษณะของข้อสอบ

ความเชื่อมั่นแบบความสอดคล้องภายใน : กรณีทั่วไป

เทคนิคการแบ่งครึ่งข้อสอบ (แบ่งข้อคู่ข้อคี่ แบบเรียงอันดับ และแบบจับคู่อย่างสุ่ม) สามารถทำให้อยู่ในรูปทั่วไปโดยการแบ่งแบบทดสอบออกมากกว่าสองส่วน เช่น วิธีแบ่งข้อคู่ข้อคี่สามารถปรับใช้โดยการแบ่งออกเป็นสามส่วน สำหรับแบบทดสอบที่มี 9 ข้อ โดยอาจจะให้ข้อหนึ่ง สี่ และเจ็ด เป็นส่วนแรก ข้อสอง ห้า และแปด เป็นส่วนที่สอง และข้อสาม หก และเก้า เป็นส่วนที่สาม วิธีการจับคู่อย่างสุ่มอาจจะใช้สามส่วน โดยการเลือกสามข้อที่อยู่ใกล้กันแล้วสุ่มแบ่งออกเป็นสามส่วน
ในหัวข้อนี้จะสมมติว่าแบบทดสอบถูกแบ่งออกเป็น N ส่วน ความแปรปรวนของคะแนนในแต่ละส่วนและความแปรปรวนของคะแนนรวมของแบบทดสอบจะใช้ในการประมาณค่าความเชื่อมั่นของแบบทดสอบ ถ้าในแต่ละส่วน (ข้อสอบ หรือชุดของข้อสอบ) มีความคู่ขนานกันแบบทอ (t-equivalent) สูตรที่นำเสนอในหัวข้อนี้จะให้ค่าความเชื่อมั่นของแบบทดสอบ ถ้าแต่ละส่วนไม่คู่ขนานกันแบบทอ (t-equivalent) สูตรในหัวข้อนี้จะประมาณค่าความเชื่อมั่นได้ต่ำกว่าความเป็นจริง นอกจากนี้ สูตรจะประมาณค่าความเชื่อมั่นได้ดีเมื่อแบบทดสอบวัดคุณลักษณะเดียว นั่นคือเมื่อแบบทดสอบมีเนื้อหาเป็นเอกพันธ์ (homogeneos) แต่แบบทดสอบวัดเชาวน์ปัญญาซึ่งวัดความสามารถทางภาษา มิติสัมพันธ์ และอื่น ๆ ควรจะเป็นวิวิธพันธ์ (heterogeneos) การวัดความเชื่อมั่นแบบความสอดคล้องภายในไม่เหมาะที่จะใช้กับแบบทดสอบที่เป็นวิวิธพันธ์
สูตรสำหรับความเชื่อมั่นแบบความสอดคล้องภายในกรณีทั่วไปคือสัมประสิทธิ์แอลฟา (-coefficient)

เมื่อ X คือ คะแนนรวมของแบบทดสอบที่รวมกัน N ส่วน
X =
คือ ความแปรปรวนของแบบทดสอบที่รวมกัน N ส่วน
คือ ความแปรปรวนของส่วนที่ i , Yi
N คือ จำนวนส่วนที่รวมกันเป็นคะแนน X เช่น ถ้า N = 3
คะแนนของแบบทดสอบ X ก็จะมาจากผลรวมของคะแนน
ในสามส่วน
สัมประสิทธิ์แอลฟาโดยทั่วไป นิยมเขียนเป็นสมการว่า

ถ้าในแต่ละส่วนเป็นข้อสอบแบบ 0, 1 (dichotomous) สมการข้างต้นสามารถเขียนในรูปแบบเฉพาะได้ว่า

เมื่อ pi คือสัดส่วนของผู้สอบที่ตอบข้อสอบข้อที่ i ได้ถูกต้องหรือก็คือความยากง่ายนั่นเอง สมการ KR20 ข้างต้นสะท้อนให้เห็นความแปรปรวนของคะแนนในข้อที่ i เมื่อคะแนนของข้อสอบให้คะแนนเป็น 0, 1 เท่ากับ pi(1 - pi) เมื่อ pi คือสัดส่วนของผู้สอบที่ได้ 1 คะแนนในข้อ i (นั่นคือสอบผ่านในข้อนั้น) สมการ KR20 ข้างต้นก็คือสูตร Kuder-Richardson formula 20 เขียนย่อว่า KR20 เพราะว่า Kuder-Richardson นำเสนอสูตรนี้เป็นสูตรที่ 20 อีกชื่อหนึ่งของสูตรนี้ก็คือ coefficient -20 สูตร KR-20 โดยทั่วไปนิยมเขียนเป็นสมการว่า

อีกสูตรหนึ่งของ Kuder-Richardson ก็คือสูตร KR21

เมื่อ`p คือค่าเฉลี่ยของความยากข้อสอบ เพราะว่า`p สามารถคำนวณได้โดยใช้`p = S(X)/N สมการ KR21 สามารถคำนวณโดยใช้ค่าเฉลี่ยและความแปรปรวนของข้อสอบ N ข้อในแบบทดสอบ ซึ่งเป็นกรณีเฉพาะของสูตร KR20 และสูตรนี้ นิยมเขียนเป็นสมการว่า

โดยปกติสูตร KR20 และ KR21 จะเกี่ยวข้องกันโดยที่
KR20 ³ KR21
ทั้งสองสูตรนี้จะมีค่าเท่ากันเมื่อความยากง่ายของข้อสอบเท่ากันทุกข้อ ถ้าข้อสอบมีค่าความยากง่ายไม่เท่ากันแล้ว KR21 จะประมาณค่าได้ต่ำกว่า KR20 และเป็นการประมาณค่าความเชื่อมั่นที่ต่ำกว่าความเป็นจริง
ผลต่างของสูตร KR20 และ KR21 เสนอโดย Tucker (1949) ดังนี้
KR20 - KR21 = =
ผลจากสูตร  และ KR20 จะประมาณค่าได้ต่ำกว่าหรือเท่ากับความเชื่อมั่นแท้จริงของแบบทดสอบ จะประมาณค่าได้เท่ากับความเชื่อมั่นแท้จริงของแบบทดสอบเมื่อในแต่ละองค์ประกอบ (Yi) มีความคู่ขนานกันแบบทอ (t-equivalent) (นั่นคือจำเป็นที่คะแนนจริงจะต้องเท่ากัน) ส่วน KR21 จะเท่ากับความเชื่อมั่นแท้จริงของแบบทดสอบถ้าข้อสอบมีความยากง่ายเท่ากันและคู่ขนานกันแบบทอ (t-equivalent) และทั้งสามสูตรที่นำเสนอข้างต้นนี้จะให้ค่าความเชื่อมั่นสูงถ้าคะแนนในแต่ละส่วนกับคะแนนรวมมีความสัมพันธ์กันสูง และจะให้ค่าความเชื่อมั่นต่ำถ้าคะแนนในแต่ละส่วนกับคะแนนรวมมีความสัมพันธ์กันต่ำ ในแต่ละส่วนจะมีความสัมพันธ์กันสูงถ้าแบบทดสอบนั้นวัดคุณลักษณะเดียวกัน ดังนั้นสูตรที่นำเสนอในหัวข้อนี้จะเป็นตัวบ่งชี้ถึงความสอดคล้องภายในของแบบทดสอบหรือความเป็นเอกพันธ์ของแบบทดสอบ

ตัวอย่างคำนวณ
ต่อไปนี้จะเป็นตัวอย่างในการใช้สูตรที่นำเสนอในหัวข้อนี้มาประมาณค่าความเชื่อมั่นแบบความสอดคล้องภายใน

ตาราง 2 ข้อมูลสำหรับประมาณค่าความเชื่อมั่น


ข้อสอบ

ผู้สอบ
1
2
3
4
5
6
รวม
1
2
3
4
5
6
7
8
9
10
0
0
1
1
1
0
0
0
1
0
0
0
0
1
1
0
0
0
0
1
0
0
1
1
1
1
1
0
1
0
0
0
1
1
1
0
1
1
1
1
0
1
1
1
1
0
1
0
1
0
0
0
0
1
1
0
0
0
0
1
0
1
4
6
6
1
3
1
4
3




ค่าเฉลี่ย
ส่วนเบี่ยงเบนมาตรฐาน
2.9
2.02

1. กรณีแบบทดสอบถูกแบ่งครึ่งออกเป็น 2 ส่วน โดยส่วนแรกประกอบด้วยข้อ 1 - 3 และส่วนที่สองประกอบด้วยข้อ 4 - 6 และสมมติทั้ง 2 ส่วนคู่ขนานกันแบบพาราเรล (Parallel) สัมประสิทธิ์สหสัมพันธ์ระหว่างสองส่วนเท่ากับ 0.82 ประมาณค่าความเชื่อมั่นด้วยสูตรของสเปียร์แมนบราวน์
SB = = 0.90
2. กรณีแบบทดสอบถูกแบ่งออก 6 ส่วน โดยแต่ละข้อถือเป็น 1 ส่วน และทุกข้อคู่ขนานกันแบบทอ ประมาณค่าสัมประสิทธิแอลฟา KR20 และ KR21
= = 0.80
= = 0.84
= = 0.80
ผลต่างของ KR20 และ KR21 คำนวณได้ด้วยสูตรของทัคเกอร์ (Tucker) ดังนี้
KR20 - KR21 = = = 0.04



สูตรสเปียร์แมนบราวน์ : กรณีทั่วไป

อีกวิธีการหนึ่งในการประมาณค่าความเชื่อมั่นของแบบทดสอบก็คือสูตรสเปียร์แมน
บราวน์ สูตรสเปียร์แมนบราวน์จะใช้ในการทำนายอิทธิพลที่เปลี่ยนแปลงไปของความยาวของแบบทดสอบที่จะมีต่อค่าความเชื่อมั่น สูตรนี้จะอ้างอิงกับการประมาณค่าความเชื่อมั่นแบบแบ่งครึ่ง สูตรสเปียร์แมนบราวน์โดยทั่วไปคือ

เมื่อ X คือคะแนนรวมของแบบทดสอบที่สังเกตได้จากการรวมคะแนนในแต่ละองค์ประกอบที่คู่ขนานกันแบบพาราเรลของแบบทดสอบ, X =
Yi คือคะแนนของแบบทดสอบในแต่ละองค์ประกอบ
คือความเชื่อมั่นของแบบทดสอบทั้งฉบับ (X)
คือความเชื่อมั่นของในแต่ละองค์ประกอบ (Yi) และ
N คือจำนวนขององค์ประกอบที่คู่ขนานกันแบบพาราเรลที่รวมกันเป็นฉบับ X

ภาพประกอบ 5 ความสัมพันธ์ระหว่างความยาวของแบบทดสอบและความเชื่อมั่น

สูตรสเปียร์แมนบราวน์จะแสดงค่าความเชื่อมั่นของแบบทดสอบ ในเทอมของความเชื่อมั่นในแต่ละองค์ประกอบที่คู่ขนานกันของแบบทดสอบ สังเกตว่าในสูตรนี้ จะมีค่ามากกว่าหรือเท่ากับ เสมอ ค่าความเชื่อมั่นของแบบทดสอบที่เกิดจากการรวมองค์ประกอบที่คู่ขนานกันต้องมีค่ามากกว่าหรือเท่ากับค่าความเชื่อมั่นขององค์ประกอบใดองค์ประกอบหนึ่ง ซึ่งค่าความเชื่อมั่น ในบางครั้งเรียกว่า Stepped-up reliability เพราะคือการปรับแก้ค่าความเชื่อมั่นให้สูงขึ้นจากความเชื่อมั่นในฉบับที่สั้นกว่า
ภาพประกอบ 5 จะแสดงอิทธิพลโดยทั่วไปของการเปลี่ยนแปลงความยาวแบบทดสอบที่จะมีผลกับ สำหรับแบบทดสอบที่แต่ละองค์ประกอบมีค่าความเชื่อมั่น เป็น 0.2, 0.4, 0.6 และ 0.8 เมื่อเราทราบค่าของสองจำนวนจากสามจำนวนคือ N, และ แล้ว เราสามารถหาจำนวนที่สามได้ ถ้า = 0.4 และ = 0.8 แบบทดสอบนี้จะยาวกว่าแบบทดสอบเดิม 6 เท่า (N = 6) ภาพประกอบ 5 จะแสดงการเพิ่มขึ้นของความยาวแบบทดสอบที่สัมพันธ์กับความเชื่อมั่นของแบบทดสอบ เมื่อ N -> µ แล้ว ความเชื่อมั่นของแบบทดสอบที่มี N องค์ประกอบจะมีค่าถึง 1.0 โดยที่ ¹ 0
สมการข้างต้นจะใช้เมื่อเรารู้ N และ และต้องการหาค่า เมื่อเรารู้ความเชื่อมั่นของแบบทดสอบ และต้องการกำหนดความเชื่อมั่นของแบบทดสอบในฉบับที่สั้นกว่า ( ) และมีความยาวเป็น 1/N เท่าของฉบับเต็ม สูตรสเปียร์แมนบราวน์จะเขียนได้ใหม่เป็น

ในกรณีที่รู้ค่า และ เราสามารถแก้สมการของสเปียร์แมนบราวน์ใหม่ได้ว่า

ต่อไปนี้จะแสดงตัวอย่างของการประยุกต์ใช้สูตรสเปียร์แมนบราวน์ในการประมาณค่าความเชื่อมั่น (rXX’ และ rYY’) แทนค่าความเชื่อมั่นของประชากร ( และ ) การประมาณค่าความเชื่อมั่นนี้ สามารถใช้ควบคู่ไปกับการประมาณค่าความเชื่อมั่นแบบสอบซ้ำ แบบคู่ขนาน แบบทดสอบทางเลือก หรือแบบความสอดคล้องภายใน
1. คุณมีแบบทดสอบที่ใช้เวลาในการสอบเพียง 5 นาทีและประมาณค่าความเชื่อมั่นได้ 0.6 ถ้าคุณต้องการเพิ่มแบบทดสอบอีก 3 เท่าที่คู่ขนาน ความเชื่อมั่นของแบบทดสอบที่ยาวกว่าคืออะไร ในที่นี้ N = 3, rYY’ = 0.6 ใช้สมการสเปียร์แมนบราวน์คำนวณได้

ความเชื่อมั่นนี้อ้างอิงได้จากภาพประกอบ 5
2. คุณมีข้อสอบ 50 ข้อที่ประมาณค่าความเชื่อมั่นได้ 0.9 ถ้าคุณเอาข้อสอบออกมา 10 ข้อแล้ว ความเชื่อมั่นของแบบทดสอบ 10 ข้อนั้นคือเท่าไหร่ ในที่นี้ N = 5, rXX’ = 0.9 และเราจะคำนวณ rYY’ ได้ดังนี้

3. คุณมีแบบทดสอบฉบับสั้น 10 ข้อที่มีค่าความเชื่อมั่น 0.8 แบบทดสอบควรจะยาวเท่าไหร่จึงจะมีค่าความเชื่อมั่น 0.9 ในที่นี้ rYY’ = 0.8, rXX’ = 0.9 และเราจะคำนวณหาความยาวของแบบทดสอบได้ดั้งนี้

แบบทดสอบใหม่ควรจะมีความยาวเป็น 2.25 เท่าของแบบทดสอบเดิมหรือก็คือ 23 ข้อ
สูตรสเปียร์แมนบราวนี้จะอยู่บนพื้นฐานขององค์ประกอบแต่ละองค์ประกอบในแบบทดสอบต้องคู่ขนานกันแบบพาราเรล รวมทั้งชุดของข้อสอบหรือองค์ประกอบที่เพิ่มเข้าไปในแบบทดสอบด้วย ถ้าเพิ่มอย่างระมัดระวังข้อสอบที่เพิ่มมีความคู่ขนานกับข้อสอบเดิมในฉบับ ความเชื่อมั่นควรจะสูงขึ้น แต่ถ้าเพิ่มอย่างไม่ระวัง ความเชื่อมั่นจะลดต่ำลง อย่างไรก็ตาม แบบทดสอบที่ยาวกว่าย่อมมีความเชื่อมั่นสูงกว่า เพราะว่าข้อตกลงเบื้องต้นของทฤษฏีคะแนนจริงมาตรฐานเดิม เมื่อ N เพิ่มขึ้น ความแปรปรวนของคะแนนจริงจะเพิ่มมากกว่าความแปรปรวนของความคลาดเคลื่อน
ถ้าข้อสอบหรือองค์ประกอบของแบบทดสอบไม่คู่ขนานกันแล้ว สูตรสเปียร์แมนบราวน์จะประมาณค่าได้ต่ำกว่าหรือสูงกว่าความเป็นจริง ตัวอย่างเช่น แบบทดสอบ 10 ข้อคำนวณค่าความเชื่อมั่นได้ 0.6 เมื่อเพิ่มข้อสอบที่คู่ขนานกับข้อสอบเดิมอีกเท่าตัว จะได้ค่าความเชื่อมั่น [2(0.6)]/[1+(0.6)] = 0.75 อย่างไรก็ตาม ถ้าข้อสอบที่เพิ่มเข้าไปไม่คู่ขนานกับข้อสอบเดิม โดยข้อสอบ 10 ข้อใหม่ที่เพิ่มเข้าไปนั้นไม่มีความแปรปรวน จึงไม่มีผลต่อคะแนนของผู้สอบ จึงไม่ช่วยเพิ่มค่าความเชื่อมั่นให้สูงขึ้น ในกรณีนี้ข้อสอบ 20 ข้อจะได้ค่าความเชื่อมั่นเท่ากับ 0.6 (เท่ากับแบบทดสอบฉบับเดิม)
ในอีกสถานการณ์หนึ่ง สูตรสเปียร์แมนบราวน์สามารถประมาณค่าความเชื่อมั่นได้ต่ำกว่าความเป็นจริง ตัวอย่างเช่น สมมติว่าข้อสอบ 10 ข้อมีความเชื่อมั่น 0.0 สูตรสเปียร์แมนบราวน์คำนวณค่าความเชื่อมั่นเมื่อเพิ่มข้อสอบอีกเท่าตัวที่คู่ขนานกับข้อสอบเดิมได้ [2(0.0)]/[1+(0.0)] = 0.0 อย่างไรก็ตาม ถ้าข้อสอบที่เพิ่มเข้าไปไม่มีความคู่ขนานกับแบบทดสอบเดิมแล้ว ความเชื่อมั่นใหม่ที่คำนวณได้จะได้เท่ากับ 0.7 ความเชื่อมั่นของข้อสอบฉบับใหม่ 20 ข้อจะประมาณค่าได้มากกว่า 0.0 ในกรณีนี้การใช้สูตรสเปียร์แมนบราวน์ที่ไม่เหมาะสมจะทำให้ประมาณค่าความเชื่อมั่นได้ต่ำกว่าความเป็นจริง ผลของความเชื่อมั่นที่ใช้สูตรสเปียร์แมนบราวน์จะมีความถูกต้องเมื่อข้อสอบหรือองค์ประกอบที่เพิ่มเข้าไปมีความคู่ขนานกัน
สามารถประยุกต์ใช้สูตรสเปีรย์แมนบราวน์ได้ในอีกสองสถานการณ์คือ สถานการณ์แรก เมื่อต้องการเปรียบเทียบความเชื่อมั่นของแบบทดสอบสองฉบับที่มีความยาวของแบบทดสอบต่างกัน แบบทดสอบที่ยาวมากกว่าดูเหมือนจะมีค่าความเชื่อมั่นสูงกว่า การประยุกต์ใช้สูตรสเปียร์แมนบราวน์จะช่วยให้เราประมาณค่าความเชื่อมั่นของแบบทดสอบถ้าสองฉบับนั้นมีความยาวเท่ากัน สถานการณ์ที่สอง เพราะว่าแบบทดสอบที่สั้นมากมีแนวโน้มจะมีค่าความเชื่อมั่นที่ต่ำกว่าแบบทดสอบที่ยาวกว่า ซึ่งควรจะมีความระมัดระวังเมื่อมีการเปรียบเทียบคะแนนจากแบบทดสอบฉบับสั้น

เปรียบเทียบวิธีการประมาณค่าความเชื่อมั่น

เราได้อธิบายความแตกต่างของวิธีการประมาณค่าความเชื่อมั่นของแบบทดสอบและวิธีการที่แตกต่างกันนี้จะคำนวณค่าความเชื่อมั่นได้ต่างกัน ในการประมาณค่าความเชื่อมั่นของแบบทดสอบ speed test นั้น ควรจะใช้การประมาณค่าความเชื่อมั่นแบบสอบซ้ำ แบบทดสอบทางเลือกหรือแบบทดสอบคู่ขนาน เพราะว่าถ้าจะใช้การประมาณค่าความเชื่อมั่นด้วยวิธีหาความสอดคล้องภายในจะไม่ถูกต้อง การใช้สัมประสิทธิ์แอลฟาและสูตรคูเดอร์ริชาร์ดสันจะให้ค่าความเชื่อมั่นขั้นต่ำ ซึ่งค่าความเชื่อมั่นขั้นต่ำนี้จะเท่ากับค่าความเชื่อมั่นของแบบทดสอบ ถ้าข้อสอบหรือแต่ละส่วนในแบบทดสอบมีความคู่ขนานกันแบบทอ (essentially t-equivalent) สัมประสิทธิ์แอลฟาและสูตรคูเดอร์ริชาร์ดสันควรจะใช้เมื่อข้อสอบเป็นเอกพันธ์กัน ถ้าแบบทดสอบที่วัดมีหลายคุณลักษณะ สูตรสัมประสิทธิ์แอลฟาและคูเดอร์ริชาร์ดสันก็จะไม่เหมาะ สูตรสเปียร์แมนบราวน์สามารถประมาณค่าได้ต่ำกว่าหรือสูงกว่าความเป็นจริงถ้าข้อสอบหรือองค์ประกอบในแบบทดสอบไม่คู่ขนานกันแบบพาราเรล เมื่อข้อสอบหรือองค์ประกอบในแบบทดสอบมีความคู่ขนานกันแบบพาราเรลแล้ว สูตรสเปียร์แมนบราวน์จะมีประโยชน์ในการประมาณค่าความเชื่อมั่นของแบบทดสอบเมื่อความยาวเปลี่ยนไป

ความเชื่อมั่นของแบบทดสอบแบบอิงเกณฑ์

ผลการวัดควรจะต้องมีความถูกต้องแม่นยำ ปราศจากความคลาดเคลื่อน มีผู้เสนอวิธีการคำนวณหาความเชื่อมั่นของข้อสอบอิงเกณฑ์หลายวิธีดังนี้

1. วิธีของคาร์เวอร์ (Carver) ใช้แบบทดสอบคู่ขนาน โดยให้ข้อสอบคล้ายกันข้อต่อข้อ แล้วนำไปสอบนักเรียน แล้วนำข้อมูลที่ได้มาสร้างตารางดังนี้

ฉบับ B
ฉบับ A
สอบไม่ผ่าน
สอบผ่าน
สอบผ่าน
b
a
สอบไม่ผ่าน
c
d

ค่าความเชื่อมั่น =

ตัวอย่างคำนวณ
นักเรียน 8 คน ทำแบบทดสอบอิงเกณฑ์ 2 ฉบับ ฉบับละ 10 ข้อ คะแนนจุดตัดคือ 5 คะแนน มีผลการสอบดังนี้

คนที่
1
2
3
4
5
6
7
8
ฉบับที่ 1
7
8
9
4
5
3
4
5
ฉบับที่ 2
6
8
7
5
6
4
4
3

คำนวณค่าความเชื่อมั่นของแบบทดสอบอิงเกณฑ์ ดังตาราง


ฉบับ 2
ฉบับ 1
สอบไม่ผ่าน
สอบผ่าน
สอบผ่าน
1
4
สอบไม่ผ่าน
2
1

พบว่ามีผู้สอบผ่านทั้ง 2 ฉบับจำนวน 4 คน และสอบไม่ผ่านทั้ง 2 ฉบับจำนวน 2 คน แทนค่าคำนวณค่าความเชื่อมั่นดังนี้
ค่าความเชื่อมั่น = = 0.75

2. วิธีของลิวิงสตัน (Livingston) ใช้การสอบครั้งเดียวหลังเรียนจบ แล้วคำนวณด้วยสูตร
rcc =

เมื่อ rtt คือความเชื่อมั่นของแบบทดสอบที่คำนวณด้วยวิธีอิงกลุ่ม
(เช่น KR-20, KR-21 ฯลฯ)
2 คือความแปรปรวนของคะแนนสอบทั้งฉบับ
`X คือคะแนนเฉลี่ยของคะแนนสอบทั้งฉบับ
c คือคะแนนจุดตัด
วิธีใช้ได้ผลดีเมื่อคะแนนมีการกระจายแบบฐานนิยมเดียว

ตัวอย่างคำนวณ
ผลการสอบข้อสอบจำนวน 10 ข้อ มีคะแนนเฉลี่ย 6.4 และความแปรปรวนคือ 1.8 มีคะแนนจุดตัดคือ 5 มีค่าความเชื่อมั่นที่คำนวณจากสูตร KR-20 คือ 0.86 คำนวณค่าความเชื่อมั่นแบบอิงเกณฑ์ได้ดังนี้
rcc =
=
= 3.508/3.76
= 0.9329

3. วิธีของสวามินาทานและคณะ (Swaminathan) วิธีนี้ใช้แบบทดสอบฉบับเดียวแต่สอบซ้ำ 2 ครั้งหลังจากสิ้นสุดการสอน เพื่อดูความคงเส้นคงวา


สอบครั้งที่ 1
สอบครั้งที่ 2
สอบผ่าน
สอบไม่ผ่าน
สอบผ่าน
a
b
สอบไม่ผ่าน
c
d

ค่าความเชื่อมั่น (K) =
เมื่อ



ตัวอย่างคำนวณ
จากข้อมูลในตัวอย่างคำนวณค่าความเชื่อมั่นด้วยวิธีของคาร์เวอร์


ฉบับ 2
ฉบับ 1
สอบผ่าน
สอบไม่ผ่าน
สอบผ่าน
4
1
สอบไม่ผ่าน
1
2

คำนวณค่าความเชื่อมั่นด้วยวิธีสอบสวามินาธานและคณะ ได้ดังนี้
= 0.75
= = 0.53
ค่าความเชื่อมั่น (K) =
= = 0.468

4. วิธีของโลเวทท์ (Lovett) ใช้การสอบครั้งเดียวหลังเรียน มีสูตรดังนี้

rcc =

เมื่อ xi คือคะแนนของแต่ละคน
k คือจำนวนข้อสอบทั้งฉบับ
c คือคะแนนจุดตัด

ตัวอย่างคำนวณ
แบบทดสอบอิงเกณฑ์ฉบับหนึ่งมี 10 ข้อ มีคะแนนจุดตัดที่ 5 คะแนน ไปสอบกับนักเรียนจำนวน 8 คน ปรากฏผลดังนี้




คนที่
1
2
3
4
5
6
7
8
ผลรวม
คะแนน (X)
7
8
9
4
5
3
4
5
45
X2
49
64
81
16
25
9
16
25
285
(X - c)
2
3
4
-1
0
-2
-1
0
5
(X - c)2
4
9
16
1
0
4
1
0
35

แทนค่าในสูตรคำนวณค่าความเชื่อมั่นของโลเวท ได้ค่าดังนี้
rcc =
=
= 1-0.5238
= 0.4763




อิทธิพลที่มีต่อความเชื่อมั่น

ความเป็นเอกพันธ์ของกลุ่มตัวอย่าง
ขนาดของสัมประสิทธิ์ความเชื่อมั่นขึ้นอยู่กับความแปรปรวนของแต่ละบุคคลบนคะแนนจริงและคะแนนความคลาดเคลื่อน ดังนั้น ความเป็นเอกพันธ์ของกลุ่มผู้สอบมีความสำคัญในการพัฒนาแบบทดสอบและเลือกใช้แบบทดสอบ สมมติว่าแบบทดสอบที่พัฒนาขึ้นวัดความวิตกกังวลในวิชาคณิตศาสตร์ ถ้าแบบทดสอบนี้ใช้กับกลุ่มตัวอย่างกลุ่มหนึ่งที่เลือกเรียนคณิตศาสตร์แล้ว แน่นอนว่านักเรียนแต่ละคนจะต้องได้คะแนนความวิตกกังวลในระดับต่ำ ดังนั้นความแปรปรวนของคะแนนจริงจะต่ำและความเชื่อมั่นก็จะต่ำด้วย ถ้าใช้แบบทดสอบเดียวกันนี้กับอีกกลุ่มตัวอย่างหนึ่งที่มีลักษณะแตกต่างกันออกไป คะแนนจริงจะมีความแปรปรวนสูงมาก สมมติว่าควบคุมความแปรปรวนของความคลาดเคลื่อนให้คงที่ และขนาดของกลุ่มตัวอย่างเท่ากัน สัมประสิทธิ์ความเชื่อมั่นของกลุ่มที่สองย่อมสูงกว่ากลุ่มแรก ตาราง 1 แสดงสถานการณ์ในตัวอย่างนี้ ในการใช้แบบทดสอบที่มีประสิทธิภาพนั้น จะต้องแสดงวิธีการหาความเชื่อมั่นในคู่มือสอบด้วยและแสดงค่าสถิติต่าง ๆ ของกลุ่มที่ใช้ ถ้าแบบทดสอบที่ผลิตออกมามีความเป็นวิวิธพันธ์มากในลักษณะของผู้สอบที่ใช้วัด ความเชื่อมั่นจะสูง และความเชื่อมั่นจะลดลงเมื่อใช้กับกลุ่มตัวอย่างที่เป็นเอกพันธ์มาก




ตาราง 1 สัมประสิทธิ์ความเชื่อมั่นของกลุ่มตัวอย่าง 2 กลุ่มที่แตกต่างกันในความแปรปรวนของคะแนนจริง


กลุ่ม 1
กลุ่ม 2
ความแปรปรวนของคะแนนจริง
ความแปรปรวนของคะแนนคลาดเคลื่อน
ความแปรปรวนของคะแนนสังเกต
20
10
30
60
10
70
สัมประสิทธิ์ความเชื่อมั่น
.67
.85

แมกนิลสัน (1967) ได้เสนอสูตรสำหรับการทำนายค่าความเชื่อมั่นที่เปลี่ยนไปเมื่อความแปรปรวนของกลุ่มตัวอย่างเปลี่ยนไป
เมื่อ คือความแปรปรวนของกลุ่มใหม่ คือความแปรปรวนของกลุ่มเดิม คือความเชื่อมั่นของกลุ่มเดิม และ คือค่าความเชื่อมั่นใหม่ที่ถูกทำนาย สิ่งสำคัญที่ควรสังเกตคือ สูตรนี้ได้มีข้อตกลงว่า ความแปรปรวนของคะแนนความคลาดเคลื่อนเท่ากันในทั้งสองกลุ่ม และความเปลี่ยนแปลงของคะแนนที่สังเกตได้เนื่องมาจากความแตกต่างของคะแนนจริง ผู้ที่ใช้แบบทดสอบสามารถตรวจสอบข้อตกลงได้เมื่อนำแบบทดสอบไปใช้กับกลุ่มตัวอย่างและตรวจสอบเชิงประจักษ์โดยประมาณค่าความเชื่อมั่นของกลุ่มตัวอย่างใหม่

ความยาวของแบบทดสอบ
คุณลักษณะหนึ่งของแบบทดสอบที่มีอิทธิพลต่อความแปรปรวนของคะแนนจริงและความแปรปรวนของคะแนนที่สังเกตได้คือ ความยาวของแบบทดสอบ ลองพิจารณาสถานการณ์ที่ผู้สอบใช้แบบทดสอบที่มีข้อสอบ 1 ข้อ กับที่ใช้ข้อสอบ 10 ข้อวัดเนื้อหาเดียว แบบทดสอบฉบับไหนจะน่าเชื่อถือได้มากกว่ากัน ย่อมเป็นแบบทดสอบที่ใช้จำนวนข้อมาก ๆ ความสัมพันธ์ระหว่างความยาวของแบบทดสอบและความเชื่อมั่นแสดงดังสูตร
เมื่อ คือความเชื่อมั่นของแบบทดสอบเดิม k คือจำนวนเท่าของข้อสอบที่เพิ่มเข้าไปในแบบทดสอบ คือความเชื่อมั่นใหม่ ดังนั้น ถ้าความเชื่อมั่นของแบบทดสอบย่อยฉบับหนึ่งมีค่าเป็น 0.75 ความเชื่อมั่นของแบบทดสอบที่เพิ่มจำนวนข้อสอบเข้าไป 5 เท่า จะคำนวณได้ค่าความเชื่อมั่น
หรือถ้าแบบทดสอบย่อย j มี 50 ข้อแบบทดสอบย่อยใหม่มี 150 ข้อ แบบทดสอบย่อยใหม่มีจำนวนข้อเพิ่มเป็น 3 เท่าของฉบับเดิม หรือ k = 3 ยิ่งกว่านั้น k ไม่จำเป็นต้องเป็นจำนวนเต็มเสมอไป และไม่จำเป็นต้องมากกว่า 1.00 เช่น แบบทดสอบ 100 ข้อ และพัฒนาแบบทดสอบต่อไปจนเหลือแค่เพียง 75 ข้อ และ k คือความยาวของแบบทดสอบที่ต้องคูณเมื่อมีความยาวใหม่ 100(k) = 75 ข้อ k = .75 ดังนั้นถ้า = 60 ความเชื่อมั่นสำหรับแบบทดสอบฉบับสั้นกว่าคือ
เมื่อความยาวของแบบทดสอบเพิ่มขึ้น ค่า k ก็จะมีค่าเกิน 1 เสมอ เมื่อความยาวของแบบทดสอบลดลง ค่า k มีค่าต่ำกว่า 1 เสมอ สังเกตว่าการเพิ่มขึ้นของความเชื่อมั่นมีผลมาจากการเพิ่มขึ้นของความยาวข้อสอบ นั่นคือถ้าเพิ่มความยาวเท่าตัวของแบบทดสอบที่มีความเชื่อมั่น .60 แล้ว ความเชื่อมั่นจะเพิ่มเป็น .75 ถ้าเพิ่มเป็นสามเท่า ความเชื่อมั่นจะเพิ่มเป็น .81 ถ้าเพิ่มถึงห้าเท่า ความเชื่อมั่นจะเพิ่มเป็น .88 ดังนั้นการเพิ่มข้อสอบเพื่อให้ได้ความเชื่อมั่นเพิ่มขึ้นบางครั้งก็ต้องพิจารณาถึงต้นทุนในการเขียนและการใช้แบบทดสอบด้วย

การจำกัดเวลาในการสอบ
เมื่อการทดสอบมีการจำกัดเวลาที่ตายตัวเช่น กลุ่มผู้สอบจำนวนหนึ่งทำข้อสอบเสร็จ แต่คนอื่น ๆ ยังทำไม่เสร็จ เวลาที่ให้ในการทำข้อสอบจะมีอิทธิพลต่อความคลาดเคลื่อนอย่างเป็นระบบต่อการทำข้อสอบของนักเรียนทั้งหมด ดังนั้น ความแปรปรวนจากระยะเวลาที่ผู้สอบได้ทำข้อสอบกลายมาเป็นส่วนหนึ่งของความแปรปรวนของคะแนนจริง ในบางแบบทดสอบ (เช่น แบบทดสอบวัดความถนัด) เป้าหมายในการทำข้อสอบต้องการประเมินความสามารถในทางปฏิบัติที่ว่องไวในการทำงาน แต่แบบทดสอบนั้น ระยะเวลาการตอบข้อสอบอาจจะเกี่ยวข้องกับลักษณะที่ถูกวัด ในแบบทดสอบหลาย ๆ ชนิดมีการจำกัดเวลา ซึ่งควรจะให้เวลานานเพียงพอที่เด็กทั้งหมดสามารถทำเสร็จได้พอดีเวลา

คุณลักษณะของข้อสอบ
ความเชื่อมั่นของคะแนนแบบทดสอบที่มีข้อสอบตั้งแต่ 2 ข้อขึ้นไปต้องขึ้นอยู่กับคุณลักษณะบางประการของข้อสอบ ในหัวข้อนี้เราจะพิจารณาตัวบ่งชี้ที่มีผลต่อความเชื่อมั่นของคะแนนแบบทดสอบ ก็คือ ดัชนีความเชื่อมั่นและดัชนีอำนาจจำแนก และดัชนีทางอ้อมที่เกี่ยวข้องกับความเชื่อมั่นก็คือ ดัชนีความยากง่าย ในที่นี้ ดัชนีความยากง่ายก็คือค่าเฉลี่ยหรือค่าคาดหวังของคะแนนที่สังเกตได้ของข้อสอบ ดัชนีอำนาจจำแนกสำหรับข้อสอบเป็นนิยามของสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนที่สังเกตได้ของข้อสอบและคะแนนรวม ดัชนีความเชื่อมั่นของข้อสอบเป็นผลคูณของส่วนเบี่ยงเบนมาตรฐานของคะแนนสังเกตของข้อสอบและดัชนีอำนาจจำแนกของข้อสอบ ซึ่งเราจะพิจารณาแต่ละดัชนีในรายละเอียดต่อไปนี้

ดัชนีความเชื่อมั่นและดัชนีอำนาจจำแนก
เริ่มต้นจากสูตรสัมประสิทธิ 
(1)
เมื่อ n คือจำนวนของข้อสอบในแบบทดสอบ ; คือความแปรปรวนของคะแนนข้อสอบที่ i และ คือความแปรปรวนของคะแนนรวมของแบบทดสอบ เราสามารถเขียนความแปรปรวนได้ว่า
=
=
= (2)
จำได้ว่านิยามของสัมประสิทธิ์สหสัมพันธ์คือ เราสามารถจัดการกับสมการ (2) ได้ดังนี้
=
= (3)
เมื่อหารทั้ง 2 ข้างด้วย จะเห็นว่า ส่วนเบี่ยงเบนมาตรฐานของคะแนนรวมบนแบบทดสอบได้เท่ากับผลรวมของส่วนเบี่ยงเบนมาตรฐานของข้อสอบและสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนของแบบทดสอบรายข้อกับคะแนนรวม
= (4)
ผลคูณของส่วนเบี่ยงเบนมาตรฐานและสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวมเรียกว่า ดัชนีความเชื่อมั่น
พิจารณา (1) และ (4) จะเห็นสัมประสิทธิ์แอลฟาเป็นดัชนีความเชื่อมั่นของข้อสอบสำหรับ สัมประสิทธิ์แอลฟาจะมีความเกี่ยวข้องมากกว่าผลรวมของความแปรปรวนข้อสอบในสมการ (1) นั่นคือผลรวมของกำลังสองของส่วนเบี่ยงเบนมาตรฐานของแบบทดสอบ ต้องสัมพันธ์กันน้อยและผลรวมของดัชนีความเชื่อมั่นของข้อสอบต้องสัมพันธ์กันมาก สำหรับค่าส่วนเบี่ยงเบนมาตรฐานของข้อสอบ เงื่อนไขจะต้องดีที่สุดเมื่อค่าสหสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวมมีค่ามาก ดังนั้นเป็นเครื่องบ่งชี้ว่าเป็นข้อสอบที่ดี
ในโครงสร้างของแบบทดสอบ สัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวมอ้างอิงว่าเป็นดัชนีอำนาจจำแนก ซึ่งมาจากข้อเท็จจริงที่ว่า คะแนนข้อสอบจะเกี่ยวข้องสัมพันธ์กันอย่างมาก สัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวมมีความแตกต่างหรือจำแนกระหว่างผู้สอบที่มีคุณลักษณะที่วัดมากหรือน้อยออกจากกันได้โดยใช้คะแนนรวม

ตาราง 2 สถิติพื้นฐานของข้อสอบ 36 ข้อ และผู้สอบ 498 คน

ข้อสอบ
ค่าเฉลี่ย
ส่วนเบี่ยงเบนมาตรฐาน
Item-Total Correlation
Index of Reliability
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
0.81
0.55
0.84
0.38
0.59
0.76
0.82
0.28
0.77
0.90
0.30
0.55
0.93
0.11
0.67
0.52
0.72
0.45
0.76
0.36
0.67
0.51
0.45
0.72
0.27
0.26
0.37
0.21
0.53
0.34
0.19
0.21
0.50
0.41
0.24
0.06
0.40
0.50
0.36
0.49
0.49
0.43
0.38
0.45
0.42
0.31
0.46
0.50
0.26
0.32
0.47
0.50
0.45
0.50
0.43
0.48
0.47
0.50
0.50
0.45
0.44
0.44
0.48
0.41
0.50
0.47
0.69
0.41
0.50
0.49
0.43
0.24
0.25
0.27
0.17
0.43
0.45
0.20
0.29
0.34
0.26
0.30
0.32
0.44
0.24
0.21
0.34
0.28
0.26
0.30
0.37
0.38
0.23
0.42
0.42
0.31
0.31
0.34
0.45
0.25
0.26
0.34
0.27
0.31
0.42
0.33
0.29
0.09
0.10
0.14
0.06
0.21
0.22
0.09
0.11
0.15
0.11
0.09
0.15
0.22
0.06
0.07
0.16
0.14
0.12
0.15
0.16
0.18
0.11
0.21
0.21
0.14
0.14
0.15
0.22
0.10
0.13
0.16
0.11
0.13
0.21
0.16
0.12
0.02
หมายเหตุ สัมประสิทธิ์ความเชื่อมั่นคือผลคูณระหว่างส่วนเบี่ยงเบนมาตรฐานกับความสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวม

จากข้อมูลในตาราง 2 จะแสดงการใช้ดัชนีความเชื่อมั่น เราพิจารณาผลของข้อสอบ 36 ข้อ ใช้กับผู้สอบ 498 คน สถิติพื้นฐานแสดงดังตาราง 1 สังเกตว่า ผลรวมกำลังสองของส่วนเบี่ยงเบนมาตรฐานของทั้ง 36 ข้อมีค่า 7.03 ผลรวมดัชนีความเชื่อมั่น 5.01 ซึ่งเท่ากับส่วนเบี่ยงเบนมาตรฐานของคะแนนรวม เมื่อเอาค่านี้ไปแทนที่ในสมการ (1) เราจะได้ค่าความเชื่อมั่น 0.74
สังเกตว่ามีอยู่ 16 ข้อที่มีค่าสหสัมพันธ์ระหว่างคะแนนรายข้อกับคะแนนรวมน้อยกว่า 0.30 สมมติว่าทั้ง 16 ข้อนี้มีค่า 0.30 ทั้งหมดในขณะที่ส่วนเบี่ยงเบนมาตรฐานมีค่าคงที่ ดัชนีความเชื่อมั่นจะเพิ่มขึ้น ซึ่งผลรวมของความเชื่อมั่นรายข้อมีค่า 5.36 (จากเดิม 5.01) มีผลทำให้ค่าความเชื่อมั่นทั้งฉบับเพิ่มสูงขึ้นเป็น 0.78 ซึ่งเพิ่มขึ้นจากเดิม 0.04 ถึงแม้ว่าจะไม่มากนักแต่ก็สามารถทำให้ความเชื่อมั่นเพิ่มขึ้นได้โดยไม่ต้องเพิ่มความยาวของแบบทดสอบ ยิ่งกว่านั้น ถ้าลองเพิ่มความยาวของแบบทดสอบเพื่อช่วยให้ความเชื่อมั่นเพิ่มขึ้น เราพบว่าจากสมการ (1) ถ้าเพิ่มความยาวของแบบทดสอบ 20% คือเพิ่มข้อสอบอีก 8 ข้อ แน่นอนว่า ความเชื่อมั่นก็จะเพิ่มสูงขึ้น
นอกจากนี้ยังควรที่จะพิจารณาองค์ประกอบอื่น ๆ ที่ช่วยให้ความเชื่อมั่นสูงขึ้นก็คือ

ความเที่ยงตรงของข้อสอบ
มันไม่ง่ายที่จะเลือกข้อสอบเพื่อจัดฉบับเป็นแบบทดสอบโดยใช้ดัชนีความเชื่อมั่น โดยไม่คำนึงถึงความเที่ยงตรงของข้อสอบ ในประการแรก ข้อสอบต้องเที่ยงตรง นั่นคือต้องทดสอบความเที่ยงตรงแบบต่าง ๆ ของข้อสอบเสียก่อน แต่เมื่อมีข้อสอบ 2 ข้อในแบบทดสอบที่มีความเที่ยงตรงและวัดความรู้และทักษะเดียวกันแล้ว ในการเลือกข้อสอบนั้นควรจะเลือกข้อสอบที่มีดัชนีความเชื่อมั่นที่สูงกว่า

ข้อสอบถูกรวมอยู่ในคะแนนรวมหรือไม่
ดัชนีอำนาจจำแนก เป็นค่าความสัมพันธ์ระหว่างคะแนนของข้อสอบกับคะแนนรวมของคุณลักษณะที่ต้องการวัด คำถามที่เกิดขึ้นก็คือ ความสัมพันธ์ระหว่างคะแนนของข้อสอบกับคะแนนรวมควรจะอยู่บนพื้นฐานของคะแนนรวมทุกข้อในองค์ประกอบที่วัดหรือคะแนนรวมทุกข้อที่ยกเว้นข้อที่นำมาคำนวณหาความสัมพันธ์ เมื่อข้อสอบที่นำมาหาความสัมพันธ์ข้อนั้นถูกรวมอยู่ในคะแนนรวม สัมประสิทธิ์สหสัมพันธ์ (หรือดัชนีอำนาจจำแนก) ของข้อสอบข้อนั้นจะลำเอียงสูง (มีค่าเพิ่มขึ้น) เพราะว่าคะแนนของข้อสอบจะสัมพันธ์กันอย่างสมบูรณ์กับคะแนนรวมในองค์ประกอบที่วัด ดังนั้นในแบบทดสอบที่มี n ข้อ สัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนของข้อสอบข้อนั้นกับคะแนนรวมที่คำนวณบนพื้นฐานของข้อสอบ n – 1 ข้อ หรือสหสัมพันธ์ระหว่างคะแนนของข้อสอบข้อนั้นกับคะแนนรวมที่หักข้อนั้นออก

ดัชนีความยากง่าย
ดัชนีความยากง่ายของข้อสอบ (pi) ซึ่งมีพิสัยอยู่ระหว่าง 0 ถึง 1 สำหรับข้อสอบที่ให้คะแนนแบบ 0-1 แม้ว่าดัชนีไม่สัมพันธ์โดยตรงกับความเที่ยงตรงของคะแนนแบบทดสอบ แต่สัมพันธ์โดยตรงกับคะแนนเฉลี่ยของคะแนนรวม การเลือกข้อสอบที่ง่าย n ข้อ เราคาดหวังว่าคะแนนเฉลี่ยของแบบทดสอบจะสูง มีค่าเข้าใกล้ n และ pi มีค่าเข้าใกล้ 1 การแจกแจงของคะแนนจะเป็นเบ้ลบ ในทางตรงข้าม ถ้าหากเป็นข้อสอบที่ยาก การแจกแจงของคะแนนจะเบ้บวก คะแนนเฉลี่ยจะใกล้ 0 และค่า pi เข้าใกล้ 0 ถ้าเลือกข้อสอบที่มีความยากง่ายปานกลาง คะแนนเฉลี่ยจะอยู่กึ่งกลาง ค่า pi จะเข้าใกล้ 0.5 กรณีข้อสอบ 0-1 ค่า pi เข้าใกล้ 0.5 จะมีความเป็นไปได้สูงสุดที่คะแนนจะมีความแปรปรวนรวม และความแปรปรวนของคะแนนสังเกตของข้อสอบ 0-1 ในข้อที่ i ก็คือ pi (1-pi) และมีค่าสูงสุดเท่ากับ 0.25 เมื่อ pi = 0.5
พิจารณาค่าความยากง่ายของข้อสอบ แบบทดสอบประกอบด้วยข้อสอบทั้งหมดที่มีความง่ายมากหรือยากมากอย่างใดอย่างหนึ่งมีแนวโน้มว่าค่าความเชื่อมั่นจะต่ำ ในกรณีนี้ ความแปรปรวนของคะแนนจริงจะต่ำ ความแปรปรวนของคะแนนสังเกตได้จะเกิดความคลาดเคลื่อนในการวัด เมื่อเราต้องการให้ค่าความเชื่อมั่นมีค่าสูงแล้ว แนะนำว่าข้อสอบในแบบทดสอบควรเลือกข้อที่มีค่าความยากง่ายปานกลาง แล้วความแปรปรวนของคะแนนจริงจะสูงย่อมส่งผลให้ความเชื่อมั่นของแบบทดสอบมีค่าสูงด้วย


ความคลาดเคลื่อนมาตรฐานของการวัด

ความเชื่อมั่นคือสัดส่วนของความแปรปรวนคะแนนจริงกับคะแนนที่สังเกตได้ อย่างไรก็ตาม ผู้ใช้แบบทดสอบมักแน่ใจว่าความคลาดเคลื่อนของการวัดย่อมมีผลต่อการแปลความหมายคะแนนสอบของผู้เขาสอบ แต่ว่ามันเป็นไปไม่ได้ที่จะทราบจำนวนของความคลาดเคลื่อนที่มีอยู่ในคะแนนที่สังเกตได้ ในทฤษฎีมาตรฐานเดิมกำหนดวิธีการสำหรับอธิบายความแปรปรวนที่คาดหวังของคะแนนที่สังเกตของแต่ละบุคคล ซึ่งจะเกี่ยวข้องกับคะแนนจริงของผู้สอบแต่ละบุคคล จำได้ว่าคะแนนจริงจะนิยามว่าเป็นค่าเฉลี่ยหรือค่าคาดหวังของคะแนนที่สังเกตได้ของผู้สอบจากการสอบซ้ำ ๆ กันหลาย ๆ ครั้งด้วยข้อสอบเดิม ตามทฤษฎีผู้สอบแต่ละคนก็จะมีการแจกแจงที่เป็นไปได้ของคะแนนที่สังเกตได้ซึ่งจะรวมคะแนนจริงเอาไว้ด้วยและก็จะมีส่วนเบี่ยงเบนมาตรฐานของคะแนน เมื่อนำส่วนเบี่ยงเบนมาตรฐานของแต่ละบุคคลมาเฉลี่ยทั้งกลุ่มแล้ว ผลที่ได้ก็คือความคลาดเคลื่อนมาตรฐานของการวัด (Standard error of measurement) ใช้สัญลักษณ์ว่า ซึ่งการแสดงสูตรการคำนวณความคลาดเคลื่อนมาตรฐานในการวัดสามารถได้มาโดยใช้ความสัมพันธ์ของ

หารทั้งสองข้างของสมการนี้ด้วย จะได้

สังเกตว่าเทอมแรกทางซ้ายมือสามารถแสดงได้ด้วยนิยามของความเชื่อมั่น ดังนั้น

แก้สมการเพื่อให้ได้ นั่นคือ

และ


ดังนั้น ถ้าส่วนเบี่ยงเบนมาตรฐานของชุดคะแนนที่สังเกตได้คือ 10 และสัมประสิทธิ์ความเชื่อมั่นหรือ = 0.91 ค่าความคลาดเคลื่อนมาตรฐานของการวัดควรจะคำนวณได้ค่า

สมมติว่าความคลาดเคลื่อนของการวัดเป็นไปอย่างสุ่มที่มีการแจกแจงเป็นโค้งปกติ เราควรจะคาดหวังว่าประมาณ 68% ของคะแนนที่สังเกตได้ของผู้สอบนั้นตกอยู่ในช่วง T ± 1 และประมาณ 95% ของคะแนนที่สังเกตได้ของผู้สอบตกอยู่ในช่วง T ± 1.96 และประมาณ 99% ของคะแนนที่สังเกตได้ของผู้สอบตกอยู่ในช่วง T ± 2.58
ในสถานการณ์การทดสอบโดยมาก คือผู้สอบจะได้รับการทดสอบเพียงครั้งเดียวและมีคะแนนที่สังเกตได้เพียงค่าเดียว ดังนั้นถ้าเรามีการประมาณค่าความคลาดเคลื่อนมาตรฐานของการวัดสำหรับแบบทดสอบเอาไว้ เราไม่สามารถกำหนดช่วงของคะแนนจริงของผู้สอบได้เพราะว่าในทางปฏิบัตินั้นเราไม่รู้คะแนนจริง ดังนั้น เราจึงใช้การประมาณค่าของความคลาดเคลื่อนมาตรฐานสร้างช่วงความเชื่อมั่นที่อยู่รอบคะแนนที่สังเกตได้จาก X ± 1 เราสามารถเชื่อมั่นได้ 68% ว่าคะแนนจริงจะตกอยู่ภายในช่วงนี้ ถ้าเป็นไปได้เราอาจจะใช้คะแนนจริงแทนที่คะแนนที่สังเกตได้ แต่ก็เป็นไปไม่ได้ สมมติว่าสุชาติมีคะแนนจริงของมาตรวัดเจตคติเท่ากับ 50 และความคลาดเคลื่อนมาตรฐานของการวัดเท่ากับ 5 ตามทฤษฎีถ้าสุชาติทำข้อสอบ 100 ครั้งแล้ว จะมีประมาณ 68 ครั้งที่คะแนนที่สังเกตได้จะตกอยู่ระหว่าง 45 ถึง 55 ซึ่งคะแนน 32 จะตกอยู่นอกขอบเขต 45 ถึง 55 นี้
นั้นคือช่วงความเชื่อมั่นที่สร้างจากคะแนนสังเกตได้ของสุชาติ 100 ค่า จะมีประมาณ 68 ค่าที่ตกอยู่ในช่วงระหว่าง 45 ถึง 55 และช่วงนี้จะรวมคะแนนจริงของสุชาติเอาไว้ด้วย ในการทดสอบของสุชาติเพียงครั้งเดียว (ในความเป็นจริงย่อมสอบเพียงครั้งเดียว) โดยดึงมาอย่างสุ่มจากคะแนนที่สังเกตได้ 100 ค่า จะมีโอกาส 68% ที่คะแนนจะตกอยู่ในช่วง 45 ถึง 55 ถ้าเราไม่โชคร้ายดึงได้คะแนน 32 ที่ตกอยู่นอกช่วง 45 ถึง 55 ซึ่งช่วง 5 คะแนนที่อยู่รอบคะแนนจริงนี้ไม่ใช่คะแนนจริง สำหรับเหตุผลนี้มันมีความสำคัญที่จะต้องจำว่าคะแนนจริงที่สังเกตได้เพียงค่าเดียวอาจจะไม่สามารถประมาณค่าของคะแนนจริงได้ใกล้เคียง ค่าความคลาดเคลื่อนมาตรฐานของการวัดมีประโยชน์สำหรับการจัดเตรียมการประมาณค่าคะแนนจริงที่อาจจะตกอยู่ห่างจากคะแนนเฉลี่ยที่สังเกตได้ของกลุ่มประชากร แต่มันก็ไม่สามารถประกันได้ว่าคะแนนจริงของและบุคตคลจะตกอยู่ในช่วงความเชื่อมั่นที่ได้ นอกจากนี้ควรจะสังเกตว่าค่าของ สะท้อนให้เห็นถึงค่าเฉลี่ยของความคลาดเคลื่อนมาตรฐานของผู้เข้าสอบ

ความคลาดเคลื่อนมาตรฐานของการประมาณค่า

เป็นความคลาดเคลื่อนมาตรฐานสำหรับทำนายคะแนนของผู้สอบบนแบบทดสอบ 2 ฉบับที่คู่ขนานกันในกรณีที่รู้คะแนนของแบบทดสอบฉบับหนึ่ง มีสูตรในการคำนวณคือ

เช่น มาตรวัดเจตคติที่คู่ขนานกัน 2 ฉบับ มาตรวัดเจตคติฉบับที่ 2 มีคะแนนเบี่ยงเบนมาตรฐาน 10 และสัมประสิทธิ์สหสัมพันธ์ระหว่างแบบทดสอบคู่ขนานทั้งสองฉบับคือ 0.75 ความคลาดเคลื่อนในการประมาณค่าจะเท่ากับ = 6.6 ดังนั้นสุชาติที่ทำคะแนนบนมาตรวัดเจตคติฉบับที่ 1 ได้ 50 คะแนน สามารถทำนายคะแนนของสุชาติบนมาตรวัดเจตคติฉบับที่ 2 อยู่ระหว่าง 50 ± หรือประมาณ 43.4 ถึง 56.6 คะแนน ที่ระดับความเชื่อมั่น 68%







บรรณานุกรม

ภาควิชาการวัดผลและวิจัยการศึกษา. การสร้างเครื่องมือวัดผลที่ใช้ในการวิจัย. กรุงเทพฯ :
คณะศึกษาศาสตร์ มหาวิทยาลัยศรีนครินทรวิโรฒ, 2538.
ฉัตรศิริ ปิยะพิมลสิทธิ์. “การวิเคราะห์องค์ประกอบ,” ใน วารสารการวัดผลการศึกษา.
สำนักทดสอบทางการศึกษาและจิตวิทยา มหาวิทยาลัยศรีนครินทรวิโรฒ. 20 (58) :
พฤษภาคม-สิงหาคม, 2541.
ทวีศักดิ์ ญาณประทีป และคณะ. พจนานุกรม ฉบับเฉลิมพระเกียรติ พ.ศ.2530. กรุงเทพฯ :
วัฒนาพานิช, 2534.
ล้วน และอังคณา สายยศ. เทคนิคการวัดผลการเรียนรู้. กรุงเทพฯ : สุวีริยาสาส์น, 2539.
สุรศักดิ์ อมรรัตนศักดิ์. ทฤษฎีทางการทดสอบ. กรุงเทพฯ : โรงพิมพ์มหาวิทยาลัยรามคำแหง,
2536.
Allen, Marry J. and Yen, Wendy M. Introduction to Measurement Theory. U.S.A. :
Brooks/Cole Publishing Company, 1979.
Anastasi, Anne. Psychological Testing. U.S.A. : Macmillan Publishing Company, 1982.
Gulliksen, Harold. Theory of MENTAL TESTS. U.S.A. : John Willy & Sons, Inc., 1950.
Hair, Joseph F., JR. and Other. Multivariate Data Analysis with Readings. U.S.A. :
Prentice-Hall, Inc., 1995.
Lyman, Howard B. Test Scores and What They Mean. U.S.A. : Prentice-Hall, INC.,
1963.
Messick, Samuel. “Validity,” in Educational Measurement. Linn, Robert L. (Ed.).
Third Edition. U.S.A. : Macmillan Publishing Company, 1989.
Popham, W. James. Modern Educational Measurement : A Practitioner’s
Perspective. U.S.A. : Prentice-Hall, INC., 1990.
Traub, Ross E. Reliability for the Social Sciences : Theory and Applications.
Thousand Oaks : SAGE Publications, 1994.
Trochim, William M.K. Research Methods Knowledge Base.
http://trochim.human.cornell.edu/kb/. 1999.
Wainer, Howard and Braun, Henry I. Test Validity. U.S.A. Lawrence Erlbaum
Associates, Inc., 1988.