หน้าเว็บ

วันพุธที่ 29 ตุลาคม พ.ศ. 2557

นัยสำคัญ ทางสถิติ


ในการแจงความน่าจะเป็นของเหตุการณ์ที่จะเกิดขึ้นแบบสุ่ม อย่างในกรณีการแจงความน่าจะเป็นของข้อสอบ Multiple choice จะมีการเรียนการสอนอยู่ในประมาณชั้น ม. ต้น วันนี้เราจะมาทบทวนการใช้หลักการแจงความน่าจะเป็น เพื่อนำมาเทียบกับเหตุการณ์ต่างๆ รอบตัวเราในชีวิตประจำวันกัน

ในกรณีคำถาม 4 ตัวเลือก โอกาสตอบถูก จะมีอยู่ 0.25 และ ตอบผิด คือ 0.75 อันนี้ เรารู้กันอยู่ว่า การมั่วคำตอบสัก 4 ข้อ ค่าเฉลี่ยของคะแนน มันก็ควรอยู่ที่ 1 คะแนน

แต่ถามว่าโอกาสที่มันจะได้คะแนนต่างจากนั้นมันมีอยู่ไหม มันก็มีอยู่ มันมีความน่าจะเป็นที่จะมั่วถูกได้ 4 ข้อ โดยความน่าจะเป็นนั้นจะอยู่ที่ 0.254  หรือ 0.004 (0.4%) ส่วนความน่าจะเป็นที่ลดหลั่นไปเราใช้สูตรการแจงความน่าจะเป็นแบบ ทวินาม อันนี้ ผมก็ไม่ค่อยแม่นเรื่องการอธิบายสักเท่าไรแฮะ เพราะเรียนมานานมากแล้ว แต่ดังนั้น ผมยกตัวอย่างการใช้สูตรให้ดูเลยดีกว่า

ตัวอย่างการใช้สูตรแจงความน่าจะเป็นแบบทวินาม (Binomial Distribution) 
P =  [nCx].Rx.Wn-x
เมื่อ
  •  P = โอกาสความน่าจะเป็นที่จะได้คะแนน x คะแนน
  • nC= สัมประสิทธิ์การแจงทวินามของการตอบได้ถูก x ข้อ จากจำนวนคำตอบ n คำตอบ
  • nCx จะเท่ากับ = n!/x!(n-x)!
  • R = ความน่าจะเป็นที่จะตอบถูก
  • W = ความน่าจะเป็นที่จะตอบผิด = 1-R
  • n = จำนวนข้อสอบทั้งหมด
  • x = จำนวนคำตอบที่ตอบได้ถูก

 ความน่าจะเป็นของการตอบข้อสอบ 4 ข้อ ได้ผิดหมด ถึงได้คะแนนเต็มจะเป็นดังตารางต่อไปนี้



จากตาราง ข้างบน เราบอกได้ว่า ในการกาข้อสอบมั่ว 4 ตัวเลือก 4 ข้อ เรามีความเป็นไปได้ที่จะได้ 0 คะแนน 31.6% โอกาสได้ 1 คะแนน 42.2% โอกาสได้ 2 คะแนน คือ 21.1% โอกาสได้ 3 คะแนนคือ 4.7% และมีโอกาสได้คะแนนเต็ม 0.4%

ในเชิงสถิติ โอกาสน้อยแค่ไหนมันก็เกิดขึ้นได้ แต่เราจะบ่งชี้ว่าอะไร เป็นแค่การมั่ว หรือ รู้จริง ใช้งานได้จริง เราดูที่ระดับ นัยสำคัญ นัยสำคัญทางสถิติที่มักใช้เป็นมาตรฐานคือ 95% อย่างโจทย์คำตอบ 4 ตัวเลือก 4 ข้อ ถ้าคะแนนเราทำได้ 3 ใน 4 ข้ออันนี้ เราทำได้เหนือกว่าช่วงความน่าจะเป็นของการได้ 0 – 2 คะแนนซึ่งเป็นความมั่นใจ 94.9% ว่าที่ตอบได้นี่ไม่มั่ว ความมั่นใจตรงนี้ต่ำกว่า 95% แปลว่ายังไม่เป็นนัยสำคัญ แต่ถ้าตอบได้ 4 ข้อ อันนี้ เราทำได้เหนือกว่าความความน่าจะเป็นรวมของการตอบได้ 0-3 ข้อคือ 99.6% ความมั่นใจว่าเราไม่มั่ว ตรงนี้ สูงกว่า 95% ก็คือมันเป็นนัยสำคัญ 

หลักการวิเคราะห์ของบทความนี้ก็จะประมาณตามข้างต้น ทีนี้ เรามาดูกันว่าความรู้นี้เราสามารถนำมาใช้ประโยชน์อะไรได้บ้าง

ความน่าจะเป็น ที่ GT200 จะมั่วชี้เป้าได้
สำหรับโจทย์ GT200 ตอนที่ อ. เจษฏา เข้าไปทำการทดสอบ มันคือโจทย์คำถามปรนัย 4 ตัวเลือก เมื่อเราคำนวณความน่าจะเป็นของการสุ่มที่จะตอบได้แต่ละจำนวนคะแนน แล้วจัดทำกราฟ เราจะพบว่า อัตราความมั่นใจ 95% อยู่ที่การตอบได้ถูก 8 ข้อขึ้นไป และจึงจะสรุปได้ว่า GT200 ใช้การได้



ความน่าจะเป็น ที่ ดร. นาซ่า คนเก่ง จะทำนายแผ่นดินไหวได้จริง

ดร. นาซ่าท่านหนึ่งได้กล่าวว่า เมื่อพายุสุริยะมา จะเกิดแผ่นดินไหว แล้วก็อ้างการเกิดแผ่นดินไหวขนาด 6 ริกเตอร์ ในโลกภายในช่วง 5 วันนับตั้งแต่การเกิดพายุสุริยะว่า เป็นผลมาจากพายุสุริยะ 


ในเชิงสถิติ บันทึกโอกาสการเกิดแผ่นดินไหวเกิน 6 ริกเตอร์ ในที่ใดๆในโลก อ้างจากเวบ USGS จะสูงถึง 41% ในแต่ละวัน นั่นคือ สมมุติว่าทำนายการเกิดแผ่นดินไหววันไหน แล้วเกิดได้จริงตามนั้นในวันนั้น ก็ต้องทำนายได้ถูกเกิน 6 จาก 10 ครั้ง ขึ้นไปจึงจะเชื่อได้ว่าไม่มั่ว ส่วนถ้าจะทำนายแบบเหมาโหล พายุสิริยะมาแล้วแผ่นดินไหวเกิน 6 ริกเตอร์ภายใน 5 วัน จะต้องเกิดจากพายุสุริยะแน่ๆ การทำนายลักษณะนี้ ต้องทายถูก 97 ใน 100 ครั้งจึงจะเชื่อได้ว่าไม่มั่ว



ความน่าจะเป็นของการทายไพ่ทายนิ้ว

โจทย์ตรงนี้ ปรับมาจากกรณี PMC ปิดตาลอดช่อง ถ้าเราพูดถึงการทายไพ่ ไพ่ 1 สำรับไม่นับโจ๊ก โอกาสทายถูกแต่ละใบมีเพียง 1 ใน 52 ดังนั้น ทายได้ 1 ใน 10 ครั้ง ก็ถือว่า ทายได้ถูกเป็นอัศจรรย์อย่างมีนัยสำคัญ (แต่แน่นอน มันมองลอดช่องมันก็ถูกได้มากกว่ามั่ว)



แต่ถ้าเป็นกรณีการให้ทายนิ้วที่ซ่อนอยู่ข้างหลัง มือคนเราแสดงตัวเลขได้คือ 0 – 5 ความน่าจะเป็นที่จะมั่วถูกคือ 1 ใน 6 การทายได้ถูก 3 ใน 10 ครั้งขึ้นไป จึงจะถือว่า ทายได้ถูกเป็นอัศจรรย์



จากเรื่องลวงโลก เรามาดูเรื่องหวยกันมั่ง กับการล็อกหวย

หวย จะล็อกไม่ล็อกเรามักอ้างกันว่า โหย เลขมีตั้ง 1 -100 การออกเลขซ้ำเลขเบิ้ล มันเป็นไปไม่ดั้ย มันต้องล็อก เรื่องเพี้ยนๆตรงนี้ แม้แต่ อ. ทางคณิตศาสตร์ ของ ม. ทำมั้ยสาด บางท่าน ยังคำนวณผิดเบย เชื่อหรือไม่ว่า หวย 100 งวด ความน่าจะเป็นที่เลขใดๆจะไม่ออกนั้นมีสูงถึง 36.6% และมีโอกาสออกเลขเบิ้ลถึง 18.5%  



ความสอดคล้องตรงนี้ เราสามารถเอาการกระจายตัวของความน่าจะเป็นที่เกิดขึ้นจริง ตามข้อมูลของสำนักงานสลากกินแบ่งรัฐบาล กับตามทฤษฏีมาพล็อตหาเป็น Correlation แล้วทดสอบหาค่าความสัมพันธ์หรือ R2 ซึ่งเราก็พอจะบอกได้ว่าข้อมูลจริงกับทฤษฏี มีความสอดคล้องกันถึง 98.5%  ... มันก็อาจบอกว่า การกระจายตัวของหวย มันเป็นไปตามทฤษฏีอย่างเป็นนัยสำคัญ และมันก็คงไม่ได้ล็อค แค่ เรามันซวย โดยหวยรับประทานชะเอิงเงย


1 ความคิดเห็น:

  1. Casino Roll - Welcome Bonus & Play Hundreds of Slots for
    Casino Roll. The world of online slots is constantly growing with more people to 스트라이크존 play and 바인드 토토 more to 코인 일정 사이트 try 먹튀신고 their luck at. bet365 우회 Find out more here.

    ตอบลบ