การวิเคราะห์ความแปรปรวนของข้อมูลการทดลอง การวิเคราะห์ความแปรปรวนหลายตัวแปร การออกแบบมาตรการซ้ำ
7.1 การวิเคราะห์ความแปรปรวน. 2
ในวิธีการเวอร์ชันนี้ ตัวอย่างที่แตกต่างกันของวัตถุจะได้รับอิทธิพลของการไล่สีแต่ละระดับ อย่างน้อยจะต้องมีการไล่ระดับของแฟคเตอร์ สาม.
ตัวอย่างที่ 1กลุ่มวิชาที่แตกต่างกันสามกลุ่มจากหกวิชาได้รับรายการคำศัพท์สิบคำ กลุ่มแรกนำเสนอคำด้วยความเร็วต่ำ - 1 คำต่อ 5 วินาที กลุ่มที่สองด้วยความเร็วเฉลี่ย - 1 คำต่อ 2 วินาที และกลุ่มที่สามด้วยความเร็วสูง - 1 คำต่อวินาที คาดว่าประสิทธิภาพในการสืบพันธุ์จะขึ้นอยู่กับความเร็วของการนำเสนอคำ ผลลัพธ์แสดงไว้ในตาราง 1.
ตารางที่ 1. จำนวนคำที่ทำซ้ำ (โดยเจ. Greene, MD "Olivera, 1989, หน้า 99)
เรื่องเลขที่ |
กลุ่มที่ 1 ความเร็วต่ำ |
กลุ่มที่ 2 ความเร็วปานกลาง |
กลุ่มที่ 3 ความเร็วสูง |
จำนวนเงิน |
|||
เฉลี่ย |
7,17 |
6,17 |
4,00 |
จำนวนเงินทั้งหมด |
การวิเคราะห์ความแปรปรวนแบบตัวแปรเดียวทำให้คุณสามารถทดสอบสมมติฐานได้:
เอช 0 : ความแตกต่างในปริมาณการผลิตคำ ระหว่างกลุ่มไม่เด่นชัดมากไปกว่าความแตกต่างแบบสุ่ม ข้างในแต่ละกลุ่ม
เอช 1 : ความแตกต่างในปริมาณการผลิตคำ ระหว่างกลุ่มมีความเด่นชัดมากกว่าความแตกต่างแบบสุ่ม ข้างในแต่ละกลุ่ม
ลำดับการดำเนินการในการวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้อง:
1. มานับกัน ข้อเท็จจริงของเอสเอส- ความแปรปรวนของลักษณะเนื่องจากการกระทำของปัจจัยที่กำลังศึกษา การกำหนดทั่วไปเอสเอส - อักษรย่อของ "ผลรวมของกำลังสอง" (ผลรวมของกำลังสอง ). คำย่อนี้มักใช้ในแหล่งแปล (ดูตัวอย่าง: Glass J., Stanley J., 1976)
,(1)
โดยที่ T c คือผลรวมของค่าแต่ละค่าสำหรับแต่ละเงื่อนไข สำหรับตัวอย่างของเรา 43, 37, 24 (ดูตารางที่ 1);
с – จำนวนเงื่อนไข (การไล่ระดับ) ของปัจจัย (=3);
n – จำนวนวิชาในแต่ละกลุ่ม (=6)
เอ็น – จำนวนรวมของแต่ละค่า (=18)
กำลังสองของผลรวมของแต่ละค่า (=104 2 =10816)
สังเกตความแตกต่างระหว่าง โดยที่ค่าแต่ละค่าทั้งหมดจะถูกยกกำลังสองก่อนแล้วจึงรวมเข้าด้วยกัน และ โดยที่ค่าแต่ละค่าจะถูกรวมเข้าด้วยกันก่อนเพื่อให้ได้ผลรวมทั้งหมด จากนั้นผลรวมนี้จะถูกยกกำลังสอง
เมื่อใช้สูตร (1) เมื่อคำนวณความแปรปรวนที่แท้จริงของลักษณะแล้วเราได้รับ:
2. มานับกัน เอสเอสทั่วไป– ความแปรปรวนทั่วไปของลักษณะ:
(2)
3. คำนวณค่าสุ่ม (คงเหลือ)เอสเอส สลเกิดจากปัจจัยที่ไม่สามารถระบุได้:
(3)
4.จำนวนองศาอิสระเท่ากับ:
=3-1=2(4)
5."จัตุรัสกลาง"หรือค่าเฉลี่ยของผลรวมของกำลังสอง SS ที่สอดคล้องกันเท่ากับ:
(5)
6.ความหมาย สถิติเกณฑ์ เอฟเอ็มคำนวณโดยใช้สูตร:
(6)
สำหรับตัวอย่างของเราเรามี : F em =15.72/2.11=7.45
7.กำหนด เอฟคริติคอลตามตารางสถิติ การใช้งาน 3สำหรับ df 1 =k 1 =2 และ df 2 =k 2 =15 ค่าตารางของสถิติคือ 3.68
8. ถ้า เอฟเอ็ม< F วิกฤต ดังนั้นสมมุติฐานว่างจะได้รับการยอมรับ มิฉะนั้นจะยอมรับสมมติฐานทางเลือก สำหรับตัวอย่างของเรา เอฟเอ็ม> F crit (7.45>3.68) ดังนั้นหน้า
บทสรุป:ความแตกต่างในการจำคำระหว่างกลุ่มจะเด่นชัดมากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม (หน้า<0,05). Т.о. скорость предъявления слов влияет на объем их воспроизведения.
7.1.2 การวิเคราะห์ความแปรปรวนสำหรับตัวอย่างที่เกี่ยวข้อง
วิธีการวิเคราะห์ความแปรปรวนสำหรับตัวอย่างที่เกี่ยวข้องจะใช้ในกรณีที่อิทธิพลของการไล่ระดับที่แตกต่างกันของปัจจัยหรือเงื่อนไขที่แตกต่างกัน ตัวอย่างวิชาเดียวกันอย่างน้อยจะต้องมีการไล่ระดับของแฟคเตอร์ สาม.
ในกรณีนี้ ความแตกต่างระหว่างวิชาต่างๆ อาจเป็นแหล่งที่มาของความแตกต่างโดยอิสระ การวิเคราะห์ความแปรปรวนแบบทางเดียวสำหรับตัวอย่างที่เกี่ยวข้องจะช่วยให้เราสามารถระบุได้ว่าอะไรมีค่ามากกว่า - แนวโน้มที่แสดงโดยกราฟการเปลี่ยนแปลงปัจจัย หรือความแตกต่างระหว่างบุคคลระหว่างวิชาต่างๆ ปัจจัยของความแตกต่างส่วนบุคคลอาจมีนัยสำคัญมากกว่าปัจจัยของการเปลี่ยนแปลงเงื่อนไขการทดลอง
ตัวอย่างที่ 2มีการตรวจสอบกลุ่ม 5 วิชาโดยใช้งานทดลองสามงานที่มีจุดมุ่งหมายเพื่อศึกษาความเพียรทางปัญญา (Sidorenko E.V., 1984) แต่ละเรื่องจะถูกนำเสนอเป็นรายบุคคลด้วยแอนนาแกรมที่เหมือนกันสามตัวติดต่อกัน: ตัวอักษรสี่ตัว, ตัวอักษรห้าตัว และตัวอักษรหกตัว เป็นไปได้ไหมที่จะสรุปว่าตัวประกอบความยาวของแอนนาแกรมมีอิทธิพลต่อระยะเวลาของการพยายามแก้ไขมัน
ตารางที่ 2. ระยะเวลาของการแก้แอนนาแกรม (วินาที)
รหัสหัวเรื่อง |
เงื่อนไขที่ 1. แอนนาแกรมสี่ตัวอักษร |
เงื่อนไขที่ 2 แอนนาแกรมห้าตัวอักษร |
เงื่อนไขที่ 3 แอนนาแกรมหกตัวอักษร |
จำนวนตามวิชา |
จำนวนเงิน |
1244 |
1342 |
มากำหนดสมมติฐานกัน ในกรณีนี้ มีสมมติฐานสองชุด
ชุดเอ.
H 0 (A): ความแตกต่างในช่วงเวลาของการพยายามแก้แอนนาแกรมที่มีความยาวต่างกันนั้นไม่เด่นชัดมากไปกว่าความแตกต่างเนื่องจากเหตุผลแบบสุ่ม
H 1 (A): ความแตกต่างในช่วงเวลาของการพยายามแก้แอนนาแกรมที่มีความยาวต่างกันนั้นเด่นชัดมากกว่าความแตกต่างเนื่องจากเหตุผลแบบสุ่ม
ชุดบี
N เกี่ยวกับ (B): ความแตกต่างระหว่างบุคคลระหว่างอาสาสมัครไม่เด่นชัดมากไปกว่าความแตกต่างอันเนื่องมาจากสาเหตุที่สุ่ม
H 1 (B): ความแตกต่างระหว่างบุคคลระหว่างวิชาจะเด่นชัดมากกว่าความแตกต่างเนื่องจากเหตุผลแบบสุ่ม
ลำดับการดำเนินการในการวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่เกี่ยวข้อง:
1. มานับกัน ข้อเท็จจริงของเอสเอส- ความแปรปรวนของลักษณะเนื่องจากการกระทำของปัจจัยที่ศึกษาตามสูตร (1)
โดยที่ T c คือผลรวมของค่าแต่ละค่าสำหรับแต่ละเงื่อนไข (คอลัมน์) สำหรับตัวอย่างของเรา 51, 1244, 47 (ดูตารางที่ 2); с – จำนวนเงื่อนไข (การไล่ระดับ) ของปัจจัย (=3); n – จำนวนวิชาในแต่ละกลุ่ม (=5)เอ็น – จำนวนรวมของแต่ละค่า (=15) - กำลังสองของผลรวมของแต่ละค่า (=1342 2)
2. มานับกัน เอสเอสไอเอสพี- ความแปรปรวนของเครื่องหมายเนื่องจากค่านิยมส่วนบุคคลของวิชา
โดยที่ T และคือผลรวมของค่าแต่ละค่าสำหรับแต่ละวิชา สำหรับตัวอย่างของเรา 247, 631, 100, 181, 183 (ดูตารางที่ 2) с – จำนวนเงื่อนไข (การไล่ระดับ) ของปัจจัย (=3);เอ็น – จำนวนรวมของแต่ละค่า (=15)
3. มานับกัน เอสเอสทั่วไป– ความแปรปรวนทั่วไปของลักษณะตามสูตร (2):
4. คำนวณค่าสุ่ม (คงเหลือ)เอสเอส สลเกิดจากปัจจัยที่ไม่สามารถนับได้ตามสูตร (3):
5. จำนวนองศาอิสระเท่ากับ (4):
; ; ;
6. "จัตุรัสกลาง"หรือ ความคาดหวังทางคณิตศาสตร์ของผลรวมของกำลังสองค่าเฉลี่ยของผลรวมของกำลังสอง SS ที่สอดคล้องกันเท่ากับ (5):
;
7. ค่าสถิติเกณฑ์ เอฟเอ็มคำนวณโดยใช้สูตร (6):
;
8. เรามาพิจารณา F crit จากตารางสถิติของภาคผนวก 3 สำหรับ df 1 =k 1 =2 และ df 2 =k 2 =8 ค่าตารางของสถิติ F crit_fact =4.46 และสำหรับ df 3 =k 3 =4 และ df 2 =k 2 = 8 F crit_exp =3.84
9. ฉ em_fact> F Critical_fact (6.872>4.46) ดังนั้นหน้า ยอมรับสมมติฐานทางเลือกแล้ว
10. F em_use < F крит_исп (1,054<3,84), следовательно пสมมติฐานว่างเป็นที่ยอมรับ
บทสรุป:ความแตกต่างในปริมาณของการสร้างคำในเงื่อนไขที่แตกต่างกันนั้นเด่นชัดมากกว่าความแตกต่างเนื่องจากเหตุผลแบบสุ่ม (น<0,05).Индивидуальные различия между испытуемыми являются не более выраженными, чем различия, обусловленные случайными причинами.
7.2 การวิเคราะห์สหสัมพันธ์
7.2.1 แนวคิดเรื่องความสัมพันธ์
นักวิจัยมักสนใจว่าตัวแปรสองตัวขึ้นไปมีความสัมพันธ์กันอย่างไรในตัวอย่างหนึ่งหรือหลายตัวอย่างที่กำลังศึกษาอยู่ ตัวอย่างเช่น นักเรียนที่มีความวิตกกังวลในระดับสูงสามารถแสดงให้เห็นถึงผลสัมฤทธิ์ทางการเรียนที่มั่นคง หรือระยะเวลาที่ครูทำงานในโรงเรียนที่เกี่ยวข้องกับขนาดของเงินเดือน หรือสิ่งที่เกี่ยวข้องกับระดับการพัฒนาจิตใจของนักเรียนมากกว่า - ของพวกเขา การแสดงทางคณิตศาสตร์หรือวรรณคดี ฯลฯ .?
การพึ่งพาระหว่างตัวแปรประเภทนี้เรียกว่าสหสัมพันธ์หรือสหสัมพันธ์ ความสัมพันธ์ การเชื่อมต่อ- นี่คือการเปลี่ยนแปลงที่มีการประสานงานในสองลักษณะ ซึ่งสะท้อนถึงความจริงที่ว่าความแปรปรวนของลักษณะหนึ่งนั้นสอดคล้องกับความแปรปรวนของอีกลักษณะหนึ่ง
ตัวอย่างเช่น เป็นที่ทราบกันดีว่าโดยเฉลี่ยแล้วมีความสัมพันธ์เชิงบวกระหว่างส่วนสูงของคนกับน้ำหนักของพวกเขา และยิ่งส่วนสูงเท่าไร น้ำหนักของบุคคลก็จะยิ่งมากขึ้นเท่านั้น อย่างไรก็ตาม มีข้อยกเว้นสำหรับกฎนี้ เมื่อคนค่อนข้างเตี้ยมีน้ำหนักเกิน และในทางกลับกัน คนที่มีรูปร่างผอมบางที่มีรูปร่างสูงจะมีน้ำหนักน้อย สาเหตุของข้อยกเว้นดังกล่าวก็คือ สัญญาณทางชีววิทยา สรีรวิทยา หรือจิตวิทยาแต่ละรายการนั้นถูกกำหนดโดยอิทธิพลของปัจจัยหลายประการ เช่น สิ่งแวดล้อม พันธุกรรม สังคม สิ่งแวดล้อม ฯลฯ
การเชื่อมต่อสหสัมพันธ์คือการเปลี่ยนแปลงความน่าจะเป็นที่สามารถศึกษาได้เฉพาะกับตัวอย่างที่เป็นตัวแทนโดยใช้วิธีสถิติทางคณิตศาสตร์เท่านั้น “ ทั้งสองเงื่อนไข” E.V. เขียน ซิโดเรนโก - การเชื่อมต่อสหสัมพันธ์และการพึ่งพาสหสัมพันธ์- มักใช้เป็นคำพ้องความหมาย การพึ่งพาหมายถึงอิทธิพล การเชื่อมต่อ - การเปลี่ยนแปลงที่มีการประสานงานใด ๆ ที่สามารถอธิบายได้ด้วยเหตุผลหลายร้อยประการ การเชื่อมโยงความสัมพันธ์ไม่สามารถถือเป็นหลักฐานของความสัมพันธ์ระหว่างเหตุและผลได้ เพียงแต่บ่งชี้ว่าการเปลี่ยนแปลงในลักษณะหนึ่งมักจะมาพร้อมกับการเปลี่ยนแปลงบางอย่างในอีกลักษณะหนึ่งด้วย
การพึ่งพาสหสัมพันธ์ - สิ่งเหล่านี้คือการเปลี่ยนแปลงที่แนะนำค่าของคุณลักษณะหนึ่งไปสู่ความน่าจะเป็นของการปรากฏตัวของค่าที่แตกต่างกันของคุณลักษณะอื่น (E.V. Sidorenko, 2000)
งานวิเคราะห์ความสัมพันธ์มุ่งเน้นไปที่การกำหนดทิศทาง (บวกหรือลบ) และรูปแบบ (เชิงเส้นและไม่เชิงเส้น) ของความสัมพันธ์ระหว่างคุณลักษณะที่แตกต่างกัน การวัดความใกล้ชิด และสุดท้ายคือการตรวจสอบระดับนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้รับ
ความสัมพันธ์แตกต่างกันไป ในรูปแบบ ทิศทาง และระดับ (กำลัง)
ตามรูปร่างความสัมพันธ์สหสัมพันธ์อาจเป็นแบบเส้นตรงหรือแบบโค้งก็ได้ ตัวอย่างเช่น ความสัมพันธ์ระหว่างจำนวนเซสชันการฝึกอบรมบนเครื่องจำลองและจำนวนปัญหาที่แก้ไขอย่างถูกต้องในเซสชันการควบคุมอาจเป็นเรื่องตรงไปตรงมา ตัวอย่างเช่น ความสัมพันธ์ระหว่างระดับแรงจูงใจและประสิทธิผลของงานอาจเป็นเส้นโค้ง (ดูรูปที่ 1) เมื่อแรงจูงใจเพิ่มขึ้น ประสิทธิผลของการทำงานให้เสร็จสิ้นก่อนจะเพิ่มขึ้น จากนั้นจึงได้แรงจูงใจในระดับที่เหมาะสมที่สุด ซึ่งสอดคล้องกับประสิทธิผลสูงสุดของการทำงานให้สำเร็จ แรงจูงใจที่เพิ่มขึ้นอีกจะมาพร้อมกับประสิทธิภาพที่ลดลง
รูปที่ 1. ความสัมพันธ์ระหว่างประสิทธิผลของการแก้ปัญหา
และความเข้มแข็งของแนวโน้มการสร้างแรงบันดาลใจ (ตาม J. W. A t k ในลูกชาย, 1974, หน้า 200)
ต่อความสัมพันธ์อาจเป็นค่าบวก (“โดยตรง”) และค่าลบ (“ผกผัน”) ด้วยความสัมพันธ์เชิงเส้นเชิงบวก ค่าที่สูงกว่าของคุณลักษณะหนึ่งจะสอดคล้องกับค่าที่สูงกว่าของอีกคุณลักษณะหนึ่ง และค่าที่ต่ำกว่าของคุณลักษณะหนึ่งจะสอดคล้องกับค่าที่ต่ำของคุณลักษณะอื่น ด้วยความสัมพันธ์เชิงลบ ความสัมพันธ์จะกลับกัน ด้วยความสัมพันธ์เชิงบวก ค่าสัมประสิทธิ์สหสัมพันธ์จะมีเครื่องหมายบวก เป็นต้นร =+0.207ที่มีความสัมพันธ์เชิงลบ - เช่นเครื่องหมายลบอาร์ = -0.207.
องศา ความแข็งแกร่ง หรือความรัดกุม การเชื่อมต่อความสัมพันธ์ถูกกำหนดโดยค่าของสัมประสิทธิ์สหสัมพันธ์
ความแรงของการเชื่อมต่อไม่ได้ขึ้นอยู่กับทิศทางและถูกกำหนดโดยค่าสัมประสิทธิ์สหสัมพันธ์
ค่าสัมประสิทธิ์สหสัมพันธ์สูงสุดที่เป็นไปได้ร =1.00; ขั้นต่ำ r = 0.00.
การจำแนกความสัมพันธ์ทั่วไป (ตาม Ivanter E.V., Korosov A.V., 1992):
แข็งแกร่ง, หรือ แน่นด้วยค่าสัมประสิทธิ์สหสัมพันธ์ร >0.70;
เฉลี่ยที่ 0,50< ร<0,69 ;
ปานกลางที่ 0,30< ร<0,49 ;
อ่อนแอที่ 0,20< ร<0,29 ;
อ่อนแอมากที่ ร<0,19 .
ตัวแปร X และ Y สามารถวัดได้ในระดับที่แตกต่างกัน ซึ่งเป็นตัวกำหนดทางเลือกของสัมประสิทธิ์สหสัมพันธ์ที่เหมาะสม (ดูตารางที่ 3):
ตารางที่ 3 การใช้ค่าสัมประสิทธิ์สหสัมพันธ์ขึ้นอยู่กับประเภทของตัวแปร
ประเภทสเกล |
การวัดการเชื่อมต่อ |
|
ตัวแปร X |
ตัวแปร Y |
|
ช่วงเวลาหรือความสัมพันธ์ |
ช่วงเวลาหรือความสัมพันธ์ |
สัมประสิทธิ์เพียร์สัน |
อันดับ ช่วงเวลา หรืออัตราส่วน |
ค่าสัมประสิทธิ์สเปียร์แมน |
|
จัดอันดับ |
จัดอันดับ |
สัมประสิทธิ์เคนดัลล์ |
ขั้ว |
ขั้ว |
สัมประสิทธิ์ "เจ" |
ขั้ว |
จัดอันดับ |
อันดับ-biserial |
ขั้ว |
ช่วงเวลาหรือความสัมพันธ์ |
ไบซีเรียล |
7.2.2 สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน
คำว่า "ความสัมพันธ์" ถูกนำมาใช้ในวิทยาศาสตร์โดยฟรานซิส กัลตัน นักธรรมชาติวิทยาชาวอังกฤษผู้มีชื่อเสียงในปี 1886 อย่างไรก็ตาม สูตรที่แน่นอนในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ได้รับการพัฒนาโดยนักเรียนของเขา คาร์ล เพียร์สัน
ค่าสัมประสิทธิ์แสดงถึงการมีอยู่ของความสัมพันธ์เชิงเส้นระหว่างคุณลักษณะเท่านั้น ซึ่งโดยปกติจะแสดงด้วยสัญลักษณ์ X และ Y สูตรสำหรับการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ถูกสร้างขึ้นในลักษณะที่ว่าหากความสัมพันธ์ระหว่างคุณลักษณะเป็นแบบเส้นตรง ค่าสัมประสิทธิ์ของเพียร์สันจะสร้างค่าสัมประสิทธิ์สหสัมพันธ์ได้อย่างแม่นยำ ความใกล้ชิดของความสัมพันธ์นี้ ดังนั้นจึงเรียกอีกอย่างว่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สัน หากการเชื่อมต่อระหว่างตัวแปร X และย ไม่เป็นเส้นตรง เพียร์สันจึงเสนอสิ่งที่เรียกว่าความสัมพันธ์สหสัมพันธ์เพื่อประเมินความใกล้ชิดของการเชื่อมต่อนี้
ค่าของสัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สันต้องไม่เกิน +1 และน้อยกว่า -1 ตัวเลขสองตัวนี้คือ +1 และ -1 เป็นขอบเขตของค่าสัมประสิทธิ์สหสัมพันธ์ เมื่อผลการคำนวณมีค่ามากกว่า +1 หรือน้อยกว่า -1 แสดงว่าการคำนวณเกิดข้อผิดพลาด
สัญลักษณ์ของค่าสัมประสิทธิ์สหสัมพันธ์มีความสำคัญมากในการตีความความสัมพันธ์ที่เกิดขึ้น ให้เราเน้นอีกครั้งว่าหากเครื่องหมายของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นเป็นบวก ความสัมพันธ์ระหว่างคุณลักษณะที่สัมพันธ์กันก็คือค่าที่มากกว่าของคุณลักษณะหนึ่ง (ตัวแปร) จะสอดคล้องกับค่าที่มากกว่าของคุณลักษณะอื่น (ตัวแปรอื่น) กล่าวอีกนัยหนึ่ง หากตัวบ่งชี้ตัวหนึ่ง (ตัวแปร) เพิ่มขึ้น ตัวบ่งชี้อื่น (ตัวแปร) จะเพิ่มขึ้นตามไปด้วย การพึ่งพาอาศัยกันนี้เรียกว่าการพึ่งพาตามสัดส่วนโดยตรง
หากได้รับเครื่องหมายลบ ค่าที่มากกว่าของคุณสมบัติหนึ่งจะสอดคล้องกับค่าที่น้อยกว่าของคุณสมบัติอื่น กล่าวอีกนัยหนึ่ง หากมีเครื่องหมายลบ การเพิ่มขึ้นของตัวแปรหนึ่ง (เครื่องหมาย ค่า) จะสอดคล้องกับการลดลงของตัวแปรอื่น การพึ่งพาอาศัยกันนี้เรียกว่าการพึ่งพาตามสัดส่วนผกผัน
โดยทั่วไปสูตรในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์คือ:
(7)
ที่ไหน เอ็กซ์ ฉัน- ค่าที่ใช้ในตัวอย่าง X
ใช่แล้ว- ค่าที่ยอมรับในตัวอย่าง Y;
ค่าเฉลี่ยสำหรับ X - ค่าเฉลี่ยสำหรับ Y
การคำนวณสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันถือว่าตัวแปร X และ Y มีการกระจาย ดี.
สูตร (7) ประกอบด้วยปริมาณ
เมื่อแบ่งตาม n (จำนวนค่าของตัวแปร X หรือ Y) ที่เรียกว่า ความแปรปรวนร่วม. สูตร (7) ยังถือว่าเมื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์จำนวนค่าของตัวแปร X จะเท่ากับจำนวนค่าของตัวแปรย.
จำนวนองศาความเป็นอิสระเค = n -2
ตัวอย่างที่ 3เด็กนักเรียน 1 0 คนได้รับการทดสอบการคิดเชิงภาพและวาจา เวลาเฉลี่ยในการแก้งานทดสอบวัดเป็นวินาที ผู้วิจัยมีความสนใจในคำถาม: มีความสัมพันธ์ระหว่างเวลาที่ใช้ในการแก้ไขปัญหาเหล่านี้หรือไม่? ตัวแปร X หมายถึงเวลาเฉลี่ยในการแก้ปัญหางานด้านภาพเป็นรูปเป็นร่าง และตัวแปร Y หมายถึงเวลาเฉลี่ยในการแก้ปัญหางานทดสอบด้วยวาจา
สารละลาย. ให้เรานำเสนอข้อมูลเริ่มต้นในรูปแบบของตารางที่ 4 ซึ่งมีคอลัมน์เพิ่มเติมที่จำเป็นสำหรับการคำนวณโดยใช้สูตร (7)
ตารางที่ 4
จำนวนวิชา |
x |
เอ็กซ์ ฉัน - |
(x ผม - ) 2 |
ใช่ ฉัน- |
(ใช่ ฉัน -) 2 |
|
|
16,7 |
278,89 |
51,84 |
120,24 |
||||
13,69 |
17,2 |
295,84 |
63,64 |
||||
7,29 |
51,84 |
19,44 |
|||||
68,89 |
14,44 |
31,54 |
|||||
59,29 |
7,84 |
21,56 |
|||||
0,49 |
46,24 |
4,76 |
|||||
10,89 |
17,64 |
13,86 |
|||||
10,89 |
51,84 |
23,76 |
|||||
68,89 |
10,8 |
116,64 |
89,64 |
||||
68,89 |
18,8 |
353,44 |
156,04 |
||||
ผลรวม |
357 |
242 |
588,1 |
1007,6 |
416,6 |
||
เฉลี่ย |
35,7 |
24,2 |
เราคำนวณค่าเชิงประจักษ์ของสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตร (7):
เรากำหนดค่าวิกฤตสำหรับค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้รับตามตารางในภาคผนวก 3 เมื่อค้นหาค่าวิกฤตสำหรับค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สันที่คำนวณได้ จำนวนองศาอิสระจะถูกคำนวณเป็น k = n – 2 = 8.
k crit = 0.72 > 0.54 ดังนั้นสมมติฐาน H 1 จึงถูกปฏิเสธและยอมรับสมมติฐานเอช 0 กล่าวอีกนัยหนึ่งความเชื่อมโยงระหว่างเวลาในการแก้ไขงานทดสอบด้วยภาพและวาจายังไม่ได้รับการพิสูจน์
7.3 การวิเคราะห์การถดถอย
นี่คือกลุ่มของวิธีการที่มุ่งเป้าไปที่การระบุและแสดงการเปลี่ยนแปลงและการพึ่งพาที่เกิดขึ้นในระบบตัวแปรสุ่มทางคณิตศาสตร์ หากระบบดังกล่าวจำลองแบบการสอน ดังนั้น ผ่านการวิเคราะห์การถดถอย ปรากฏการณ์ทางจิตวิทยาและการสอน และการพึ่งพาระหว่างสิ่งเหล่านั้นจะถูกระบุและแสดงออกมาทางคณิตศาสตร์ ลักษณะของปรากฏการณ์เหล่านี้วัดในระดับต่าง ๆ ซึ่งกำหนดข้อ จำกัด เกี่ยวกับวิธีการแสดงออกทางคณิตศาสตร์ของการเปลี่ยนแปลงและการพึ่งพาที่ครูและนักวิจัยศึกษา
วิธีการวิเคราะห์การถดถอยได้รับการออกแบบมาโดยเฉพาะสำหรับกรณีของการแจกแจงแบบปกติที่เสถียร ซึ่งการเปลี่ยนแปลงจากการทดลองหนึ่งไปอีกการทดลองหนึ่งจะปรากฏในรูปแบบของการทดลองอิสระเท่านั้น
มีการระบุปัญหาอย่างเป็นทางการต่างๆ ของการวิเคราะห์การถดถอย ซึ่งอาจเรียบง่ายหรือซับซ้อนในแง่ของการกำหนดสูตร วิธีทางคณิตศาสตร์ และความเข้มข้นของแรงงาน ให้เราแสดงรายการและพิจารณาตัวอย่างที่ดูเหมือนจะเป็นหลัก
ภารกิจแรกคือ ระบุข้อเท็จจริงของความแปรปรวน ปรากฏการณ์ที่กำลังศึกษาภายใต้เงื่อนไขบางประการ แต่ไม่ได้รับการแก้ไขอย่างชัดเจนเสมอไป ในการบรรยายครั้งก่อน เราได้แก้ไขปัญหานี้แล้วโดยใช้เกณฑ์แบบอิงพารามิเตอร์และแบบไม่มีพารามิเตอร์
ภารกิจที่สอง - ระบุแนวโน้ม เป็นการเปลี่ยนแปลงลักษณะเป็นระยะ คุณลักษณะนี้อาจหรือไม่ก็ได้ขึ้นอยู่กับตัวแปรเงื่อนไข (อาจขึ้นอยู่กับเงื่อนไขที่ผู้วิจัยไม่ทราบหรือไม่สามารถควบคุมได้) แต่สิ่งนี้ไม่สำคัญสำหรับงานที่อยู่ระหว่างการพิจารณา ซึ่งจำกัดเพียงการระบุแนวโน้มและคุณลักษณะเท่านั้น
การทดสอบสมมติฐานเกี่ยวกับการไม่มีหรือมีแนวโน้มสามารถทำได้โดยใช้เกณฑ์ Abbe . เกณฑ์แอบบีออกแบบมาเพื่อทดสอบสมมติฐานเกี่ยวกับความเท่าเทียมกันของค่าเฉลี่ยที่กำหนดไว้สำหรับ 4 ค่าเชิงประจักษ์ของเกณฑ์ Abbe คำนวณโดยสูตร:
ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่างอยู่ที่ไหน ป– จำนวนค่าในตัวอย่าง ตามเกณฑ์ สมมติฐานเรื่องความเท่าเทียมกันของค่าเฉลี่ยจะถูกปฏิเสธ (ยอมรับสมมติฐานทางเลือก) หากค่าของสถิติคือ ค่าสถิติแบบตาราง (วิกฤต) ถูกกำหนดจากตารางสำหรับเกณฑ์ q ของ Abbe ซึ่งมีตัวย่อยืมมาจากหนังสือโดย L.N. Bolysheva และ N.V. Smirnova (ดูภาคผนวก 3) ปริมาณดังกล่าวซึ่งใช้เกณฑ์ Abbe อาจเป็นส่วนแบ่งหรือเปอร์เซ็นต์ตัวอย่าง ค่าเฉลี่ยเลขคณิต และสถิติอื่นๆ ของการแจกแจงตัวอย่าง หากปริมาณเหล่านั้นใกล้เคียงกับค่าปกติ (หรือทำให้เป็นมาตรฐานก่อนหน้านี้) ดังนั้นเกณฑ์ของ Abbe จึงสามารถนำไปใช้อย่างกว้างขวางในการวิจัยทางจิตวิทยาและการสอน ลองพิจารณาตัวอย่างการระบุแนวโน้มโดยใช้เกณฑ์ Abbe ตัวอย่างที่ 4ในตาราง 5 แสดงพลวัตของเปอร์เซ็นต์ของนักเรียน IV หลักสูตรที่สอบผ่านภาคฤดูหนาวอย่าง “เป็นเลิศ” ตลอดระยะเวลาการทำงาน 10 ปี ในคณะของมหาวิทยาลัยแห่งหนึ่ง โดยต้องกำหนดว่า มีแนวโน้มจะมีผลการเรียนเพิ่มขึ้นหรือไม่ ตารางที่ 5. พลวัตของร้อยละของนักศึกษาดีเด่นชั้นปีที่ 4 ในช่วง 10 ปีการทำงานของคณะ ปีการศึกษา 1995-96
10,8
1996-97
16,4
1997-98
17,4
1998-99
22,0
1999-00
23,0
2000-01
21,5
2001-02
26,1
2002-03
17,2
2003-04
27,5
2004-05
33,0
เช่น โมฆะเราทดสอบสมมติฐานเกี่ยวกับการไม่มีแนวโน้ม เช่น ความเท่าเทียมกันของเปอร์เซ็นต์ เราเฉลี่ยเปอร์เซ็นต์ที่ระบุในตาราง 5 เราพบว่า =21.5 เราคำนวณความแตกต่างระหว่างค่าที่ตามมาและค่าก่อนหน้าในตัวอย่าง จัดกำลังสองและสรุปผล: ในทำนองเดียวกันคำนวณตัวส่วนในสูตร (8) โดยสรุปกำลังสองของความแตกต่างระหว่างการวัดแต่ละครั้งและค่าเฉลี่ยเลขคณิต: ตอนนี้ใช้สูตร (8) เราได้รับ: ในตารางเกณฑ์ Abbe จากภาคผนวก 3 เราพบว่าเมื่อ n = 10 และระดับนัยสำคัญ 0.05 ค่าวิกฤตจะมากกว่า 0.41 ที่เราได้รับ ดังนั้นสมมติฐานเกี่ยวกับความเท่าเทียมกันของเปอร์เซ็นต์ของ "นักเรียนดีเด่น" จะต้องเป็น ถูกปฏิเสธ และเราสามารถยอมรับสมมติฐานทางเลือกเกี่ยวกับการมีอยู่ของแนวโน้มได้ ภารกิจที่สามคือ การระบุรูปแบบที่แสดงออกมาในรูปของสมการสหสัมพันธ์ (การถดถอย). ตัวอย่างที่ 5นักวิจัยชาวเอสโตเนีย J. Mikk ศึกษาความยากลำบากในการทำความเข้าใจข้อความ ได้สร้าง "สูตรความสามารถในการอ่าน" ซึ่งเป็นการถดถอยเชิงเส้นพหุคูณ: ประเมินความยากในการทำความเข้าใจข้อความ โดยที่ x 1 คือความยาวของประโยคอิสระในจำนวนอักขระที่พิมพ์ x 2 - เปอร์เซ็นต์ของคำที่ไม่คุ้นเคย x 3 - นามธรรมของแนวคิดการทำซ้ำที่แสดงโดยคำนาม .
เมื่อเปรียบเทียบค่าสัมประสิทธิ์การถดถอยที่แสดงระดับอิทธิพลของปัจจัย เราจะเห็นว่าความยากในการทำความเข้าใจข้อความนั้นถูกกำหนดโดยความเป็นนามธรรมเป็นหลัก ความยากในการทำความเข้าใจข้อความนั้นขึ้นอยู่กับจำนวนคำที่ไม่คุ้นเคยเพียงครึ่งหนึ่ง (0.27) และในทางปฏิบัติไม่ได้ขึ้นอยู่กับความยาวของประโยคเลย เทคนิคที่กล่าวถึงข้างต้นสำหรับการทดสอบสมมติฐานทางสถิติเกี่ยวกับความสำคัญของความแตกต่างระหว่างสองวิธีนั้นมีการใช้งานที่จำกัดในทางปฏิบัติ นี่เป็นเพราะความจริงที่ว่าเพื่อระบุผลกระทบของเงื่อนไขและปัจจัยที่เป็นไปได้ทั้งหมดต่อลักษณะที่มีประสิทธิผล การทดลองภาคสนามและในห้องปฏิบัติการตามกฎแล้วจะดำเนินการโดยใช้ไม่ใช่สองรายการ แต่ใช้ตัวอย่างจำนวนมากขึ้น (1220 หรือมากกว่า ). บ่อยครั้งที่นักวิจัยเปรียบเทียบค่าเฉลี่ยของตัวอย่างหลาย ๆ ตัวอย่างที่รวมกันเป็นคอมเพล็กซ์เดียว ตัวอย่างเช่น เมื่อศึกษาผลกระทบของปุ๋ยประเภทต่างๆ และปริมาณต่อผลผลิตพืชผล การทดลองจะถูกทำซ้ำในเวอร์ชันต่างๆ ในกรณีเหล่านี้ การเปรียบเทียบแบบคู่จะกลายเป็นเรื่องยุ่งยาก และการวิเคราะห์ทางสถิติของคอมเพล็กซ์ทั้งหมดจำเป็นต้องใช้วิธีพิเศษ วิธีการนี้พัฒนาขึ้นในสถิติทางคณิตศาสตร์ เรียกว่าการวิเคราะห์ความแปรปรวน มันถูกใช้ครั้งแรกโดยนักสถิติชาวอังกฤษ อาร์. ฟิชเชอร์ ในการประมวลผลผลการทดลองทางการเกษตร (1938) การวิเคราะห์ความแปรปรวนเป็นวิธีการประเมินความน่าเชื่อถือทางสถิติของการสำแดงการพึ่งพาคุณลักษณะที่มีประสิทธิผลในปัจจัยหนึ่งหรือหลายปัจจัย โดยใช้วิธีการวิเคราะห์ความแปรปรวน สมมติฐานทางสถิติจะได้รับการทดสอบเกี่ยวกับค่าเฉลี่ยในประชากรทั่วไปหลายๆ กลุ่มที่มีการแจกแจงแบบปกติ การวิเคราะห์ความแปรปรวนเป็นหนึ่งในวิธีการหลักในการประเมินผลการทดลองทางสถิติ นอกจากนี้ยังถูกนำมาใช้มากขึ้นในการวิเคราะห์ข้อมูลทางเศรษฐกิจ การวิเคราะห์ความแปรปรวนทำให้สามารถกำหนดขอบเขตของตัวบ่งชี้ตัวอย่างของความสัมพันธ์ระหว่างคุณลักษณะผลลัพธ์และปัจจัยได้เพียงพอที่จะขยายข้อมูลที่ได้รับจากตัวอย่างไปยังประชากรทั่วไป ข้อดีของวิธีนี้คือให้ข้อสรุปที่เชื่อถือได้จากกลุ่มตัวอย่างขนาดเล็ก โดยการศึกษาความแปรผันของคุณลักษณะที่มีประสิทธิผลภายใต้อิทธิพลของปัจจัยหนึ่งหรือหลายปัจจัยโดยใช้การวิเคราะห์ความแปรปรวน นอกเหนือจากการประมาณทั่วไปเกี่ยวกับความสำคัญของการพึ่งพาแล้ว ยังสามารถประเมินความแตกต่างในขนาดของค่าเฉลี่ยที่เกิดขึ้นได้อีกด้วย ในระดับต่างๆ ของปัจจัย และความสำคัญของปฏิสัมพันธ์ของปัจจัยต่างๆ การวิเคราะห์ความแปรปรวนใช้เพื่อศึกษาการขึ้นต่อกันของคุณลักษณะทั้งเชิงปริมาณและเชิงคุณภาพ รวมถึงการรวมกัน สาระสำคัญของวิธีนี้คือการศึกษาทางสถิติเกี่ยวกับความน่าจะเป็นของอิทธิพลของปัจจัยหนึ่งปัจจัยขึ้นไปตลอดจนปฏิสัมพันธ์กับลักษณะผลลัพธ์ ตามนี้งานหลักสามประการได้รับการแก้ไขโดยใช้การวิเคราะห์ความแปรปรวน: 1) การประเมินทั่วไปเกี่ยวกับความสำคัญของความแตกต่างระหว่างค่าเฉลี่ยกลุ่ม; 2) การประเมินความน่าจะเป็นของการมีปฏิสัมพันธ์ระหว่างปัจจัย 3) การประเมินความสำคัญของความแตกต่างระหว่างคู่ของค่าเฉลี่ย บ่อยครั้งที่นักวิจัยต้องแก้ไขปัญหาดังกล่าวเมื่อทำการทดลองภาคสนามและสัตว์เทคนิคเมื่อมีการศึกษาอิทธิพลของปัจจัยหลายประการต่อลักษณะที่มีประสิทธิผล รูปแบบหลักของการวิเคราะห์ความแปรปรวนประกอบด้วยการสร้างแหล่งที่มาหลักของความแปรผันในลักษณะที่มีประสิทธิผล และการกำหนดปริมาตรของการแปรผัน (ผลรวมของการเบี่ยงเบนกำลังสอง) ตามแหล่งที่มาของการก่อตัว การกำหนดจำนวนองศาอิสระที่สอดคล้องกับองค์ประกอบของความแปรปรวนทั้งหมด การคำนวณการกระจายตัวเป็นอัตราส่วนของปริมาตรของการแปรผันที่สอดคล้องกับจำนวนระดับความเป็นอิสระ การวิเคราะห์ความสัมพันธ์ระหว่างความแปรปรวน ประเมินความน่าเชื่อถือของความแตกต่างระหว่างวิธีการและข้อสรุป แบบแผนนี้จะถูกเก็บรักษาไว้ทั้งในรูปแบบการวิเคราะห์ความแปรปรวนแบบง่าย เมื่อข้อมูลถูกจัดกลุ่มตามลักษณะเฉพาะเดียว และในแบบจำลองที่ซับซ้อน เมื่อข้อมูลถูกจัดกลุ่มตามลักษณะสองลักษณะขึ้นไป อย่างไรก็ตาม ด้วยจำนวนคุณลักษณะของกลุ่มที่เพิ่มขึ้น กระบวนการสลายความแปรปรวนทั้งหมดตามแหล่งที่มาของการก่อตัวจึงมีความซับซ้อนมากขึ้น ตามแผนภาพหลัก การวิเคราะห์ความแปรปรวนสามารถแสดงในรูปแบบของห้าขั้นตอนตามลำดับ: 1) ความหมายและการขยายความแปรผัน 2) การกำหนดจำนวนระดับความอิสระของการแปรผัน 3) การคำนวณความแปรปรวนและอัตราส่วน 4) การวิเคราะห์ความแปรปรวนและความสัมพันธ์ 5) การประเมินความสำคัญของความแตกต่างระหว่างค่าเฉลี่ยและการกำหนดข้อสรุปเพื่อทดสอบสมมติฐานที่เป็นโมฆะ ส่วนที่ต้องใช้แรงงานมากที่สุดในการวิเคราะห์ความแปรปรวนคือขั้นตอนแรก ซึ่งก็คือการกำหนดและสลายความแปรผันตามแหล่งที่มาของการก่อตัว ลำดับการสลายตัวของปริมาตรรวมของการแปรผันถูกกล่าวถึงโดยละเอียดในบทที่ 5 พื้นฐานในการแก้ปัญหาการวิเคราะห์ความแปรปรวนคือกฎการขยายตัว (บวก) การแปรผัน ซึ่งความแปรผันรวม (ความผันผวน) ของคุณลักษณะผลลัพธ์จะแบ่งออกเป็น 2 แบบ คือ การแปรผันที่เกิดจากการกระทำของปัจจัยที่กำลังศึกษา และความแปรผันที่เกิดจากการกระทำของเหตุสุ่มนั่นก็คือ สมมติว่าประชากรที่อยู่ระหว่างการศึกษาถูกแบ่งตามลักษณะของปัจจัยออกเป็นหลายกลุ่ม ซึ่งแต่ละกลุ่มจะมีคุณลักษณะตามค่าเฉลี่ยของลักษณะผลลัพธ์ของตัวเอง ในเวลาเดียวกัน ความแปรผันของค่าเหล่านี้สามารถอธิบายได้ด้วยเหตุผลสองประเภท: เหตุผลที่กระทำต่อสัญญาณที่มีประสิทธิผลอย่างเป็นระบบและสามารถปรับเปลี่ยนได้ในระหว่างการทดลอง และเหตุผลที่ไม่สามารถปรับเปลี่ยนได้ เห็นได้ชัดว่าความแปรผันระหว่างกลุ่ม (แฟคทอเรียลหรือเป็นระบบ) ขึ้นอยู่กับการกระทำของปัจจัยที่กำลังศึกษาเป็นหลัก และการแปรผันภายในกลุ่ม (ที่เหลือหรือสุ่ม) ขึ้นอยู่กับการกระทำของปัจจัยสุ่มเป็นหลัก เพื่อประเมินความน่าเชื่อถือของความแตกต่างระหว่างค่าเฉลี่ยกลุ่ม จำเป็นต้องพิจารณาความแปรผันระหว่างกลุ่มและภายในกลุ่ม หากความแปรผันระหว่างกลุ่ม (แฟคทอเรียล) เกินกว่าความแปรผันภายในกลุ่ม (สารตกค้าง) อย่างมีนัยสำคัญ ปัจจัยนั้นมีอิทธิพลต่อลักษณะผลลัพธ์ โดยเปลี่ยนค่าของค่าเฉลี่ยกลุ่มอย่างมีนัยสำคัญ แต่คำถามก็เกิดขึ้น อะไรคือความสัมพันธ์ระหว่างกลุ่มระหว่างกลุ่มและกลุ่มภายในที่ถือว่าเพียงพอที่จะสรุปความน่าเชื่อถือ (ความสำคัญ) ของความแตกต่างระหว่างค่าเฉลี่ยของกลุ่ม เพื่อประเมินความสำคัญของความแตกต่างระหว่างค่าเฉลี่ยและกำหนดข้อสรุปสำหรับการทดสอบสมมติฐานว่าง (H0:x1 = x2 =... = xn) ในการวิเคราะห์ความแปรปรวน จะใช้มาตรฐานประเภทหนึ่ง - เกณฑ์ G ซึ่งเป็นกฎการกระจายของ ซึ่งก่อตั้งโดยอาร์. ฟิชเชอร์ เกณฑ์นี้คืออัตราส่วนของความแปรปรวนสองค่า: แฟกทอเรียล ซึ่งเกิดจากการกระทำของปัจจัยที่กำลังศึกษา และค่าคงเหลือ เนื่องจากการกระทำของสาเหตุสุ่ม: ความสัมพันธ์การกระจายตัว Γ = £>u :
นักสถิติชาวอเมริกัน Snedecor เสนอให้ระบุ £*2 ด้วยตัวอักษร G เพื่อเป็นเกียรติแก่ R. Fisher ผู้ประดิษฐ์การวิเคราะห์ความแปรปรวน ความแปรปรวน °2 io2 เป็นค่าประมาณของความแปรปรวนของประชากร หากตัวอย่างที่มีความแปรปรวน °2 °2 ถูกสร้างขึ้นจากประชากรทั่วไปกลุ่มเดียวกัน โดยที่การเปลี่ยนแปลงของค่าเป็นแบบสุ่ม ความคลาดเคลื่อนในค่า °2 °2 ก็เป็นแบบสุ่มเช่นกัน หากการทดลองทดสอบอิทธิพลของปัจจัยหลายประการ (A, B, C ฯลฯ) ต่อลักษณะที่มีประสิทธิผลพร้อมกัน ความแปรปรวนเนื่องจากการกระทำของแต่ละรายการควรจะเทียบเคียงกับ °เช่นgP, นั่นคือ ถ้าค่าของการกระจายตัวของแฟคเตอร์มากกว่าค่าคงเหลืออย่างมีนัยสำคัญ แฟคเตอร์จะส่งผลต่อคุณลักษณะผลลัพธ์อย่างมีนัยสำคัญและในทางกลับกัน ในการทดลองหลายปัจจัย นอกเหนือจากการแปรผันเนื่องจากการกระทำของแต่ละปัจจัยแล้ว ยังมีความแปรผันเกือบทุกครั้งอันเนื่องมาจากปฏิสัมพันธ์ของปัจจัย ($ав: ^лс ^вс $ліс) สาระสำคัญของปฏิสัมพันธ์คือผลกระทบของปัจจัยหนึ่งเปลี่ยนแปลงอย่างมีนัยสำคัญในระดับต่างๆ ของปัจจัยที่สอง (เช่น ประสิทธิผลของคุณภาพดินในปริมาณปุ๋ยที่แตกต่างกัน) ปฏิสัมพันธ์ของปัจจัยต่างๆ ควรได้รับการประเมินโดยการเปรียบเทียบความแปรปรวนที่สอดคล้องกัน 3 ^v.gr: เมื่อคำนวณค่าที่แท้จริงของเกณฑ์ B ค่าความแปรปรวนก็จะยิ่งมากขึ้นในตัวเศษ ดังนั้น B > 1 แน่นอนว่ายิ่งเกณฑ์ B ยิ่งมากเท่าใด ความแตกต่างระหว่างค่าแปรปรวนก็จะยิ่งมีนัยสำคัญมากขึ้นเท่านั้น ถ้า B = 1 คำถามในการประเมินความสำคัญของความแตกต่างในความแปรปรวนจะถูกลบออก เพื่อกำหนดขีดจำกัดของความผันผวนแบบสุ่มในอัตราส่วนของการกระจาย G. Fischer ได้พัฒนาตารางการกระจาย B พิเศษ (ภาคผนวก 4 และ 5) เกณฑ์จะสัมพันธ์กับความน่าจะเป็นและขึ้นอยู่กับจำนวนระดับความอิสระของการแปรผัน k1และ k2 ของทั้งสองเปรียบเทียบความแปรปรวน โดยทั่วไปแล้ว จะใช้ตารางสองตารางในการสรุปเกี่ยวกับค่าที่สูงมากของเกณฑ์สำหรับระดับนัยสำคัญที่ 0.05 และ 0.01 ระดับนัยสำคัญ 0.05 (หรือ 5%) หมายความว่าเฉพาะใน 5 กรณีจาก 100 เกณฑ์ B เท่านั้นที่สามารถรับค่าเท่ากับหรือสูงกว่าที่ระบุไว้ในตาราง การลดระดับนัยสำคัญจาก 0.05 เป็น 0.01 จะทำให้มูลค่าของเกณฑ์เพิ่มขึ้นระหว่างความแปรปรวนสองค่าเนื่องจากผลของเหตุผลแบบสุ่มเท่านั้น ค่าของเกณฑ์ยังขึ้นอยู่กับจำนวนองศาความเป็นอิสระของการกระจายตัวทั้งสองที่ถูกเปรียบเทียบโดยตรงอีกด้วย หากจำนวนระดับความเป็นอิสระมีแนวโน้มที่จะเป็นอนันต์ (k-me) อัตราส่วน B สำหรับการกระจายตัวสองครั้งมีแนวโน้มที่จะเป็นเอกภาพ ค่าตารางของเกณฑ์ B แสดงค่าสุ่มที่เป็นไปได้ของอัตราส่วนของความแปรปรวนสองค่าที่ระดับนัยสำคัญที่กำหนด และจำนวนระดับความเป็นอิสระที่สอดคล้องกันสำหรับแต่ละความแปรปรวนที่นำมาเปรียบเทียบ ตารางที่ระบุแสดงค่า B สำหรับตัวอย่างที่สร้างจากประชากรทั่วไปกลุ่มเดียวกัน โดยที่สาเหตุของการเปลี่ยนแปลงค่าเป็นเพียงการสุ่มเท่านั้น ค่า Γ หาได้จากตาราง (ภาคผนวก 4 และ 5) ที่จุดตัดของคอลัมน์ที่เกี่ยวข้อง (จำนวนองศาอิสระสำหรับการกระจายตัวที่มากขึ้น - k1) และแถว (จำนวนองศาอิสระสำหรับการกระจายตัวน้อยลง - k2 ). ดังนั้น หากความแปรปรวนที่มากกว่า (ตัวเศษ Г) คือ k1 = 4 และความแปรปรวนที่น้อยกว่า (ตัวส่วน Г) คือ k2 = 9 ดังนั้น Г ที่ระดับนัยสำคัญ а = 0.05 จะเป็น 3.63 (ภาคผนวก 4) ดังนั้น จากสาเหตุที่สุ่ม เนื่องจากตัวอย่างมีขนาดเล็ก ความแปรปรวนของตัวอย่างหนึ่งจึงสามารถเกินความแปรปรวนของตัวอย่างที่สองได้ 3.63 เท่า ที่ระดับนัยสำคัญ 5% เมื่อระดับนัยสำคัญลดลงจาก 0.05 เป็น 0.01 ค่าตารางของเกณฑ์ G ดังที่ระบุไว้ข้างต้นจะเพิ่มขึ้น ดังนั้น ด้วยดีกรีอิสระที่เท่ากัน k1 = 4 และ k2 = 9 และ a = 0.01 ค่าที่ทำเป็นตารางของเกณฑ์ G จะเป็น 6.99 (ภาคผนวก 5) พิจารณาขั้นตอนการกำหนดจำนวนองศาอิสระในการวิเคราะห์ความแปรปรวน จำนวนระดับความเป็นอิสระ ซึ่งสอดคล้องกับผลรวมของค่าเบี่ยงเบนกำลังสอง จะถูกแยกย่อยเป็นองค์ประกอบที่สอดคล้องกันในลักษณะเดียวกับการสลายตัวของผลรวมของค่าเบี่ยงเบนกำลังสอง (^total = No^gr + ]¥vhr) กล่าวคือ จำนวนองศาอิสระทั้งหมด (k") จะถูกแบ่งออกเป็นจำนวนองศาอิสระสำหรับรูปแบบระหว่างกลุ่มระหว่างกัน (k1) และกลุ่มภายใน (k2) ดังนั้นหากกลุ่มตัวอย่างประกอบด้วย เอ็นการสังเกตหารด้วย ต
กลุ่ม (จำนวนตัวเลือกการทดลอง) และ ป
กลุ่มย่อย (จำนวนการซ้ำ) ดังนั้นจำนวนดีกรีอิสระ k จะเป็นดังนี้: ก) สำหรับผลรวมของการเบี่ยงเบนกำลังสอง (s7zag) b) สำหรับผลรวมระหว่างกลุ่มของการเบี่ยงเบนกำลังสอง ^m.gP) c) สำหรับผลรวมภายในกลุ่มของการเบี่ยงเบนกำลังสอง วี v.gR) ตามกฎสำหรับการเพิ่มรูปแบบต่างๆ: ตัวอย่างเช่น ถ้าในการทดลอง มีรูปแบบการทดลองสี่รูปแบบเกิดขึ้น (t = 4) โดยแต่ละครั้งมีการทำซ้ำห้าครั้ง (n = 5) และจำนวนการสังเกตทั้งหมดคือ N = = ต o p = 4 * 5 = 20 ดังนั้นจำนวนองศาอิสระจะเท่ากับ: เมื่อทราบผลรวมของการเบี่ยงเบนกำลังสองและจำนวนองศาอิสระ เราสามารถประมาณค่าที่เป็นกลาง (แก้ไขแล้ว) สำหรับความแปรปรวนสามค่าได้: สมมติฐานว่าง H0 ได้รับการทดสอบโดยใช้เกณฑ์ B ในลักษณะเดียวกับการทดสอบของนักเรียน ในการตัดสินใจตรวจสอบ H0 จำเป็นต้องคำนวณค่าที่แท้จริงของเกณฑ์และเปรียบเทียบกับค่าในตาราง Ba สำหรับระดับนัยสำคัญที่ยอมรับ a และจำนวนระดับความเป็นอิสระ k1และ k2 สำหรับการกระจายตัวสองครั้ง ถ้า Bfaq > Ba ตามระดับนัยสำคัญที่ยอมรับ เราสามารถสรุปได้ว่าความแตกต่างในความแปรปรวนตัวอย่างถูกกำหนดไม่เพียงแต่จากปัจจัยสุ่มเท่านั้น พวกเขามีความสำคัญ ในกรณีนี้ สมมติฐานว่างถูกปฏิเสธ และมีเหตุผลที่จะยืนยันว่าปัจจัยมีอิทธิพลต่อลักษณะผลลัพธ์อย่างมีนัยสำคัญ ถ้า< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным. การใช้แบบจำลองการวิเคราะห์ความแปรปรวนเฉพาะนั้นขึ้นอยู่กับทั้งจำนวนปัจจัยที่กำลังศึกษาและวิธีการสุ่มตัวอย่าง c ขึ้นอยู่กับจำนวนปัจจัยที่กำหนดความแปรผันของคุณลักษณะผลลัพธ์ ตัวอย่างสามารถสร้างขึ้นตามปัจจัยหนึ่งหรือสองปัจจัยขึ้นไป ตามนี้ การวิเคราะห์ความแปรปรวนแบ่งออกเป็นปัจจัยเดียวและหลายปัจจัย มิฉะนั้นจะเรียกว่าคอมเพล็กซ์การกระจายตัวแบบปัจจัยเดียวและหลายปัจจัย รูปแบบการสลายตัวของความแปรผันทั้งหมดขึ้นอยู่กับการก่อตัวของกลุ่ม อาจเป็นแบบสุ่ม (การสังเกตของกลุ่มหนึ่งไม่เกี่ยวข้องกับการสังเกตของกลุ่มที่สอง) และแบบไม่สุ่ม (การสังเกตสองตัวอย่างมีความสัมพันธ์กันตามเงื่อนไขการทดลองทั่วไป) จะได้ตัวอย่างอิสระและขึ้นอยู่กับตัวอย่าง ตัวอย่างอิสระสามารถสร้างได้ทั้งจำนวนที่เท่ากันและไม่สม่ำเสมอ การก่อตัวของตัวอย่างที่ต้องพึ่งพาจะมีขนาดเท่ากัน หากกลุ่มถูกสร้างตามลำดับแบบสุ่ม ปริมาตรรวมของการแปรผันของลักษณะผลลัพธ์จะรวมถึงแฟกทอเรียล (กลุ่มระหว่างกัน) และความแปรผันที่เหลือ การแปรผันของการทำซ้ำ นั่นคือ ในทางปฏิบัติ ในกรณีส่วนใหญ่ จำเป็นต้องพิจารณาตัวอย่างที่ต้องพึ่งพาเมื่อเงื่อนไขสำหรับกลุ่มและกลุ่มย่อยมีความเท่าเทียมกัน ดังนั้น ในการทดลองภาคสนาม พื้นที่ทั้งหมดจะถูกแบ่งออกเป็นบล็อกต่างๆ โดยมีเงื่อนไขที่หลากหลายที่สุด ในกรณีนี้ แต่ละตัวแปรของการทดสอบจะได้รับโอกาสเท่ากันในการแสดงในทุกบล็อก ซึ่งจะทำให้เงื่อนไขสำหรับตัวแปรที่ทดสอบทั้งหมดของการทดสอบเท่ากัน วิธีสร้างการทดลองนี้เรียกว่าวิธีบล็อกแบบสุ่ม การทดลองกับสัตว์ก็ทำเช่นเดียวกัน เมื่อประมวลผลข้อมูลเศรษฐกิจและสังคมโดยใช้วิธีการวิเคราะห์ความแปรปรวน จำเป็นต้องจำไว้ว่าเนื่องจากปัจจัยจำนวนมากและความสัมพันธ์กันของปัจจัยเหล่านั้น จึงเป็นเรื่องยากแม้จะกำหนดระดับเงื่อนไขอย่างระมัดระวังที่สุดก็ตาม ในการกำหนดระดับของวัตถุประสงค์ อิทธิพลของแต่ละปัจจัยต่อลักษณะผลลัพธ์ ดังนั้น ระดับความแปรผันที่เหลือจึงถูกกำหนดไม่เพียงแต่จากสาเหตุแบบสุ่มเท่านั้น แต่ยังพิจารณาจากปัจจัยสำคัญที่ไม่ได้นำมาพิจารณาเมื่อสร้างแบบจำลองการวิเคราะห์ความแปรปรวนด้วย ด้วยเหตุนี้ ความแปรปรวนคงเหลือที่เป็นพื้นฐานสำหรับการเปรียบเทียบบางครั้งก็ไม่เพียงพอต่อวัตถุประสงค์ มีการประเมินมูลค่าสูงเกินไปอย่างชัดเจน และไม่สามารถทำหน้าที่เป็นเกณฑ์สำหรับความสำคัญของอิทธิพลของปัจจัยต่างๆ ได้ ในเรื่องนี้ เมื่อสร้างแบบจำลองการวิเคราะห์ความแปรปรวน ปัญหาในการเลือกปัจจัยที่สำคัญที่สุดและการปรับระดับเงื่อนไขสำหรับการสำแดงการกระทำของแต่ละรายการจะมีความเกี่ยวข้อง นอกจาก. การใช้การวิเคราะห์ความแปรปรวนจะถือว่าการกระจายตัวของประชากรทางสถิติที่อยู่ในการศึกษานี้เป็นปกติหรือใกล้เคียงกับปกติ หากไม่ตรงตามเงื่อนไขนี้ ค่าประมาณที่ได้จากการวิเคราะห์ความแปรปรวนจะเกินความจริง ในกิจกรรมภาคปฏิบัติของแพทย์เมื่อทำการวิจัยทางชีวการแพทย์ สังคมวิทยา และเชิงทดลอง จำเป็นต้องสร้างอิทธิพลของปัจจัยต่างๆ ต่อผลการศึกษาสถานะสุขภาพของประชากร เมื่อประเมินกิจกรรมทางวิชาชีพและประสิทธิผลของนวัตกรรม มีวิธีการทางสถิติหลายวิธีที่ทำให้สามารถกำหนดความแข็งแกร่ง ทิศทาง รูปแบบของอิทธิพลของปัจจัยที่มีต่อผลลัพธ์ในประชากรทั่วไปหรือกลุ่มตัวอย่าง (การคำนวณเกณฑ์ I, การวิเคราะห์สหสัมพันธ์, การถดถอย, Χ 2 - (ความดีของเพียร์สัน - เกณฑ์ที่เหมาะสม ฯลฯ ) การวิเคราะห์การกระจายได้รับการพัฒนาและเสนอโดยนักวิทยาศาสตร์นักคณิตศาสตร์และนักพันธุศาสตร์ชาวอังกฤษ Ronald Fisher ในช่วงทศวรรษที่ 20 ของศตวรรษที่ XX การวิเคราะห์ความแปรปรวนมักใช้ในการวิจัยทางวิทยาศาสตร์และเชิงปฏิบัติในด้านสาธารณสุขและการดูแลสุขภาพ เพื่อศึกษาอิทธิพลของปัจจัยตั้งแต่หนึ่งปัจจัยขึ้นไปต่อลักษณะผลลัพธ์ มันขึ้นอยู่กับหลักการของ "สะท้อนความหลากหลายของค่าของปัจจัยต่อความหลากหลายของค่าของลักษณะผลลัพธ์" และสร้างความแข็งแกร่งของอิทธิพลของปัจจัยในประชากรตัวอย่าง สาระสำคัญของวิธีการวิเคราะห์ความแปรปรวนคือการวัดความแปรปรวนส่วนบุคคล (ผลรวม, แฟคทอเรียล, คงเหลือ) และกำหนดความแข็งแกร่ง (ส่วนแบ่ง) ของอิทธิพลของปัจจัยที่ศึกษาเพิ่มเติม (การประเมินบทบาทของแต่ละปัจจัยหรืออิทธิพลร่วมกัน) คุณลักษณะผลลัพธ์ (s) การวิเคราะห์ความแปรปรวนเป็นวิธีทางสถิติในการประเมินความสัมพันธ์ระหว่างปัจจัยและลักษณะการปฏิบัติงานในกลุ่มต่างๆ โดยการสุ่มเลือก โดยพิจารณาจากความแตกต่าง (ความหลากหลาย) ของค่าของคุณลักษณะ การวิเคราะห์ความแปรปรวนขึ้นอยู่กับการวิเคราะห์ความเบี่ยงเบนของทุกหน่วยของประชากรที่ศึกษาจากค่าเฉลี่ยเลขคณิต เพื่อเป็นการวัดความเบี่ยงเบน การกระจาย (B) จะถูกนำไปใช้ - กำลังสองเฉลี่ยของการเบี่ยงเบน การเบี่ยงเบนที่เกิดจากอิทธิพลของคุณลักษณะปัจจัย (ปัจจัย) จะถูกเปรียบเทียบกับขนาดของการเบี่ยงเบนที่เกิดจากสถานการณ์สุ่ม หากการเบี่ยงเบนที่เกิดจากคุณลักษณะของปัจจัยมีความสำคัญมากกว่าการเบี่ยงเบนแบบสุ่ม ปัจจัยนั้นจะถือว่ามีผลกระทบอย่างมีนัยสำคัญต่อคุณลักษณะผลลัพธ์ ในการคำนวณการกระจายตัว ค่าเบี่ยงเบนของแต่ละตัวเลือก (แต่ละค่าตัวเลขที่ลงทะเบียนของคุณสมบัติ) จากค่าเฉลี่ยเลขคณิตจะถูกยกกำลังสอง สิ่งนี้จะกำจัดสัญญาณเชิงลบ จากนั้นการเบี่ยงเบน (ความแตกต่าง) เหล่านี้จะถูกสรุปและหารด้วยจำนวนการสังเกตเช่น ส่วนเบี่ยงเบนเฉลี่ย ดังนั้นจึงได้ค่าความแปรปรวน ความสำคัญของระเบียบวิธีที่สำคัญสำหรับการใช้การวิเคราะห์ความแปรปรวนคือการเลือกตัวอย่างที่ถูกต้อง กลุ่มตัวอย่างสามารถสุ่มสร้างได้โดยอิสระจากกัน ขึ้นอยู่กับเป้าหมายและวัตถุประสงค์ (กลุ่มควบคุมและกลุ่มทดลองเพื่อศึกษาตัวบ่งชี้บางอย่าง เช่น ผลของความดันโลหิตสูงต่อการพัฒนาของโรคหลอดเลือดสมอง) ตัวอย่างดังกล่าวเรียกว่าเป็นอิสระ บ่อยครั้งที่มีการศึกษาผลลัพธ์ของการสัมผัสกับปัจจัยในกลุ่มตัวอย่างเดียวกัน (เช่น ผู้ป่วยรายเดียวกัน) ก่อนและหลังการสัมผัส (การรักษา การป้องกัน มาตรการฟื้นฟู) ตัวอย่างดังกล่าวเรียกว่าขึ้นอยู่กับ การวิเคราะห์ความแปรปรวนซึ่งทดสอบอิทธิพลของปัจจัยหนึ่งเรียกว่าการวิเคราะห์ปัจจัยเดียว (การวิเคราะห์ตัวแปรเดียว) เมื่อศึกษาอิทธิพลของปัจจัยมากกว่าหนึ่งปัจจัย จะใช้การวิเคราะห์ความแปรปรวนหลายตัวแปร (การวิเคราะห์หลายตัวแปร) ลักษณะปัจจัยคือลักษณะที่มีอิทธิพลต่อปรากฏการณ์ที่กำลังศึกษา เพื่อทำการวิเคราะห์ความแปรปรวน สามารถใช้ทั้งคุณลักษณะเชิงคุณภาพ (เพศ วิชาชีพ) และเชิงปริมาณ (จำนวนการฉีด ผู้ป่วยในวอร์ด จำนวนวันที่นอน) การวิเคราะห์วิธีความแปรปรวน: โดยทั่วไปแล้ว ในการวิจัยทางชีวการแพทย์จะใช้เพียงปัจจัยเดียวหรือมากที่สุดสองปัจจัยเท่านั้นในการกระจายเชิงซ้อน สามารถศึกษาคอมเพล็กซ์หลายปัจจัยได้โดยการวิเคราะห์ตามลำดับเชิงซ้อนหนึ่งหรือสองปัจจัยที่แยกได้จากประชากรที่สังเกตทั้งหมด เงื่อนไขในการใช้การวิเคราะห์ความแปรปรวน: เมื่อทำการวิเคราะห์ความแปรปรวนทางเดียว ขอแนะนำ (เงื่อนไขที่จำเป็นสำหรับการใช้งาน): ความปกติของการแจกแจงถูกกำหนดโดยเส้นโค้งเกาส์ (De Mavoor) ซึ่งสามารถอธิบายได้ด้วยฟังก์ชัน y = f(x) เนื่องจากเป็นหนึ่งในกฎการกระจายที่ใช้ในการประมาณคำอธิบายของปรากฏการณ์ที่สุ่มความน่าจะเป็น ในธรรมชาติ. หัวข้อของการวิจัยทางชีวการแพทย์คือปรากฏการณ์ความน่าจะเป็นซึ่งพบการแจกแจงแบบปกติค่อนข้างบ่อยในการวิจัยดังกล่าว หลักการประยุกต์การวิเคราะห์วิธีความแปรปรวน ขั้นแรกมีการกำหนดสมมติฐานว่างนั่นคือสันนิษฐานว่าปัจจัยที่ศึกษาไม่มีผลกระทบใด ๆ ต่อค่าของลักษณะผลลัพธ์และความแตกต่างที่ได้รับจะเป็นแบบสุ่ม จากนั้นเราจะพิจารณาว่าความน่าจะเป็นที่จะได้รับความแตกต่างที่สังเกตได้ (หรือรุนแรงกว่า) คืออะไร โดยมีเงื่อนไขว่าสมมติฐานว่างนั้นเป็นจริง หากความน่าจะเป็นนี้มีน้อย* เราจะปฏิเสธสมมติฐานว่างและสรุปว่าผลการศึกษามีนัยสำคัญทางสถิติ นี่ไม่ได้หมายความว่าผลกระทบของปัจจัยที่กำลังศึกษาได้รับการพิสูจน์แล้ว (นี่คือคำถามประการแรกคือการวางแผนการวิจัย) แต่ก็ยังไม่น่าเป็นไปได้ที่ผลลัพธ์จะเกิดจากโอกาส หากตรงตามเงื่อนไขทั้งหมดสำหรับการใช้การวิเคราะห์ความแปรปรวน การสลายตัวของความแปรปรวนรวมในทางคณิตศาสตร์จะมีลักษณะดังนี้: ยอดรวม = D ข้อเท็จจริง + D ส่วนที่เหลือ , ยอดรวม - การกระจายรวมของค่าที่สังเกตได้ (ตัวแปร) มีลักษณะเฉพาะโดยการกระจายตัวของตัวแปรจากค่าเฉลี่ยทั่วไป วัดความแปรผันของคุณลักษณะทั้งหมดภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้ ความหลากหลายโดยรวมประกอบด้วยความหลากหลายระหว่างกลุ่มและภายในกลุ่ม ข้อเท็จจริง D - การกระจายตัวแบบแฟคทอเรียล (ระหว่างกลุ่ม) โดดเด่นด้วยความแตกต่างในค่าเฉลี่ยในแต่ละกลุ่มและขึ้นอยู่กับอิทธิพลของปัจจัยที่กำลังศึกษาซึ่งทำให้แต่ละกลุ่มมีความแตกต่างกัน ตัวอย่างเช่นในกลุ่มที่แตกต่างกันในปัจจัยสาเหตุของโรคปอดบวมทางคลินิกระดับเฉลี่ยของการนอนต่อวันไม่เหมือนกัน - สังเกตความหลากหลายของกลุ่มระหว่างกัน ง. พักผ่อน - ความแปรปรวนที่เหลือ (ภายในกลุ่ม) ซึ่งแสดงลักษณะการกระจายตัวของตัวแปรภายในกลุ่ม สะท้อนถึงความแปรผันแบบสุ่ม เช่น ส่วนหนึ่งของการเปลี่ยนแปลงที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่ระบุและไม่ขึ้นอยู่กับลักษณะ - ปัจจัยที่สร้างพื้นฐานของกลุ่ม ความแปรผันของลักษณะที่ศึกษาขึ้นอยู่กับความแข็งแกร่งของอิทธิพลของปัจจัยสุ่มที่ไม่สามารถระบุได้ ทั้งปัจจัยที่จัด (กำหนดโดยผู้วิจัย) และปัจจัยสุ่ม (ไม่ทราบ) ดังนั้น ความแปรผันรวม (ความแปรปรวน) จึงประกอบด้วยความแปรผันที่เกิดจากปัจจัยที่ถูกจัด (ให้มา) เรียกว่า ความแปรผันแฟคทอเรียล และปัจจัยที่ไม่มีการรวบรวมกัน กล่าวคือ ความแปรผันของสารตกค้าง (สุ่ม, ไม่ทราบ) การวิเคราะห์ความแปรปรวนแบบคลาสสิกดำเนินการในขั้นตอนต่อไปนี้: อัลกอริธึมสำหรับการวิเคราะห์ความแปรปรวนโดยใช้ตัวเลือกที่เรียบง่าย อัลกอริธึมสำหรับการวิเคราะห์ความแปรปรวนโดยใช้วิธีที่ง่ายช่วยให้คุณได้รับผลลัพธ์เดียวกัน แต่การคำนวณจะง่ายกว่ามาก: ด่านที่ 1 การก่อสร้างคอมเพล็กซ์การกระจายตัว การสร้างกลุ่มการกระจายตัวหมายถึงการสร้างตารางที่จะแยกแยะปัจจัย สัญญาณที่มีประสิทธิผล และการเลือกข้อสังเกต (ผู้ป่วย) ลงในแต่ละกลุ่มได้อย่างชัดเจน สารเชิงซ้อนแฟกเตอร์ตัวเดียวประกอบด้วยการไล่ระดับหลายระดับของแฟกเตอร์เดียว (A) การไล่สีคือตัวอย่างจากประชากรทั่วไปที่แตกต่างกัน (A1, A2, AZ) คอมเพล็กซ์สองปัจจัย - ประกอบด้วยการไล่ระดับหลายระดับของสองปัจจัยรวมกัน ปัจจัยสาเหตุของอุบัติการณ์ของโรคปอดบวมจะเหมือนกัน (A1, A2, AD) เมื่อรวมกับรูปแบบทางคลินิกของโรคปอดบวมที่แตกต่างกัน (H1 - เฉียบพลัน, H2 - เรื้อรัง) ด่านที่สอง การคำนวณค่าเฉลี่ยทั่วไป (M รวม) การคำนวณตัวเลือกผลรวมสำหรับแต่ละการไล่ระดับของปัจจัย: Σ Vj = V 1 + V 2 + V 3 การคำนวณจำนวนรวมของตัวเลือก (รวม Σ V) สำหรับการไล่ระดับทั้งหมดของคุณลักษณะปัจจัย: Σ V ทั้งหมด = Σ Vj 1 + Σ Vj 2 + Σ Vj 3 การคำนวณลักษณะปัจจัยของค่าเฉลี่ยกลุ่ม (M gr.): M gr. = Σ วีเจ / ยังไม่มีข้อความ, ด่านที่สาม การคำนวณผลต่าง: หากตรงตามเงื่อนไขทั้งหมดสำหรับการใช้การวิเคราะห์ความแปรปรวน สูตรทางคณิตศาสตร์จะเป็นดังนี้: ยอดรวม = D ข้อเท็จจริง + D ส่วนที่เหลือ ยอดรวม - การกระจายตัวทั้งหมด โดดเด่นด้วยการแพร่กระจายของตัวแปร (ค่าที่สังเกตได้) จากค่าเฉลี่ยทั่วไป ด่านที่ 4 การคำนวณตัวบ่งชี้หลักของความเข้มแข็งของอิทธิพลของปัจจัยที่กำลังศึกษาตัวบ่งชี้ความแข็งแกร่งของอิทธิพล (η 2) ของลักษณะปัจจัยต่อผลลัพธ์ถูกกำหนดโดยส่วนแบ่งของความแปรปรวนแฟคทอเรียล (ข้อเท็จจริง D) ในด้านความแปรปรวนทั้งหมด (รวม D), η 2 (eta) - แสดงให้เห็นว่ามีการแบ่งปันอะไร อิทธิพลของปัจจัยที่กำลังศึกษาอยู่ท่ามกลางปัจจัยอื่น ๆ ทั้งหมดและถูกกำหนดโดยสูตร : เวทีวี. การพิจารณาความน่าเชื่อถือของผลการวิจัยโดยใช้วิธีฟิชเชอร์นั้นดำเนินการโดยใช้สูตร: การเปรียบเทียบเกณฑ์ฟิชเชอร์ (F) กับมาตรฐาน (ตาราง) F ดำเนินการตามคอลัมน์ของตารางโดยคำนึงถึงระดับความเป็นอิสระ: โวลต์ 1 = n - 1 กำหนดแนวนอน v 1 ในแนวตั้ง - v 2 ที่จุดตัดกันกำหนดค่าตาราง F โดยที่ค่าตารางด้านบน p ≥ 0.05 และด้านล่างสอดคล้องกับ p > 0.01 และเปรียบเทียบกับเกณฑ์ที่คำนวณได้ F หากค่าของการคำนวณ เกณฑ์ F เท่ากับหรือมากกว่าตาราง ดังนั้นผลลัพธ์จึงเชื่อถือได้ และ H 0 จะไม่ถูกปฏิเสธ งาน: ที่สถานประกอบการของ N. ระดับการบาดเจ็บเพิ่มขึ้นดังนั้นแพทย์จึงได้ทำการศึกษาปัจจัยส่วนบุคคลโดยศึกษาประสบการณ์การทำงานของผู้ที่ทำงานในเวิร์คช็อปด้วย ตัวอย่างถูกสร้างขึ้นที่องค์กร N. จากการประชุมเชิงปฏิบัติการ 4 แห่งที่มีเงื่อนไขและลักษณะงานคล้ายคลึงกัน อัตราการบาดเจ็บคำนวณต่อพนักงาน 100 คนในปีที่ผ่านมา เมื่อศึกษาปัจจัยประสบการณ์การทำงาน จะได้ข้อมูลดังนี้ จากข้อมูลของการศึกษาได้มีการหยิบยกสมมติฐานว่าง (H 0) เกี่ยวกับอิทธิพลของประสบการณ์การทำงานที่มีต่อระดับการบาดเจ็บของพนักงานขององค์กร A ออกกำลังกาย
ขั้นตอนการใช้ ANOVA บทสรุป.ในกลุ่มตัวอย่างพบว่าอิทธิพลของประสบการณ์การทำงานที่มีต่ออัตราการบาดเจ็บคือ 80% ของจำนวนปัจจัยอื่นๆ ทั้งหมด สำหรับการประชุมเชิงปฏิบัติการทั้งหมดของโรงงาน สามารถระบุได้ด้วยความน่าจะเป็น 99.7% (13.3 > 8.7) ว่าประสบการณ์การทำงานส่งผลต่อระดับการบาดเจ็บ ดังนั้นสมมติฐานว่าง (H 0) จะไม่ถูกปฏิเสธและอิทธิพลของประสบการณ์การทำงานที่มีต่อระดับการบาดเจ็บในการประชุมเชิงปฏิบัติการของโรงงาน A ได้รับการพิจารณาแล้ว ค่า F (การทดสอบฟิชเชอร์) มาตรฐานที่ p ≥ 0.05 (ค่าบน) ที่ p ≥ 0.01 (ค่าต่ำกว่า) การวิเคราะห์ความแปรปรวนคือการวิเคราะห์ความแปรปรวนของคุณลักษณะที่มีประสิทธิผลภายใต้อิทธิพลของปัจจัยตัวแปรที่ได้รับการควบคุม (ในวรรณคดีต่างประเทศเรียกว่า ANOVA – “การวิเคราะห์ความแปรปรวน”) ลักษณะผลลัพธ์เรียกอีกอย่างว่าลักษณะเฉพาะและปัจจัยที่มีอิทธิพลเรียกว่าลักษณะอิสระ ข้อจำกัดของวิธีการ: คุณลักษณะอิสระสามารถวัดได้ในระดับที่กำหนด ลำดับ หรือเมตริก ขึ้นอยู่กับคุณลักษณะเฉพาะ - ในระดับเมตริกเท่านั้น เพื่อทำการวิเคราะห์ความแปรปรวน จะมีการระบุการไล่ระดับของคุณลักษณะแฟคเตอร์หลายระดับ และองค์ประกอบตัวอย่างทั้งหมดจะถูกจัดกลุ่มตามการไล่ระดับเหล่านี้ การตั้งสมมติฐานในการวิเคราะห์ความแปรปรวน สมมติฐานว่าง: “ค่าเฉลี่ยของลักษณะผลลัพธ์ในทุกเงื่อนไขของปัจจัย (หรือการไล่ระดับของปัจจัย) จะเท่ากัน” สมมติฐานทางเลือก: “ค่าเฉลี่ยของลักษณะที่มีประสิทธิผลภายใต้เงื่อนไขที่แตกต่างกันของปัจจัยนั้นแตกต่างกัน” การวิเคราะห์ความแปรปรวนสามารถแบ่งออกเป็นหลายประเภท ขึ้นอยู่กับ: ตามจำนวนปัจจัยอิสระที่พิจารณา จำนวนตัวแปรผลลัพธ์ที่สัมผัสกับปัจจัย เกี่ยวกับธรรมชาติ ธรรมชาติของการได้มา และการมีอยู่ของความสัมพันธ์ระหว่างตัวอย่างค่าที่เปรียบเทียบ หากมีปัจจัยหนึ่งที่กำลังศึกษาอิทธิพลอยู่ การวิเคราะห์ความแปรปรวนเรียกว่าการวิเคราะห์ปัจจัยเดียว และแบ่งออกเป็นสองประเภท: -
การวิเคราะห์ตัวอย่างที่ไม่เกี่ยวข้อง (เช่น ต่างกัน)
. ตัวอย่างเช่น ผู้ตอบแบบสอบถามกลุ่มหนึ่งแก้ไขปัญหาในสภาพที่เงียบสงบ กลุ่มที่สอง - ในห้องที่มีเสียงดัง (ในกรณีนี้สมมุติฐานว่างจะมีลักษณะดังนี้: “เวลาเฉลี่ยในการแก้ปัญหาประเภทนี้จะเท่ากันในห้องที่เงียบสงบและเสียงดัง” กล่าวคือไม่ขึ้นอยู่กับเสียงรบกวน ปัจจัย.) -
การวิเคราะห์ตัวอย่างที่เชื่อมโยง
นั่นคือการวัดสองครั้งดำเนินการกับกลุ่มผู้ตอบแบบสอบถามกลุ่มเดียวกันภายใต้เงื่อนไขที่ต่างกัน ตัวอย่างเดียวกัน: ครั้งแรกที่ปัญหาได้รับการแก้ไขอย่างเงียบ ๆ ครั้งที่สอง - ปัญหาที่คล้ายกัน - ในสภาวะที่มีการรบกวนทางเสียง (ในทางปฏิบัติ การทดลองดังกล่าวควรได้รับการดำเนินการด้วยความระมัดระวัง เนื่องจากอาจมีปัจจัยที่ไม่สามารถนับรวมได้คือ "ความสามารถในการเรียนรู้" ซึ่งผู้วิจัยเสี่ยงต่อการเปลี่ยนแปลงเงื่อนไข กล่าวคือ เสียงรบกวน) หากมีการศึกษาอิทธิพลของปัจจัยสองปัจจัยขึ้นไปพร้อมกัน เรากำลังเผชิญกับ การวิเคราะห์ความแปรปรวนหลายตัวแปร
ซึ่งสามารถแบ่งย่อยตามประเภทตัวอย่างได้ หากตัวแปรหลายตัวได้รับผลกระทบจากปัจจัย เรากำลังพูดถึง การวิเคราะห์หลายตัวแปร
. การทำการวิเคราะห์ความแปรปรวนหลายตัวแปรจะดีกว่าการวิเคราะห์ตัวแปรเดียวเฉพาะเมื่อตัวแปรตามไม่เป็นอิสระจากกันและมีความสัมพันธ์ซึ่งกันและกัน โดยทั่วไป งานของการวิเคราะห์ความแปรปรวนคือการระบุความแปรผันเฉพาะสามประการจากความแปรปรวนทั่วไปของลักษณะ: ความแปรปรวนที่เกิดจากการกระทำของตัวแปรอิสระ (ปัจจัย) แต่ละตัวที่กำลังศึกษาอยู่ ความแปรปรวนอันเนื่องมาจากปฏิสัมพันธ์ของตัวแปรอิสระที่กำลังศึกษาอยู่ ความแปรปรวนแบบสุ่มเนื่องจากสถานการณ์ที่ไม่สามารถระบุได้ทั้งหมด เพื่อประเมินความแปรปรวนที่เกิดจากการกระทำของตัวแปรที่ศึกษาและการโต้ตอบของตัวแปรเหล่านั้น จะมีการคำนวณอัตราส่วนของตัวบ่งชี้ที่สอดคล้องกันของความแปรปรวนและความแปรปรวนแบบสุ่ม ตัวบ่งชี้ความสัมพันธ์นี้คือการทดสอบ Fisher F ยิ่งความแปรปรวนของคุณลักษณะมากเท่าใดเนื่องจากการกระทำของปัจจัยที่มีอิทธิพลหรือปฏิสัมพันธ์ของพวกมัน ค่าเชิงประจักษ์ของเกณฑ์ก็จะยิ่งสูงขึ้นเท่านั้น ในสูตรการคำนวณเกณฑ์ การวิเคราะห์ความแปรปรวนแบบทางเดียวแบบไม่มีพารามิเตอร์สำหรับตัวอย่างอิสระคือการทดสอบ Kruskal-Wallace คล้ายกับการทดสอบ Mann-Whitney สำหรับตัวอย่างอิสระ 2 ตัวอย่าง ยกเว้นว่าจะรวมอันดับสำหรับแต่ละตัวอย่าง นอกจากนี้ สามารถใช้เกณฑ์มัธยฐานในการวิเคราะห์ความแปรปรวนได้ เมื่อใช้งาน แต่ละกลุ่มจะมีการกำหนดจำนวนการสังเกตที่เกินค่ามัธยฐานที่คำนวณได้สำหรับทุกกลุ่ม และจำนวนการสังเกตที่น้อยกว่าค่ามัธยฐาน หลังจากนั้นจึงสร้างตารางฉุกเฉินแบบสองมิติ การทดสอบฟรีดแมนเป็นการสรุปทั่วไปแบบไม่มีพารามิเตอร์ของการทดสอบทีแบบคู่สำหรับกรณีตัวอย่างที่มีการวัดซ้ำ เมื่อจำนวนตัวแปรที่ถูกเปรียบเทียบมากกว่าสองตัว ต่างจากการวิเคราะห์สหสัมพันธ์ ในการวิเคราะห์ความแปรปรวน ผู้วิจัยดำเนินการจากการสันนิษฐานว่าตัวแปรบางตัวทำหน้าที่เป็นตัวที่มีอิทธิพล (เรียกว่าปัจจัยหรือตัวแปรอิสระ) ในขณะที่ตัวแปรอื่นๆ (ลักษณะผลลัพธ์หรือตัวแปรตาม) ได้รับอิทธิพลจากปัจจัยเหล่านี้ แม้ว่าสมมติฐานนี้จะเป็นไปตามขั้นตอนการคำนวณทางคณิตศาสตร์ แต่ก็ยังต้องใช้ความระมัดระวังในการสรุปเกี่ยวกับเหตุและผล ตัวอย่างเช่นหากเราตั้งสมมติฐานเกี่ยวกับการพึ่งพาความสำเร็จของงานของเจ้าหน้าที่ในปัจจัย H (ความกล้าหาญทางสังคมตาม Cattell) ก็จะไม่รวมสิ่งที่ตรงกันข้าม: ความกล้าหาญทางสังคมของผู้ถูกกล่าวหาสามารถเกิดขึ้น (เพิ่มขึ้น) ในฐานะ ผลลัพธ์ของความสำเร็จในการทำงานของเขา - นี่คือด้านหนึ่ง ในทางกลับกัน เราควรตระหนักว่า “ความสำเร็จ” วัดกันอย่างไร? หากไม่ได้ขึ้นอยู่กับลักษณะวัตถุประสงค์ (เช่น "ปริมาณการขาย" ที่ทันสมัยในปัจจุบัน ฯลฯ ) แต่ขึ้นอยู่กับการประเมินโดยผู้เชี่ยวชาญของเพื่อนร่วมงาน ก็มีความเป็นไปได้ที่จะแทนที่ "ความสำเร็จ" ด้วยลักษณะพฤติกรรมหรือส่วนบุคคล (เชิงปริมาณ การสื่อสาร อาการภายนอกของความก้าวร้าว ฯลฯ ) การวิเคราะห์ความแปรปรวน 1. แนวคิดการวิเคราะห์ความแปรปรวน การวิเคราะห์ความแปรปรวนคือการวิเคราะห์ความแปรปรวนของลักษณะภายใต้อิทธิพลของปัจจัยตัวแปรควบคุมใดๆ ในวรรณคดีต่างประเทศ การวิเคราะห์ความแปรปรวนมักเรียกว่า ANOVA ซึ่งแปลว่าการวิเคราะห์ความแปรปรวน (การวิเคราะห์ความแปรปรวน) ปัญหาความแปรปรวนประกอบด้วยการแยกความแปรปรวนประเภทอื่นออกจากความแปรปรวนทั่วไปของลักษณะ: ก) ความแปรปรวนเนื่องจากการกระทำของตัวแปรอิสระแต่ละตัวที่อยู่ในการศึกษา b) ความแปรปรวนเนื่องจากปฏิสัมพันธ์ของตัวแปรอิสระที่กำลังศึกษา c) ความแปรปรวนแบบสุ่มเนื่องจากตัวแปรที่ไม่รู้จักอื่นๆ ทั้งหมด ความแปรปรวนเนื่องจากการกระทำของตัวแปรภายใต้การศึกษาและการโต้ตอบของตัวแปรมีความสัมพันธ์กับความแปรปรวนแบบสุ่ม ตัวบ่งชี้ความสัมพันธ์นี้คือการทดสอบ F ของฟิชเชอร์ สูตรในการคำนวณเกณฑ์ F ประกอบด้วยการประมาณค่าความแปรปรวน ซึ่งก็คือพารามิเตอร์การกระจายของคุณลักษณะ ดังนั้นเกณฑ์ F จึงเป็นเกณฑ์แบบพาราเมตริก ยิ่งความแปรปรวนของคุณลักษณะมีสาเหตุมาจากตัวแปร (ปัจจัย) ที่กำลังศึกษาอยู่หรือปฏิสัมพันธ์ของตัวแปรเหล่านั้นมากเท่าใด ก็จะยิ่งสูงขึ้นเท่านั้น ค่าเกณฑ์เชิงประจักษ์. ศูนย์
สมมติฐานในการวิเคราะห์ความแปรปรวนจะระบุว่าค่าเฉลี่ยของคุณลักษณะที่มีประสิทธิผลที่ศึกษาจะเท่ากันในการไล่ระดับทั้งหมด ทางเลือก
สมมติฐานจะระบุว่าค่าเฉลี่ยของลักษณะผลลัพธ์ในการไล่ระดับที่แตกต่างกันของปัจจัยที่กำลังศึกษานั้นแตกต่างกัน การวิเคราะห์ความแปรปรวนช่วยให้เราสามารถระบุการเปลี่ยนแปลงในลักษณะแต่ไม่ได้ระบุ ทิศทางการเปลี่ยนแปลงเหล่านี้ เรามาเริ่มการพิจารณาการวิเคราะห์ความแปรปรวนด้วยกรณีที่ง่ายที่สุด เมื่อเราศึกษาการกระทำเท่านั้น หนึ่งตัวแปร (ปัจจัยหนึ่ง) 2. การวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้อง 2.1. วัตถุประสงค์ของวิธีการ วิธีการวิเคราะห์ความแปรปรวนแบบปัจจัยเดียวจะใช้ในกรณีที่มีการศึกษาการเปลี่ยนแปลงในลักษณะที่มีประสิทธิผลภายใต้อิทธิพลของเงื่อนไขที่เปลี่ยนแปลงหรือการไล่ระดับของปัจจัย ในวิธีการเวอร์ชันนี้ อิทธิพลของการไล่ระดับของแฟคเตอร์แต่ละค่าจะเป็นอย่างไร แตกต่างตัวอย่างวิชา จะต้องมีการไล่ระดับปัจจัยอย่างน้อยสามระดับ (อาจมีการไล่ระดับสองระดับ แต่ในกรณีนี้ เราไม่สามารถสร้างการขึ้นต่อกันแบบไม่เชิงเส้นได้ และดูเหมือนว่าจะสมเหตุสมผลกว่าที่จะใช้การไล่ระดับที่ง่ายกว่า) การวิเคราะห์ประเภทนี้ในเวอร์ชันที่ไม่ใช่พารามิเตอร์คือการทดสอบ Kruskal-Wallis H สมมติฐาน H 0: ความแตกต่างระหว่างเกรดปัจจัย (เงื่อนไขที่แตกต่างกัน) จะไม่มากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม H 1: ความแตกต่างระหว่างเกรดปัจจัย (เงื่อนไขที่แตกต่างกัน) มากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม 2.2. ข้อจำกัดของการวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้อง 1. การวิเคราะห์ความแปรปรวนทางเดียวจำเป็นต้องมีการไล่ระดับปัจจัยอย่างน้อยสามระดับ และอย่างน้อยสองวิชาในการไล่ระดับแต่ละครั้ง 2. ลักษณะผลลัพธ์จะต้องกระจายตามปกติในกลุ่มตัวอย่างที่กำลังศึกษา จริงอยู่ โดยปกติไม่ได้ระบุว่าเรากำลังพูดถึงการกระจายตัวของคุณลักษณะในตัวอย่างที่สำรวจทั้งหมดหรือในส่วนนั้นที่ประกอบเป็นการกระจายตัวที่ซับซ้อน 3. ตัวอย่างการแก้ปัญหาโดยใช้วิธีวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้องโดยใช้ตัวอย่าง: กลุ่มวิชาที่แตกต่างกันสามกลุ่มจากหกวิชาได้รับรายการคำศัพท์สิบคำ กลุ่มแรกนำเสนอคำด้วยความเร็วต่ำ - 1 คำต่อ 5 วินาที กลุ่มที่สองด้วยความเร็วเฉลี่ย - 1 คำต่อ 2 วินาที และกลุ่มที่สามด้วยความเร็วสูง - 1 คำต่อวินาที คาดว่าประสิทธิภาพในการสืบพันธุ์จะขึ้นอยู่กับความเร็วของการนำเสนอคำ ผลลัพธ์แสดงไว้ในตาราง 1. จำนวนคำที่ทำซ้ำ ตารางที่ 1 เรื่องเลขที่ ความเร็วต่ำ ความเร็วเฉลี่ย ความเร็วสูง จำนวนเงินทั้งหมด H 0: ความแตกต่างในช่วงการผลิตคำ ระหว่างกลุ่มไม่เด่นชัดมากไปกว่าความแตกต่างแบบสุ่ม ข้างในแต่ละกลุ่ม H1:
ความแตกต่างในปริมาณการผลิตคำ ระหว่างกลุ่มมีความเด่นชัดมากกว่าความแตกต่างแบบสุ่ม ข้างในแต่ละกลุ่ม โดยใช้ค่าทดลองที่แสดงในตาราง 1 เราจะกำหนดค่าบางอย่างที่จำเป็นในการคำนวณเกณฑ์ F การคำนวณปริมาณหลักสำหรับการวิเคราะห์ความแปรปรวนทางเดียวแสดงไว้ในตาราง: ตารางที่ 2 ตารางที่ 3 ลำดับการดำเนินการในการวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้องกัน มักพบในตารางนี้และตารางต่อๆ ไป การกำหนด SS เป็นตัวย่อของ "ผลรวมของกำลังสอง" คำย่อนี้มักใช้ในแหล่งข้อมูลที่แปล เอสเอส ข้อเท็จจริงหมายถึงความแปรปรวนของลักษณะเนื่องจากการกระทำของปัจจัยที่กำลังศึกษา เอสเอส โดยทั่วไป- ความแปรปรวนทั่วไปของลักษณะ ส ซี.เอ.-ความแปรปรวนเนื่องจากปัจจัยที่ไม่สามารถนับได้ ความแปรปรวน "สุ่ม" หรือ "คงเหลือ" นางสาว- "ค่าเฉลี่ยกำลังสอง" หรือค่าคาดหวังทางคณิตศาสตร์ของผลรวมของกำลังสอง ซึ่งเป็นค่าเฉลี่ยของ SS ที่สอดคล้องกัน df
- จำนวนระดับความเป็นอิสระซึ่งเมื่อพิจารณาเกณฑ์ที่ไม่ใช่พารามิเตอร์เราจะแสดงด้วยตัวอักษรกรีก โวลต์. สรุป: H 0 ถูกปฏิเสธ H 1 ได้รับการยอมรับ ความแตกต่างในการจำคำระหว่างกลุ่มมากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม (α=0.05) ดังนั้นความเร็วในการนำเสนอคำจึงส่งผลต่อปริมาณการทำซ้ำ ตัวอย่างของการแก้ปัญหาใน Excel แสดงไว้ด้านล่าง: ข้อมูลเริ่มต้น: การใช้คำสั่ง: เครื่องมือ -> การวิเคราะห์ข้อมูล -> การวิเคราะห์ความแปรปรวนแบบทางเดียว เราได้รับผลลัพธ์ดังต่อไปนี้:
(8)
คุณลักษณะที่มีประสิทธิผลคือคุณลักษณะที่เปลี่ยนแปลงภายใต้อิทธิพลของคุณลักษณะปัจจัย
วิธีการนี้ใช้ในการวิเคราะห์ความแปรปรวนแบบทางเดียว โดยความแปรปรวนรวมของค่าที่สังเกตได้ทั้งหมดจะถูกแบ่งออกเป็นความแปรปรวนภายในแต่ละกลุ่ม และความแปรปรวนระหว่างกลุ่ม
ขึ้นอยู่กับการวิเคราะห์สหสัมพันธ์หรือการถดถอยที่ใช้ในการวิเคราะห์หลายตัวแปร
__________________________________
* ความน่าจะเป็นที่ยอมรับได้สูงสุดในการปฏิเสธสมมติฐานว่างที่แท้จริงเรียกว่าระดับนัยสำคัญ และกำหนดให้ α = 0.05ตัวบ่งชี้ผลลัพธ์ (จำนวนวันที่นอนโดยเฉลี่ย)
ปัจจัยสาเหตุที่ทำให้เกิดโรคปอดบวม
A1
A2
A3
H1
H2
H1
H2
H1
H2
ม = 14 วัน
โดยที่ N คือผลรวมของจำนวนการสังเกตสำหรับการไล่ระดับทั้งหมดของคุณลักษณะแฟคเตอร์ I (Σn ตามกลุ่ม)
ข้อเท็จจริง - การกระจายแบบแฟคทอเรียล (ระหว่างกลุ่ม) กำหนดลักษณะการแพร่กระจายของค่าเฉลี่ยกลุ่มจากค่าเฉลี่ยโดยรวม
ง. พักผ่อน - ความแปรปรวนที่เหลือ (ภายในกลุ่ม) กำหนดลักษณะการกระจายตัวของตัวแปรภายในกลุ่ม
F - การทดสอบของฟิชเชอร์;
เอฟเซนต์ - ค่าตาราง (ดูภาคผนวก 1)
σ 2 ข้อเท็จจริง, σ 2 ที่เหลือ - ค่าเบี่ยงเบนแฟคทอเรียลและค่าตกค้าง (จากภาษาละติน de - จาก, ผ่าน - ถนน) - ค่าเบี่ยงเบนจากเส้นกึ่งกลางกำหนดโดยสูตร:
r คือจำนวนการไล่ระดับของคุณลักษณะแฟคเตอร์
โวลต์ 2 = ยังไม่มีข้อความ - 1
ยืนยันหรือหักล้างสมมติฐานว่างโดยใช้การวิเคราะห์ความแปรปรวนทางเดียว:
เพื่อกำหนดอิทธิพลของปัจจัย (ประสบการณ์การทำงาน) ต่อผลลัพธ์ (อัตราการบาดเจ็บ)
1
2
3
4
5
6
7
8
9
10
11
6
6,0
13,4
5,1
10,9
4,8
9,8
4,5
9,2
4,4
8,8
4,3
8,5
4,2
8,3
4,1
8,1
4,1
8,0
4,1
7,9
4,0
7,8
7
5,6
12,3
4,7
9,6
4,4
8,5
4,1
7,9
4,0
7,5
3,9
7,2
3,8
7,0
3,7
6,8
3,7
6,7
3,6
6,6
3,6
6,5
8
5,3
11,3
4,6
8,7
4,1
7,6
3,8
7,0
3,7
6,6
3,6
6,4
3,5
6,2
3,4
6,0
3,4
5,9
3,3
5,8
3,1
5,7
9
5,1
10,6
4,3
8,0
3,6
7,0
3,6
6,4
3,5
6,1
3,4
5,8
3,3
5,6
3,2
5,5
3,2
5,4
3,1
5,3
3,1
5,2
10
5,0
10,0
4,1
7,9
3,7
6,6
3,5
6,0
3,3
5,6
3,2
5,4
3,1
5,2
3,1
5,1
3,0
5,0
2,9
4,5
2,9
4,8
11
4,8
9,7
4,0
7,2
3,6
6,2
3,6
5,7
3,2
5,3
3,1
5,1
3,0
4,9
3,0
4,7
2,9
4,6
2,9
4,5
2,8
4,5
12
4,8
9,3
3,9
6,9
3,5
6,0
3,3
5,4
3,1
5,1
3,0
4,7
2,9
4,7
2,9
4,5
2,8
4,4
2,8
4,3
2,7
4,2
13
4,7
9,1
3,8
6,7
3,4
5,7
3,2
5,2
3,0
4,9
2,9
4,6
2,8
4,4
2,8
4,3
2,7
4,2
2,7
4,1
2,6
4,0
14
4,6
8,9
3,7
6,5
3,3
5,6
3,1
5,0
3,0
4,7
2,9
4,5
2,8
4,3
2,7
4,1
2,7
4,0
2,6
3,9
2,6
3,9
15
4,5
8,7
3,7
6,4
3,3
5,4
3,1
4,9
2,9
4,6
2,8
4,3
2,7
4,1
2,6
4,0
2,6
3,9
2,5
3,8
2,5
3,7
16
4,5
8,5
3,6
6,2
3,2
5,3
3,0
4,8
2,9
4,4
2,7
4,2
2,7
4,0
2,6
3,9
2,5
3,8
2,5
3,7
2,5
3,6
17
4,5
8,4
3,6
6,1
3,2
5,2
3,0
4,7
2,8
4,3
2,7
4,1
2,6
3,9
2,6
3,8
2,5
3,8
2,5
3,6
2,4
3,5
18
4,4
8,3
3,5
6,0
3,2
5,1
2,9
4,6
2,8
4,2
2,7
4,0
2,6
3,8
2,5
3,7
2,7
3,6
2,4
3,6
3,4
3,5
19
4,4
8,2
3,5
5,9
3,1
5,0
2,9
4,5
2,7
4,2
2,6
3,9
2,5
3,8
2,5
3,6
2,4
3,5
2,4
3,4
2,3
3,4
20
4,3
8,1
3,5
5,8
3,1
4,9
2,9
4,4
2,7
4,1
2,6
3,9
2,5
3,7
2,4
3,6
2,4
3,4
2,3
3,4
2,3
3,3
.
รวมถึงการประมาณค่าความแปรปรวนด้วย ดังนั้นวิธีนี้จึงอยู่ในหมวดหมู่ของพารามิเตอร์
กลุ่ม
เราก็ขอแนะนำเช่นกัน