การวิเคราะห์ความแปรปรวนของข้อมูลการทดลอง การวิเคราะห์ความแปรปรวนหลายตัวแปร การออกแบบมาตรการซ้ำ

นักสถิติวิเคราะห์

7.1 การวิเคราะห์ความแปรปรวน. 2

ในวิธีการเวอร์ชันนี้ ตัวอย่างที่แตกต่างกันของวัตถุจะได้รับอิทธิพลของการไล่สีแต่ละระดับ อย่างน้อยจะต้องมีการไล่ระดับของแฟคเตอร์ สาม.

ตัวอย่างที่ 1กลุ่มวิชาที่แตกต่างกันสามกลุ่มจากหกวิชาได้รับรายการคำศัพท์สิบคำ กลุ่มแรกนำเสนอคำด้วยความเร็วต่ำ - 1 คำต่อ 5 วินาที กลุ่มที่สองด้วยความเร็วเฉลี่ย - 1 คำต่อ 2 วินาที และกลุ่มที่สามด้วยความเร็วสูง - 1 คำต่อวินาที คาดว่าประสิทธิภาพในการสืบพันธุ์จะขึ้นอยู่กับความเร็วของการนำเสนอคำ ผลลัพธ์แสดงไว้ในตาราง 1.

ตารางที่ 1. จำนวนคำที่ทำซ้ำ (โดยเจ. Greene, MD "Olivera, 1989, หน้า 99)

เรื่องเลขที่

กลุ่มที่ 1 ความเร็วต่ำ

กลุ่มที่ 2 ความเร็วปานกลาง

กลุ่มที่ 3 ความเร็วสูง

จำนวนเงิน

เฉลี่ย

7,17

6,17

4,00

จำนวนเงินทั้งหมด

การวิเคราะห์ความแปรปรวนแบบตัวแปรเดียวทำให้คุณสามารถทดสอบสมมติฐานได้:

เอช 0 : ความแตกต่างในปริมาณการผลิตคำ ระหว่างกลุ่มไม่เด่นชัดมากไปกว่าความแตกต่างแบบสุ่ม ข้างในแต่ละกลุ่ม

เอช 1 : ความแตกต่างในปริมาณการผลิตคำ ระหว่างกลุ่มมีความเด่นชัดมากกว่าความแตกต่างแบบสุ่ม ข้างในแต่ละกลุ่ม

ลำดับการดำเนินการในการวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้อง:

1. มานับกัน ข้อเท็จจริงของเอสเอส- ความแปรปรวนของลักษณะเนื่องจากการกระทำของปัจจัยที่กำลังศึกษา การกำหนดทั่วไปเอสเอส - อักษรย่อของ "ผลรวมของกำลังสอง" (ผลรวมของกำลังสอง ). คำย่อนี้มักใช้ในแหล่งแปล (ดูตัวอย่าง: Glass J., Stanley J., 1976)

,(1)

โดยที่ T c คือผลรวมของค่าแต่ละค่าสำหรับแต่ละเงื่อนไข สำหรับตัวอย่างของเรา 43, 37, 24 (ดูตารางที่ 1);

с – จำนวนเงื่อนไข (การไล่ระดับ) ของปัจจัย (=3);

n – จำนวนวิชาในแต่ละกลุ่ม (=6)

เอ็น – จำนวนรวมของแต่ละค่า (=18)

กำลังสองของผลรวมของแต่ละค่า (=104 2 =10816)

สังเกตความแตกต่างระหว่าง โดยที่ค่าแต่ละค่าทั้งหมดจะถูกยกกำลังสองก่อนแล้วจึงรวมเข้าด้วยกัน และ โดยที่ค่าแต่ละค่าจะถูกรวมเข้าด้วยกันก่อนเพื่อให้ได้ผลรวมทั้งหมด จากนั้นผลรวมนี้จะถูกยกกำลังสอง

เมื่อใช้สูตร (1) เมื่อคำนวณความแปรปรวนที่แท้จริงของลักษณะแล้วเราได้รับ:

2. มานับกัน เอสเอสทั่วไป– ความแปรปรวนทั่วไปของลักษณะ:


(2)

3. คำนวณค่าสุ่ม (คงเหลือ)เอสเอส สลเกิดจากปัจจัยที่ไม่สามารถระบุได้:

(3)

4.จำนวนองศาอิสระเท่ากับ:

=3-1=2(4)

5."จัตุรัสกลาง"หรือค่าเฉลี่ยของผลรวมของกำลังสอง SS ที่สอดคล้องกันเท่ากับ:

(5)

6.ความหมาย สถิติเกณฑ์ เอฟเอ็มคำนวณโดยใช้สูตร:

(6)

สำหรับตัวอย่างของเราเรามี : F em =15.72/2.11=7.45

7.กำหนด เอฟคริติคอลตามตารางสถิติ การใช้งาน 3สำหรับ df 1 =k 1 =2 และ df 2 =k 2 =15 ค่าตารางของสถิติคือ 3.68

8. ถ้า เอฟเอ็ม< F วิกฤต ดังนั้นสมมุติฐานว่างจะได้รับการยอมรับ มิฉะนั้นจะยอมรับสมมติฐานทางเลือก สำหรับตัวอย่างของเรา เอฟเอ็ม> F crit (7.45>3.68) ดังนั้นหน้า

บทสรุป:ความแตกต่างในการจำคำระหว่างกลุ่มจะเด่นชัดมากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม (หน้า<0,05). Т.о. скорость предъявления слов влияет на объем их воспроизведения.

7.1.2 การวิเคราะห์ความแปรปรวนสำหรับตัวอย่างที่เกี่ยวข้อง

วิธีการวิเคราะห์ความแปรปรวนสำหรับตัวอย่างที่เกี่ยวข้องจะใช้ในกรณีที่อิทธิพลของการไล่ระดับที่แตกต่างกันของปัจจัยหรือเงื่อนไขที่แตกต่างกัน ตัวอย่างวิชาเดียวกันอย่างน้อยจะต้องมีการไล่ระดับของแฟคเตอร์ สาม.

ในกรณีนี้ ความแตกต่างระหว่างวิชาต่างๆ อาจเป็นแหล่งที่มาของความแตกต่างโดยอิสระ การวิเคราะห์ความแปรปรวนแบบทางเดียวสำหรับตัวอย่างที่เกี่ยวข้องจะช่วยให้เราสามารถระบุได้ว่าอะไรมีค่ามากกว่า - แนวโน้มที่แสดงโดยกราฟการเปลี่ยนแปลงปัจจัย หรือความแตกต่างระหว่างบุคคลระหว่างวิชาต่างๆ ปัจจัยของความแตกต่างส่วนบุคคลอาจมีนัยสำคัญมากกว่าปัจจัยของการเปลี่ยนแปลงเงื่อนไขการทดลอง

ตัวอย่างที่ 2มีการตรวจสอบกลุ่ม 5 วิชาโดยใช้งานทดลองสามงานที่มีจุดมุ่งหมายเพื่อศึกษาความเพียรทางปัญญา (Sidorenko E.V., 1984) แต่ละเรื่องจะถูกนำเสนอเป็นรายบุคคลด้วยแอนนาแกรมที่เหมือนกันสามตัวติดต่อกัน: ตัวอักษรสี่ตัว, ตัวอักษรห้าตัว และตัวอักษรหกตัว เป็นไปได้ไหมที่จะสรุปว่าตัวประกอบความยาวของแอนนาแกรมมีอิทธิพลต่อระยะเวลาของการพยายามแก้ไขมัน

ตารางที่ 2. ระยะเวลาของการแก้แอนนาแกรม (วินาที)

รหัสหัวเรื่อง

เงื่อนไขที่ 1. แอนนาแกรมสี่ตัวอักษร

เงื่อนไขที่ 2 แอนนาแกรมห้าตัวอักษร

เงื่อนไขที่ 3 แอนนาแกรมหกตัวอักษร

จำนวนตามวิชา

จำนวนเงิน

1244

1342

มากำหนดสมมติฐานกัน ในกรณีนี้ มีสมมติฐานสองชุด

ชุดเอ.

H 0 (A): ความแตกต่างในช่วงเวลาของการพยายามแก้แอนนาแกรมที่มีความยาวต่างกันนั้นไม่เด่นชัดมากไปกว่าความแตกต่างเนื่องจากเหตุผลแบบสุ่ม

H 1 (A): ความแตกต่างในช่วงเวลาของการพยายามแก้แอนนาแกรมที่มีความยาวต่างกันนั้นเด่นชัดมากกว่าความแตกต่างเนื่องจากเหตุผลแบบสุ่ม

ชุดบี

N เกี่ยวกับ (B): ความแตกต่างระหว่างบุคคลระหว่างอาสาสมัครไม่เด่นชัดมากไปกว่าความแตกต่างอันเนื่องมาจากสาเหตุที่สุ่ม

H 1 (B): ความแตกต่างระหว่างบุคคลระหว่างวิชาจะเด่นชัดมากกว่าความแตกต่างเนื่องจากเหตุผลแบบสุ่ม

ลำดับการดำเนินการในการวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่เกี่ยวข้อง:

1. มานับกัน ข้อเท็จจริงของเอสเอส- ความแปรปรวนของลักษณะเนื่องจากการกระทำของปัจจัยที่ศึกษาตามสูตร (1)

โดยที่ T c คือผลรวมของค่าแต่ละค่าสำหรับแต่ละเงื่อนไข (คอลัมน์) สำหรับตัวอย่างของเรา 51, 1244, 47 (ดูตารางที่ 2); с – จำนวนเงื่อนไข (การไล่ระดับ) ของปัจจัย (=3); n – จำนวนวิชาในแต่ละกลุ่ม (=5)เอ็น – จำนวนรวมของแต่ละค่า (=15) - กำลังสองของผลรวมของแต่ละค่า (=1342 2)

2. มานับกัน เอสเอสไอเอสพี- ความแปรปรวนของเครื่องหมายเนื่องจากค่านิยมส่วนบุคคลของวิชา

โดยที่ T และคือผลรวมของค่าแต่ละค่าสำหรับแต่ละวิชา สำหรับตัวอย่างของเรา 247, 631, 100, 181, 183 (ดูตารางที่ 2) с – จำนวนเงื่อนไข (การไล่ระดับ) ของปัจจัย (=3);เอ็น – จำนวนรวมของแต่ละค่า (=15)

3. มานับกัน เอสเอสทั่วไป– ความแปรปรวนทั่วไปของลักษณะตามสูตร (2):


4. คำนวณค่าสุ่ม (คงเหลือ)เอสเอส สลเกิดจากปัจจัยที่ไม่สามารถนับได้ตามสูตร (3):

5. จำนวนองศาอิสระเท่ากับ (4):

; ; ;

6. "จัตุรัสกลาง"หรือ ความคาดหวังทางคณิตศาสตร์ของผลรวมของกำลังสองค่าเฉลี่ยของผลรวมของกำลังสอง SS ที่สอดคล้องกันเท่ากับ (5):

;

7. ค่าสถิติเกณฑ์ เอฟเอ็มคำนวณโดยใช้สูตร (6):

;

8. เรามาพิจารณา F crit จากตารางสถิติของภาคผนวก 3 สำหรับ df 1 =k 1 =2 และ df 2 =k 2 =8 ค่าตารางของสถิติ F crit_fact =4.46 และสำหรับ df 3 =k 3 =4 และ df 2 =k 2 = 8 F crit_exp =3.84

9. ฉ em_fact> F Critical_fact (6.872>4.46) ดังนั้นหน้า ยอมรับสมมติฐานทางเลือกแล้ว

10. F em_use < F крит_исп (1,054<3,84), следовательно пสมมติฐานว่างเป็นที่ยอมรับ

บทสรุป:ความแตกต่างในปริมาณของการสร้างคำในเงื่อนไขที่แตกต่างกันนั้นเด่นชัดมากกว่าความแตกต่างเนื่องจากเหตุผลแบบสุ่ม (น<0,05).Индивидуальные различия между испытуе­мыми являются не более выраженными, чем различия, обусловленные случайными причинами.

7.2 การวิเคราะห์สหสัมพันธ์

7.2.1 แนวคิดเรื่องความสัมพันธ์

นักวิจัยมักสนใจว่าตัวแปรสองตัวขึ้นไปมีความสัมพันธ์กันอย่างไรในตัวอย่างหนึ่งหรือหลายตัวอย่างที่กำลังศึกษาอยู่ ตัวอย่างเช่น นักเรียนที่มีความวิตกกังวลในระดับสูงสามารถแสดงให้เห็นถึงผลสัมฤทธิ์ทางการเรียนที่มั่นคง หรือระยะเวลาที่ครูทำงานในโรงเรียนที่เกี่ยวข้องกับขนาดของเงินเดือน หรือสิ่งที่เกี่ยวข้องกับระดับการพัฒนาจิตใจของนักเรียนมากกว่า - ของพวกเขา การแสดงทางคณิตศาสตร์หรือวรรณคดี ฯลฯ .?

การพึ่งพาระหว่างตัวแปรประเภทนี้เรียกว่าสหสัมพันธ์หรือสหสัมพันธ์ ความสัมพันธ์ การเชื่อมต่อ- นี่คือการเปลี่ยนแปลงที่มีการประสานงานในสองลักษณะ ซึ่งสะท้อนถึงความจริงที่ว่าความแปรปรวนของลักษณะหนึ่งนั้นสอดคล้องกับความแปรปรวนของอีกลักษณะหนึ่ง

ตัวอย่างเช่น เป็นที่ทราบกันดีว่าโดยเฉลี่ยแล้วมีความสัมพันธ์เชิงบวกระหว่างส่วนสูงของคนกับน้ำหนักของพวกเขา และยิ่งส่วนสูงเท่าไร น้ำหนักของบุคคลก็จะยิ่งมากขึ้นเท่านั้น อย่างไรก็ตาม มีข้อยกเว้นสำหรับกฎนี้ เมื่อคนค่อนข้างเตี้ยมีน้ำหนักเกิน และในทางกลับกัน คนที่มีรูปร่างผอมบางที่มีรูปร่างสูงจะมีน้ำหนักน้อย สาเหตุของข้อยกเว้นดังกล่าวก็คือ สัญญาณทางชีววิทยา สรีรวิทยา หรือจิตวิทยาแต่ละรายการนั้นถูกกำหนดโดยอิทธิพลของปัจจัยหลายประการ เช่น สิ่งแวดล้อม พันธุกรรม สังคม สิ่งแวดล้อม ฯลฯ

การเชื่อมต่อสหสัมพันธ์คือการเปลี่ยนแปลงความน่าจะเป็นที่สามารถศึกษาได้เฉพาะกับตัวอย่างที่เป็นตัวแทนโดยใช้วิธีสถิติทางคณิตศาสตร์เท่านั้น “ ทั้งสองเงื่อนไข” E.V. เขียน ซิโดเรนโก - การเชื่อมต่อสหสัมพันธ์และการพึ่งพาสหสัมพันธ์- มักใช้เป็นคำพ้องความหมาย การพึ่งพาหมายถึงอิทธิพล การเชื่อมต่อ - การเปลี่ยนแปลงที่มีการประสานงานใด ๆ ที่สามารถอธิบายได้ด้วยเหตุผลหลายร้อยประการ การเชื่อมโยงความสัมพันธ์ไม่สามารถถือเป็นหลักฐานของความสัมพันธ์ระหว่างเหตุและผลได้ เพียงแต่บ่งชี้ว่าการเปลี่ยนแปลงในลักษณะหนึ่งมักจะมาพร้อมกับการเปลี่ยนแปลงบางอย่างในอีกลักษณะหนึ่งด้วย

การพึ่งพาสหสัมพันธ์ - สิ่งเหล่านี้คือการเปลี่ยนแปลงที่แนะนำค่าของคุณลักษณะหนึ่งไปสู่ความน่าจะเป็นของการปรากฏตัวของค่าที่แตกต่างกันของคุณลักษณะอื่น (E.V. Sidorenko, 2000)

งานวิเคราะห์ความสัมพันธ์มุ่งเน้นไปที่การกำหนดทิศทาง (บวกหรือลบ) และรูปแบบ (เชิงเส้นและไม่เชิงเส้น) ของความสัมพันธ์ระหว่างคุณลักษณะที่แตกต่างกัน การวัดความใกล้ชิด และสุดท้ายคือการตรวจสอบระดับนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้รับ

ความสัมพันธ์แตกต่างกันไป ในรูปแบบ ทิศทาง และระดับ (กำลัง)

ตามรูปร่างความสัมพันธ์สหสัมพันธ์อาจเป็นแบบเส้นตรงหรือแบบโค้งก็ได้ ตัวอย่างเช่น ความสัมพันธ์ระหว่างจำนวนเซสชันการฝึกอบรมบนเครื่องจำลองและจำนวนปัญหาที่แก้ไขอย่างถูกต้องในเซสชันการควบคุมอาจเป็นเรื่องตรงไปตรงมา ตัวอย่างเช่น ความสัมพันธ์ระหว่างระดับแรงจูงใจและประสิทธิผลของงานอาจเป็นเส้นโค้ง (ดูรูปที่ 1) เมื่อแรงจูงใจเพิ่มขึ้น ประสิทธิผลของการทำงานให้เสร็จสิ้นก่อนจะเพิ่มขึ้น จากนั้นจึงได้แรงจูงใจในระดับที่เหมาะสมที่สุด ซึ่งสอดคล้องกับประสิทธิผลสูงสุดของการทำงานให้สำเร็จ แรงจูงใจที่เพิ่มขึ้นอีกจะมาพร้อมกับประสิทธิภาพที่ลดลง

รูปที่ 1. ความสัมพันธ์ระหว่างประสิทธิผลของการแก้ปัญหา

และความเข้มแข็งของแนวโน้มการสร้างแรงบันดาลใจ (ตาม J. W. A t k ในลูกชาย, 1974, หน้า 200)

ต่อความสัมพันธ์อาจเป็นค่าบวก (“โดยตรง”) และค่าลบ (“ผกผัน”) ด้วยความสัมพันธ์เชิงเส้นเชิงบวก ค่าที่สูงกว่าของคุณลักษณะหนึ่งจะสอดคล้องกับค่าที่สูงกว่าของอีกคุณลักษณะหนึ่ง และค่าที่ต่ำกว่าของคุณลักษณะหนึ่งจะสอดคล้องกับค่าที่ต่ำของคุณลักษณะอื่น ด้วยความสัมพันธ์เชิงลบ ความสัมพันธ์จะกลับกัน ด้วยความสัมพันธ์เชิงบวก ค่าสัมประสิทธิ์สหสัมพันธ์จะมีเครื่องหมายบวก เป็นต้นร =+0.207ที่มีความสัมพันธ์เชิงลบ - เช่นเครื่องหมายลบอาร์ = -0.207.

องศา ความแข็งแกร่ง หรือความรัดกุม การเชื่อมต่อความสัมพันธ์ถูกกำหนดโดยค่าของสัมประสิทธิ์สหสัมพันธ์

ความแรงของการเชื่อมต่อไม่ได้ขึ้นอยู่กับทิศทางและถูกกำหนดโดยค่าสัมประสิทธิ์สหสัมพันธ์

ค่าสัมประสิทธิ์สหสัมพันธ์สูงสุดที่เป็นไปได้ร =1.00; ขั้นต่ำ r = 0.00.

การจำแนกความสัมพันธ์ทั่วไป (ตาม Ivanter E.V., Korosov A.V., 1992):

แข็งแกร่ง, หรือ แน่นด้วยค่าสัมประสิทธิ์สหสัมพันธ์ร >0.70;

เฉลี่ยที่ 0,50< ร<0,69 ;

ปานกลางที่ 0,30< ร<0,49 ;

อ่อนแอที่ 0,20< ร<0,29 ;

อ่อนแอมากที่ ร<0,19 .

ตัวแปร X และ Y สามารถวัดได้ในระดับที่แตกต่างกัน ซึ่งเป็นตัวกำหนดทางเลือกของสัมประสิทธิ์สหสัมพันธ์ที่เหมาะสม (ดูตารางที่ 3):

ตารางที่ 3 การใช้ค่าสัมประสิทธิ์สหสัมพันธ์ขึ้นอยู่กับประเภทของตัวแปร

ประเภทสเกล

การวัดการเชื่อมต่อ

ตัวแปร X

ตัวแปร Y

ช่วงเวลาหรือความสัมพันธ์

ช่วงเวลาหรือความสัมพันธ์

สัมประสิทธิ์เพียร์สัน

อันดับ ช่วงเวลา หรืออัตราส่วน

ค่าสัมประสิทธิ์สเปียร์แมน

จัดอันดับ

จัดอันดับ

สัมประสิทธิ์เคนดัลล์

ขั้ว

ขั้ว

สัมประสิทธิ์ "เจ"

ขั้ว

จัดอันดับ

อันดับ-biserial

ขั้ว

ช่วงเวลาหรือความสัมพันธ์

ไบซีเรียล

7.2.2 สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน

คำว่า "ความสัมพันธ์" ถูกนำมาใช้ในวิทยาศาสตร์โดยฟรานซิส กัลตัน นักธรรมชาติวิทยาชาวอังกฤษผู้มีชื่อเสียงในปี 1886 อย่างไรก็ตาม สูตรที่แน่นอนในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ได้รับการพัฒนาโดยนักเรียนของเขา คาร์ล เพียร์สัน

ค่าสัมประสิทธิ์แสดงถึงการมีอยู่ของความสัมพันธ์เชิงเส้นระหว่างคุณลักษณะเท่านั้น ซึ่งโดยปกติจะแสดงด้วยสัญลักษณ์ X และ Y สูตรสำหรับการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ถูกสร้างขึ้นในลักษณะที่ว่าหากความสัมพันธ์ระหว่างคุณลักษณะเป็นแบบเส้นตรง ค่าสัมประสิทธิ์ของเพียร์สันจะสร้างค่าสัมประสิทธิ์สหสัมพันธ์ได้อย่างแม่นยำ ความใกล้ชิดของความสัมพันธ์นี้ ดังนั้นจึงเรียกอีกอย่างว่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สัน หากการเชื่อมต่อระหว่างตัวแปร X และย ไม่เป็นเส้นตรง เพียร์สันจึงเสนอสิ่งที่เรียกว่าความสัมพันธ์สหสัมพันธ์เพื่อประเมินความใกล้ชิดของการเชื่อมต่อนี้

ค่าของสัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สันต้องไม่เกิน +1 และน้อยกว่า -1 ตัวเลขสองตัวนี้คือ +1 และ -1 เป็นขอบเขตของค่าสัมประสิทธิ์สหสัมพันธ์ เมื่อผลการคำนวณมีค่ามากกว่า +1 หรือน้อยกว่า -1 แสดงว่าการคำนวณเกิดข้อผิดพลาด

สัญลักษณ์ของค่าสัมประสิทธิ์สหสัมพันธ์มีความสำคัญมากในการตีความความสัมพันธ์ที่เกิดขึ้น ให้เราเน้นอีกครั้งว่าหากเครื่องหมายของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นเป็นบวก ความสัมพันธ์ระหว่างคุณลักษณะที่สัมพันธ์กันก็คือค่าที่มากกว่าของคุณลักษณะหนึ่ง (ตัวแปร) จะสอดคล้องกับค่าที่มากกว่าของคุณลักษณะอื่น (ตัวแปรอื่น) กล่าวอีกนัยหนึ่ง หากตัวบ่งชี้ตัวหนึ่ง (ตัวแปร) เพิ่มขึ้น ตัวบ่งชี้อื่น (ตัวแปร) จะเพิ่มขึ้นตามไปด้วย การพึ่งพาอาศัยกันนี้เรียกว่าการพึ่งพาตามสัดส่วนโดยตรง

หากได้รับเครื่องหมายลบ ค่าที่มากกว่าของคุณสมบัติหนึ่งจะสอดคล้องกับค่าที่น้อยกว่าของคุณสมบัติอื่น กล่าวอีกนัยหนึ่ง หากมีเครื่องหมายลบ การเพิ่มขึ้นของตัวแปรหนึ่ง (เครื่องหมาย ค่า) จะสอดคล้องกับการลดลงของตัวแปรอื่น การพึ่งพาอาศัยกันนี้เรียกว่าการพึ่งพาตามสัดส่วนผกผัน

โดยทั่วไปสูตรในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์คือ:

(7)

ที่ไหน เอ็กซ์ ฉัน- ค่าที่ใช้ในตัวอย่าง X

ใช่แล้ว- ค่าที่ยอมรับในตัวอย่าง Y;

ค่าเฉลี่ยสำหรับ X - ค่าเฉลี่ยสำหรับ Y

การคำนวณสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันถือว่าตัวแปร X และ Y มีการกระจาย ดี.

สูตร (7) ประกอบด้วยปริมาณ เมื่อแบ่งตาม n (จำนวนค่าของตัวแปร X หรือ Y) ที่เรียกว่า ความแปรปรวนร่วม. สูตร (7) ยังถือว่าเมื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์จำนวนค่าของตัวแปร X จะเท่ากับจำนวนค่าของตัวแปรย.

จำนวนองศาความเป็นอิสระเค = n -2

ตัวอย่างที่ 3เด็กนักเรียน 1 0 คนได้รับการทดสอบการคิดเชิงภาพและวาจา เวลาเฉลี่ยในการแก้งานทดสอบวัดเป็นวินาที ผู้วิจัยมีความสนใจในคำถาม: มีความสัมพันธ์ระหว่างเวลาที่ใช้ในการแก้ไขปัญหาเหล่านี้หรือไม่? ตัวแปร X หมายถึงเวลาเฉลี่ยในการแก้ปัญหางานด้านภาพเป็นรูปเป็นร่าง และตัวแปร Y หมายถึงเวลาเฉลี่ยในการแก้ปัญหางานทดสอบด้วยวาจา

สารละลาย. ให้เรานำเสนอข้อมูลเริ่มต้นในรูปแบบของตารางที่ 4 ซึ่งมีคอลัมน์เพิ่มเติมที่จำเป็นสำหรับการคำนวณโดยใช้สูตร (7)

ตารางที่ 4

จำนวนวิชา

x

เอ็กซ์ ฉัน -

(x ผม - ) 2

ใช่ ฉัน-

(ใช่ ฉัน -) 2

16,7

278,89

51,84

120,24

13,69

17,2

295,84

63,64

7,29

51,84

19,44

68,89

14,44

31,54

59,29

7,84

21,56

0,49

46,24

4,76

10,89

17,64

13,86

10,89

51,84

23,76

68,89

10,8

116,64

89,64

68,89

18,8

353,44

156,04

ผลรวม

357

242

588,1

1007,6

416,6

เฉลี่ย

35,7

24,2

เราคำนวณค่าเชิงประจักษ์ของสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตร (7):

เรากำหนดค่าวิกฤตสำหรับค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้รับตามตารางในภาคผนวก 3 เมื่อค้นหาค่าวิกฤตสำหรับค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สันที่คำนวณได้ จำนวนองศาอิสระจะถูกคำนวณเป็น k = n – 2 = 8.

k crit = 0.72 > 0.54 ดังนั้นสมมติฐาน H 1 จึงถูกปฏิเสธและยอมรับสมมติฐานเอช 0 กล่าวอีกนัยหนึ่งความเชื่อมโยงระหว่างเวลาในการแก้ไขงานทดสอบด้วยภาพและวาจายังไม่ได้รับการพิสูจน์

7.3 การวิเคราะห์การถดถอย

นี่คือกลุ่มของวิธีการที่มุ่งเป้าไปที่การระบุและแสดงการเปลี่ยนแปลงและการพึ่งพาที่เกิดขึ้นในระบบตัวแปรสุ่มทางคณิตศาสตร์ หากระบบดังกล่าวจำลองแบบการสอน ดังนั้น ผ่านการวิเคราะห์การถดถอย ปรากฏการณ์ทางจิตวิทยาและการสอน และการพึ่งพาระหว่างสิ่งเหล่านั้นจะถูกระบุและแสดงออกมาทางคณิตศาสตร์ ลักษณะของปรากฏการณ์เหล่านี้วัดในระดับต่าง ๆ ซึ่งกำหนดข้อ จำกัด เกี่ยวกับวิธีการแสดงออกทางคณิตศาสตร์ของการเปลี่ยนแปลงและการพึ่งพาที่ครูและนักวิจัยศึกษา

วิธีการวิเคราะห์การถดถอยได้รับการออกแบบมาโดยเฉพาะสำหรับกรณีของการแจกแจงแบบปกติที่เสถียร ซึ่งการเปลี่ยนแปลงจากการทดลองหนึ่งไปอีกการทดลองหนึ่งจะปรากฏในรูปแบบของการทดลองอิสระเท่านั้น

มีการระบุปัญหาอย่างเป็นทางการต่างๆ ของการวิเคราะห์การถดถอย ซึ่งอาจเรียบง่ายหรือซับซ้อนในแง่ของการกำหนดสูตร วิธีทางคณิตศาสตร์ และความเข้มข้นของแรงงาน ให้เราแสดงรายการและพิจารณาตัวอย่างที่ดูเหมือนจะเป็นหลัก

ภารกิจแรกคือ ระบุข้อเท็จจริงของความแปรปรวน ปรากฏการณ์ที่กำลังศึกษาภายใต้เงื่อนไขบางประการ แต่ไม่ได้รับการแก้ไขอย่างชัดเจนเสมอไป ในการบรรยายครั้งก่อน เราได้แก้ไขปัญหานี้แล้วโดยใช้เกณฑ์แบบอิงพารามิเตอร์และแบบไม่มีพารามิเตอร์

ภารกิจที่สอง - ระบุแนวโน้ม เป็นการเปลี่ยนแปลงลักษณะเป็นระยะ คุณลักษณะนี้อาจหรือไม่ก็ได้ขึ้นอยู่กับตัวแปรเงื่อนไข (อาจขึ้นอยู่กับเงื่อนไขที่ผู้วิจัยไม่ทราบหรือไม่สามารถควบคุมได้) แต่สิ่งนี้ไม่สำคัญสำหรับงานที่อยู่ระหว่างการพิจารณา ซึ่งจำกัดเพียงการระบุแนวโน้มและคุณลักษณะเท่านั้น

การทดสอบสมมติฐานเกี่ยวกับการไม่มีหรือมีแนวโน้มสามารถทำได้โดยใช้เกณฑ์ Abbe . เกณฑ์แอบบีออกแบบมาเพื่อทดสอบสมมติฐานเกี่ยวกับความเท่าเทียมกันของค่าเฉลี่ยที่กำหนดไว้สำหรับ 4

ค่าเชิงประจักษ์ของเกณฑ์ Abbe คำนวณโดยสูตร:

(8)

ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่างอยู่ที่ไหน

– จำนวนค่าในตัวอย่าง

ตามเกณฑ์ สมมติฐานเรื่องความเท่าเทียมกันของค่าเฉลี่ยจะถูกปฏิเสธ (ยอมรับสมมติฐานทางเลือก) หากค่าของสถิติคือ ค่าสถิติแบบตาราง (วิกฤต) ถูกกำหนดจากตารางสำหรับเกณฑ์ q ของ Abbe ซึ่งมีตัวย่อยืมมาจากหนังสือโดย L.N. Bolysheva และ N.V. Smirnova (ดูภาคผนวก 3)

ปริมาณดังกล่าวซึ่งใช้เกณฑ์ Abbe อาจเป็นส่วนแบ่งหรือเปอร์เซ็นต์ตัวอย่าง ค่าเฉลี่ยเลขคณิต และสถิติอื่นๆ ของการแจกแจงตัวอย่าง หากปริมาณเหล่านั้นใกล้เคียงกับค่าปกติ (หรือทำให้เป็นมาตรฐานก่อนหน้านี้) ดังนั้นเกณฑ์ของ Abbe จึงสามารถนำไปใช้อย่างกว้างขวางในการวิจัยทางจิตวิทยาและการสอน ลองพิจารณาตัวอย่างการระบุแนวโน้มโดยใช้เกณฑ์ Abbe

ตัวอย่างที่ 4ในตาราง 5 แสดงพลวัตของเปอร์เซ็นต์ของนักเรียน IV หลักสูตรที่สอบผ่านภาคฤดูหนาวอย่าง “เป็นเลิศ” ตลอดระยะเวลาการทำงาน 10 ปี ในคณะของมหาวิทยาลัยแห่งหนึ่ง โดยต้องกำหนดว่า มีแนวโน้มจะมีผลการเรียนเพิ่มขึ้นหรือไม่

ตารางที่ 5. พลวัตของร้อยละของนักศึกษาดีเด่นชั้นปีที่ 4 ในช่วง 10 ปีการทำงานของคณะ

ปีการศึกษา

1995-96

10,8

1996-97

16,4

1997-98

17,4

1998-99

22,0

1999-00

23,0

2000-01

21,5

2001-02

26,1

2002-03

17,2

2003-04

27,5

2004-05

33,0

เช่น โมฆะเราทดสอบสมมติฐานเกี่ยวกับการไม่มีแนวโน้ม เช่น ความเท่าเทียมกันของเปอร์เซ็นต์

เราเฉลี่ยเปอร์เซ็นต์ที่ระบุในตาราง 5 เราพบว่า =21.5 เราคำนวณความแตกต่างระหว่างค่าที่ตามมาและค่าก่อนหน้าในตัวอย่าง จัดกำลังสองและสรุปผล:

ในทำนองเดียวกันคำนวณตัวส่วนในสูตร (8) โดยสรุปกำลังสองของความแตกต่างระหว่างการวัดแต่ละครั้งและค่าเฉลี่ยเลขคณิต:

ตอนนี้ใช้สูตร (8) เราได้รับ:

ในตารางเกณฑ์ Abbe จากภาคผนวก 3 เราพบว่าเมื่อ n = 10 และระดับนัยสำคัญ 0.05 ค่าวิกฤตจะมากกว่า 0.41 ที่เราได้รับ ดังนั้นสมมติฐานเกี่ยวกับความเท่าเทียมกันของเปอร์เซ็นต์ของ "นักเรียนดีเด่น" จะต้องเป็น ถูกปฏิเสธ และเราสามารถยอมรับสมมติฐานทางเลือกเกี่ยวกับการมีอยู่ของแนวโน้มได้

ภารกิจที่สามคือ การระบุรูปแบบที่แสดงออกมาในรูปของสมการสหสัมพันธ์ (การถดถอย).

ตัวอย่างที่ 5นักวิจัยชาวเอสโตเนีย J. Mikk ศึกษาความยากลำบากในการทำความเข้าใจข้อความ ได้สร้าง "สูตรความสามารถในการอ่าน" ซึ่งเป็นการถดถอยเชิงเส้นพหุคูณ:

ประเมินความยากในการทำความเข้าใจข้อความ

โดยที่ x 1 คือความยาวของประโยคอิสระในจำนวนอักขระที่พิมพ์

x 2 - เปอร์เซ็นต์ของคำที่ไม่คุ้นเคย

x 3 - นามธรรมของแนวคิดการทำซ้ำที่แสดงโดยคำนาม .

เมื่อเปรียบเทียบค่าสัมประสิทธิ์การถดถอยที่แสดงระดับอิทธิพลของปัจจัย เราจะเห็นว่าความยากในการทำความเข้าใจข้อความนั้นถูกกำหนดโดยความเป็นนามธรรมเป็นหลัก ความยากในการทำความเข้าใจข้อความนั้นขึ้นอยู่กับจำนวนคำที่ไม่คุ้นเคยเพียงครึ่งหนึ่ง (0.27) และในทางปฏิบัติไม่ได้ขึ้นอยู่กับความยาวของประโยคเลย

เทคนิคที่กล่าวถึงข้างต้นสำหรับการทดสอบสมมติฐานทางสถิติเกี่ยวกับความสำคัญของความแตกต่างระหว่างสองวิธีนั้นมีการใช้งานที่จำกัดในทางปฏิบัติ นี่เป็นเพราะความจริงที่ว่าเพื่อระบุผลกระทบของเงื่อนไขและปัจจัยที่เป็นไปได้ทั้งหมดต่อลักษณะที่มีประสิทธิผล การทดลองภาคสนามและในห้องปฏิบัติการตามกฎแล้วจะดำเนินการโดยใช้ไม่ใช่สองรายการ แต่ใช้ตัวอย่างจำนวนมากขึ้น (1220 หรือมากกว่า ).

บ่อยครั้งที่นักวิจัยเปรียบเทียบค่าเฉลี่ยของตัวอย่างหลาย ๆ ตัวอย่างที่รวมกันเป็นคอมเพล็กซ์เดียว ตัวอย่างเช่น เมื่อศึกษาผลกระทบของปุ๋ยประเภทต่างๆ และปริมาณต่อผลผลิตพืชผล การทดลองจะถูกทำซ้ำในเวอร์ชันต่างๆ ในกรณีเหล่านี้ การเปรียบเทียบแบบคู่จะกลายเป็นเรื่องยุ่งยาก และการวิเคราะห์ทางสถิติของคอมเพล็กซ์ทั้งหมดจำเป็นต้องใช้วิธีพิเศษ วิธีการนี้พัฒนาขึ้นในสถิติทางคณิตศาสตร์ เรียกว่าการวิเคราะห์ความแปรปรวน มันถูกใช้ครั้งแรกโดยนักสถิติชาวอังกฤษ อาร์. ฟิชเชอร์ ในการประมวลผลผลการทดลองทางการเกษตร (1938)

การวิเคราะห์ความแปรปรวนเป็นวิธีการประเมินความน่าเชื่อถือทางสถิติของการสำแดงการพึ่งพาคุณลักษณะที่มีประสิทธิผลในปัจจัยหนึ่งหรือหลายปัจจัย โดยใช้วิธีการวิเคราะห์ความแปรปรวน สมมติฐานทางสถิติจะได้รับการทดสอบเกี่ยวกับค่าเฉลี่ยในประชากรทั่วไปหลายๆ กลุ่มที่มีการแจกแจงแบบปกติ

การวิเคราะห์ความแปรปรวนเป็นหนึ่งในวิธีการหลักในการประเมินผลการทดลองทางสถิติ นอกจากนี้ยังถูกนำมาใช้มากขึ้นในการวิเคราะห์ข้อมูลทางเศรษฐกิจ การวิเคราะห์ความแปรปรวนทำให้สามารถกำหนดขอบเขตของตัวบ่งชี้ตัวอย่างของความสัมพันธ์ระหว่างคุณลักษณะผลลัพธ์และปัจจัยได้เพียงพอที่จะขยายข้อมูลที่ได้รับจากตัวอย่างไปยังประชากรทั่วไป ข้อดีของวิธีนี้คือให้ข้อสรุปที่เชื่อถือได้จากกลุ่มตัวอย่างขนาดเล็ก

โดยการศึกษาความแปรผันของคุณลักษณะที่มีประสิทธิผลภายใต้อิทธิพลของปัจจัยหนึ่งหรือหลายปัจจัยโดยใช้การวิเคราะห์ความแปรปรวน นอกเหนือจากการประมาณทั่วไปเกี่ยวกับความสำคัญของการพึ่งพาแล้ว ยังสามารถประเมินความแตกต่างในขนาดของค่าเฉลี่ยที่เกิดขึ้นได้อีกด้วย ในระดับต่างๆ ของปัจจัย และความสำคัญของปฏิสัมพันธ์ของปัจจัยต่างๆ การวิเคราะห์ความแปรปรวนใช้เพื่อศึกษาการขึ้นต่อกันของคุณลักษณะทั้งเชิงปริมาณและเชิงคุณภาพ รวมถึงการรวมกัน

สาระสำคัญของวิธีนี้คือการศึกษาทางสถิติเกี่ยวกับความน่าจะเป็นของอิทธิพลของปัจจัยหนึ่งปัจจัยขึ้นไปตลอดจนปฏิสัมพันธ์กับลักษณะผลลัพธ์ ตามนี้งานหลักสามประการได้รับการแก้ไขโดยใช้การวิเคราะห์ความแปรปรวน: 1) การประเมินทั่วไปเกี่ยวกับความสำคัญของความแตกต่างระหว่างค่าเฉลี่ยกลุ่ม; 2) การประเมินความน่าจะเป็นของการมีปฏิสัมพันธ์ระหว่างปัจจัย 3) การประเมินความสำคัญของความแตกต่างระหว่างคู่ของค่าเฉลี่ย บ่อยครั้งที่นักวิจัยต้องแก้ไขปัญหาดังกล่าวเมื่อทำการทดลองภาคสนามและสัตว์เทคนิคเมื่อมีการศึกษาอิทธิพลของปัจจัยหลายประการต่อลักษณะที่มีประสิทธิผล

รูปแบบหลักของการวิเคราะห์ความแปรปรวนประกอบด้วยการสร้างแหล่งที่มาหลักของความแปรผันในลักษณะที่มีประสิทธิผล และการกำหนดปริมาตรของการแปรผัน (ผลรวมของการเบี่ยงเบนกำลังสอง) ตามแหล่งที่มาของการก่อตัว การกำหนดจำนวนองศาอิสระที่สอดคล้องกับองค์ประกอบของความแปรปรวนทั้งหมด การคำนวณการกระจายตัวเป็นอัตราส่วนของปริมาตรของการแปรผันที่สอดคล้องกับจำนวนระดับความเป็นอิสระ การวิเคราะห์ความสัมพันธ์ระหว่างความแปรปรวน ประเมินความน่าเชื่อถือของความแตกต่างระหว่างวิธีการและข้อสรุป

แบบแผนนี้จะถูกเก็บรักษาไว้ทั้งในรูปแบบการวิเคราะห์ความแปรปรวนแบบง่าย เมื่อข้อมูลถูกจัดกลุ่มตามลักษณะเฉพาะเดียว และในแบบจำลองที่ซับซ้อน เมื่อข้อมูลถูกจัดกลุ่มตามลักษณะสองลักษณะขึ้นไป อย่างไรก็ตาม ด้วยจำนวนคุณลักษณะของกลุ่มที่เพิ่มขึ้น กระบวนการสลายความแปรปรวนทั้งหมดตามแหล่งที่มาของการก่อตัวจึงมีความซับซ้อนมากขึ้น

ตามแผนภาพหลัก การวิเคราะห์ความแปรปรวนสามารถแสดงในรูปแบบของห้าขั้นตอนตามลำดับ:

1) ความหมายและการขยายความแปรผัน

2) การกำหนดจำนวนระดับความอิสระของการแปรผัน

3) การคำนวณความแปรปรวนและอัตราส่วน

4) การวิเคราะห์ความแปรปรวนและความสัมพันธ์

5) การประเมินความสำคัญของความแตกต่างระหว่างค่าเฉลี่ยและการกำหนดข้อสรุปเพื่อทดสอบสมมติฐานที่เป็นโมฆะ

ส่วนที่ต้องใช้แรงงานมากที่สุดในการวิเคราะห์ความแปรปรวนคือขั้นตอนแรก ซึ่งก็คือการกำหนดและสลายความแปรผันตามแหล่งที่มาของการก่อตัว ลำดับการสลายตัวของปริมาตรรวมของการแปรผันถูกกล่าวถึงโดยละเอียดในบทที่ 5

พื้นฐานในการแก้ปัญหาการวิเคราะห์ความแปรปรวนคือกฎการขยายตัว (บวก) การแปรผัน ซึ่งความแปรผันรวม (ความผันผวน) ของคุณลักษณะผลลัพธ์จะแบ่งออกเป็น 2 แบบ คือ การแปรผันที่เกิดจากการกระทำของปัจจัยที่กำลังศึกษา และความแปรผันที่เกิดจากการกระทำของเหตุสุ่มนั่นก็คือ

สมมติว่าประชากรที่อยู่ระหว่างการศึกษาถูกแบ่งตามลักษณะของปัจจัยออกเป็นหลายกลุ่ม ซึ่งแต่ละกลุ่มจะมีคุณลักษณะตามค่าเฉลี่ยของลักษณะผลลัพธ์ของตัวเอง ในเวลาเดียวกัน ความแปรผันของค่าเหล่านี้สามารถอธิบายได้ด้วยเหตุผลสองประเภท: เหตุผลที่กระทำต่อสัญญาณที่มีประสิทธิผลอย่างเป็นระบบและสามารถปรับเปลี่ยนได้ในระหว่างการทดลอง และเหตุผลที่ไม่สามารถปรับเปลี่ยนได้ เห็นได้ชัดว่าความแปรผันระหว่างกลุ่ม (แฟคทอเรียลหรือเป็นระบบ) ขึ้นอยู่กับการกระทำของปัจจัยที่กำลังศึกษาเป็นหลัก และการแปรผันภายในกลุ่ม (ที่เหลือหรือสุ่ม) ขึ้นอยู่กับการกระทำของปัจจัยสุ่มเป็นหลัก

เพื่อประเมินความน่าเชื่อถือของความแตกต่างระหว่างค่าเฉลี่ยกลุ่ม จำเป็นต้องพิจารณาความแปรผันระหว่างกลุ่มและภายในกลุ่ม หากความแปรผันระหว่างกลุ่ม (แฟคทอเรียล) เกินกว่าความแปรผันภายในกลุ่ม (สารตกค้าง) อย่างมีนัยสำคัญ ปัจจัยนั้นมีอิทธิพลต่อลักษณะผลลัพธ์ โดยเปลี่ยนค่าของค่าเฉลี่ยกลุ่มอย่างมีนัยสำคัญ แต่คำถามก็เกิดขึ้น อะไรคือความสัมพันธ์ระหว่างกลุ่มระหว่างกลุ่มและกลุ่มภายในที่ถือว่าเพียงพอที่จะสรุปความน่าเชื่อถือ (ความสำคัญ) ของความแตกต่างระหว่างค่าเฉลี่ยของกลุ่ม

เพื่อประเมินความสำคัญของความแตกต่างระหว่างค่าเฉลี่ยและกำหนดข้อสรุปสำหรับการทดสอบสมมติฐานว่าง (H0:x1 = x2 =... = xn) ในการวิเคราะห์ความแปรปรวน จะใช้มาตรฐานประเภทหนึ่ง - เกณฑ์ G ซึ่งเป็นกฎการกระจายของ ซึ่งก่อตั้งโดยอาร์. ฟิชเชอร์ เกณฑ์นี้คืออัตราส่วนของความแปรปรวนสองค่า: แฟกทอเรียล ซึ่งเกิดจากการกระทำของปัจจัยที่กำลังศึกษา และค่าคงเหลือ เนื่องจากการกระทำของสาเหตุสุ่ม:

ความสัมพันธ์การกระจายตัว Γ = £>u : นักสถิติชาวอเมริกัน Snedecor เสนอให้ระบุ £*2 ด้วยตัวอักษร G เพื่อเป็นเกียรติแก่ R. Fisher ผู้ประดิษฐ์การวิเคราะห์ความแปรปรวน

ความแปรปรวน °2 io2 เป็นค่าประมาณของความแปรปรวนของประชากร หากตัวอย่างที่มีความแปรปรวน °2 °2 ถูกสร้างขึ้นจากประชากรทั่วไปกลุ่มเดียวกัน โดยที่การเปลี่ยนแปลงของค่าเป็นแบบสุ่ม ความคลาดเคลื่อนในค่า °2 °2 ก็เป็นแบบสุ่มเช่นกัน

หากการทดลองทดสอบอิทธิพลของปัจจัยหลายประการ (A, B, C ฯลฯ) ต่อลักษณะที่มีประสิทธิผลพร้อมกัน ความแปรปรวนเนื่องจากการกระทำของแต่ละรายการควรจะเทียบเคียงกับ °เช่นgP, นั่นคือ

ถ้าค่าของการกระจายตัวของแฟคเตอร์มากกว่าค่าคงเหลืออย่างมีนัยสำคัญ แฟคเตอร์จะส่งผลต่อคุณลักษณะผลลัพธ์อย่างมีนัยสำคัญและในทางกลับกัน

ในการทดลองหลายปัจจัย นอกเหนือจากการแปรผันเนื่องจากการกระทำของแต่ละปัจจัยแล้ว ยังมีความแปรผันเกือบทุกครั้งอันเนื่องมาจากปฏิสัมพันธ์ของปัจจัย ($ав: ^лс ^вс $ліс) สาระสำคัญของปฏิสัมพันธ์คือผลกระทบของปัจจัยหนึ่งเปลี่ยนแปลงอย่างมีนัยสำคัญในระดับต่างๆ ของปัจจัยที่สอง (เช่น ประสิทธิผลของคุณภาพดินในปริมาณปุ๋ยที่แตกต่างกัน)

ปฏิสัมพันธ์ของปัจจัยต่างๆ ควรได้รับการประเมินโดยการเปรียบเทียบความแปรปรวนที่สอดคล้องกัน 3 ^v.gr:

เมื่อคำนวณค่าที่แท้จริงของเกณฑ์ B ค่าความแปรปรวนก็จะยิ่งมากขึ้นในตัวเศษ ดังนั้น B > 1 แน่นอนว่ายิ่งเกณฑ์ B ยิ่งมากเท่าใด ความแตกต่างระหว่างค่าแปรปรวนก็จะยิ่งมีนัยสำคัญมากขึ้นเท่านั้น ถ้า B = 1 คำถามในการประเมินความสำคัญของความแตกต่างในความแปรปรวนจะถูกลบออก

เพื่อกำหนดขีดจำกัดของความผันผวนแบบสุ่มในอัตราส่วนของการกระจาย G. Fischer ได้พัฒนาตารางการกระจาย B พิเศษ (ภาคผนวก 4 และ 5) เกณฑ์จะสัมพันธ์กับความน่าจะเป็นและขึ้นอยู่กับจำนวนระดับความอิสระของการแปรผัน k1และ k2 ของทั้งสองเปรียบเทียบความแปรปรวน โดยทั่วไปแล้ว จะใช้ตารางสองตารางในการสรุปเกี่ยวกับค่าที่สูงมากของเกณฑ์สำหรับระดับนัยสำคัญที่ 0.05 และ 0.01 ระดับนัยสำคัญ 0.05 (หรือ 5%) หมายความว่าเฉพาะใน 5 กรณีจาก 100 เกณฑ์ B เท่านั้นที่สามารถรับค่าเท่ากับหรือสูงกว่าที่ระบุไว้ในตาราง การลดระดับนัยสำคัญจาก 0.05 เป็น 0.01 จะทำให้มูลค่าของเกณฑ์เพิ่มขึ้นระหว่างความแปรปรวนสองค่าเนื่องจากผลของเหตุผลแบบสุ่มเท่านั้น

ค่าของเกณฑ์ยังขึ้นอยู่กับจำนวนองศาความเป็นอิสระของการกระจายตัวทั้งสองที่ถูกเปรียบเทียบโดยตรงอีกด้วย หากจำนวนระดับความเป็นอิสระมีแนวโน้มที่จะเป็นอนันต์ (k-me) อัตราส่วน B สำหรับการกระจายตัวสองครั้งมีแนวโน้มที่จะเป็นเอกภาพ

ค่าตารางของเกณฑ์ B แสดงค่าสุ่มที่เป็นไปได้ของอัตราส่วนของความแปรปรวนสองค่าที่ระดับนัยสำคัญที่กำหนด และจำนวนระดับความเป็นอิสระที่สอดคล้องกันสำหรับแต่ละความแปรปรวนที่นำมาเปรียบเทียบ ตารางที่ระบุแสดงค่า B สำหรับตัวอย่างที่สร้างจากประชากรทั่วไปกลุ่มเดียวกัน โดยที่สาเหตุของการเปลี่ยนแปลงค่าเป็นเพียงการสุ่มเท่านั้น

ค่า Γ หาได้จากตาราง (ภาคผนวก 4 และ 5) ที่จุดตัดของคอลัมน์ที่เกี่ยวข้อง (จำนวนองศาอิสระสำหรับการกระจายตัวที่มากขึ้น - k1) และแถว (จำนวนองศาอิสระสำหรับการกระจายตัวน้อยลง - k2 ). ดังนั้น หากความแปรปรวนที่มากกว่า (ตัวเศษ Г) คือ k1 = 4 และความแปรปรวนที่น้อยกว่า (ตัวส่วน Г) คือ k2 = 9 ดังนั้น Г ที่ระดับนัยสำคัญ а = 0.05 จะเป็น 3.63 (ภาคผนวก 4) ดังนั้น จากสาเหตุที่สุ่ม เนื่องจากตัวอย่างมีขนาดเล็ก ความแปรปรวนของตัวอย่างหนึ่งจึงสามารถเกินความแปรปรวนของตัวอย่างที่สองได้ 3.63 เท่า ที่ระดับนัยสำคัญ 5% เมื่อระดับนัยสำคัญลดลงจาก 0.05 เป็น 0.01 ค่าตารางของเกณฑ์ G ดังที่ระบุไว้ข้างต้นจะเพิ่มขึ้น ดังนั้น ด้วยดีกรีอิสระที่เท่ากัน k1 = 4 และ k2 = 9 และ a = 0.01 ค่าที่ทำเป็นตารางของเกณฑ์ G จะเป็น 6.99 (ภาคผนวก 5)

พิจารณาขั้นตอนการกำหนดจำนวนองศาอิสระในการวิเคราะห์ความแปรปรวน จำนวนระดับความเป็นอิสระ ซึ่งสอดคล้องกับผลรวมของค่าเบี่ยงเบนกำลังสอง จะถูกแยกย่อยเป็นองค์ประกอบที่สอดคล้องกันในลักษณะเดียวกับการสลายตัวของผลรวมของค่าเบี่ยงเบนกำลังสอง (^total = No^gr + ]¥vhr) กล่าวคือ จำนวนองศาอิสระทั้งหมด (k") จะถูกแบ่งออกเป็นจำนวนองศาอิสระสำหรับรูปแบบระหว่างกลุ่มระหว่างกัน (k1) และกลุ่มภายใน (k2)

ดังนั้นหากกลุ่มตัวอย่างประกอบด้วย เอ็นการสังเกตหารด้วย กลุ่ม (จำนวนตัวเลือกการทดลอง) และ กลุ่มย่อย (จำนวนการซ้ำ) ดังนั้นจำนวนดีกรีอิสระ k จะเป็นดังนี้:

ก) สำหรับผลรวมของการเบี่ยงเบนกำลังสอง (s7zag)

b) สำหรับผลรวมระหว่างกลุ่มของการเบี่ยงเบนกำลังสอง ^m.gP)

c) สำหรับผลรวมภายในกลุ่มของการเบี่ยงเบนกำลังสอง วี v.gR)

ตามกฎสำหรับการเพิ่มรูปแบบต่างๆ:

ตัวอย่างเช่น ถ้าในการทดลอง มีรูปแบบการทดลองสี่รูปแบบเกิดขึ้น (t = 4) โดยแต่ละครั้งมีการทำซ้ำห้าครั้ง (n = 5) และจำนวนการสังเกตทั้งหมดคือ N = = o p = 4 * 5 = 20 ดังนั้นจำนวนองศาอิสระจะเท่ากับ:

เมื่อทราบผลรวมของการเบี่ยงเบนกำลังสองและจำนวนองศาอิสระ เราสามารถประมาณค่าที่เป็นกลาง (แก้ไขแล้ว) สำหรับความแปรปรวนสามค่าได้:

สมมติฐานว่าง H0 ได้รับการทดสอบโดยใช้เกณฑ์ B ในลักษณะเดียวกับการทดสอบของนักเรียน ในการตัดสินใจตรวจสอบ H0 จำเป็นต้องคำนวณค่าที่แท้จริงของเกณฑ์และเปรียบเทียบกับค่าในตาราง Ba สำหรับระดับนัยสำคัญที่ยอมรับ a และจำนวนระดับความเป็นอิสระ k1และ k2 สำหรับการกระจายตัวสองครั้ง

ถ้า Bfaq > Ba ตามระดับนัยสำคัญที่ยอมรับ เราสามารถสรุปได้ว่าความแตกต่างในความแปรปรวนตัวอย่างถูกกำหนดไม่เพียงแต่จากปัจจัยสุ่มเท่านั้น พวกเขามีความสำคัญ ในกรณีนี้ สมมติฐานว่างถูกปฏิเสธ และมีเหตุผลที่จะยืนยันว่าปัจจัยมีอิทธิพลต่อลักษณะผลลัพธ์อย่างมีนัยสำคัญ ถ้า< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

การใช้แบบจำลองการวิเคราะห์ความแปรปรวนเฉพาะนั้นขึ้นอยู่กับทั้งจำนวนปัจจัยที่กำลังศึกษาและวิธีการสุ่มตัวอย่าง

c ขึ้นอยู่กับจำนวนปัจจัยที่กำหนดความแปรผันของคุณลักษณะผลลัพธ์ ตัวอย่างสามารถสร้างขึ้นตามปัจจัยหนึ่งหรือสองปัจจัยขึ้นไป ตามนี้ การวิเคราะห์ความแปรปรวนแบ่งออกเป็นปัจจัยเดียวและหลายปัจจัย มิฉะนั้นจะเรียกว่าคอมเพล็กซ์การกระจายตัวแบบปัจจัยเดียวและหลายปัจจัย

รูปแบบการสลายตัวของความแปรผันทั้งหมดขึ้นอยู่กับการก่อตัวของกลุ่ม อาจเป็นแบบสุ่ม (การสังเกตของกลุ่มหนึ่งไม่เกี่ยวข้องกับการสังเกตของกลุ่มที่สอง) และแบบไม่สุ่ม (การสังเกตสองตัวอย่างมีความสัมพันธ์กันตามเงื่อนไขการทดลองทั่วไป) จะได้ตัวอย่างอิสระและขึ้นอยู่กับตัวอย่าง ตัวอย่างอิสระสามารถสร้างได้ทั้งจำนวนที่เท่ากันและไม่สม่ำเสมอ การก่อตัวของตัวอย่างที่ต้องพึ่งพาจะมีขนาดเท่ากัน

หากกลุ่มถูกสร้างตามลำดับแบบสุ่ม ปริมาตรรวมของการแปรผันของลักษณะผลลัพธ์จะรวมถึงแฟกทอเรียล (กลุ่มระหว่างกัน) และความแปรผันที่เหลือ การแปรผันของการทำซ้ำ นั่นคือ

ในทางปฏิบัติ ในกรณีส่วนใหญ่ จำเป็นต้องพิจารณาตัวอย่างที่ต้องพึ่งพาเมื่อเงื่อนไขสำหรับกลุ่มและกลุ่มย่อยมีความเท่าเทียมกัน ดังนั้น ในการทดลองภาคสนาม พื้นที่ทั้งหมดจะถูกแบ่งออกเป็นบล็อกต่างๆ โดยมีเงื่อนไขที่หลากหลายที่สุด ในกรณีนี้ แต่ละตัวแปรของการทดสอบจะได้รับโอกาสเท่ากันในการแสดงในทุกบล็อก ซึ่งจะทำให้เงื่อนไขสำหรับตัวแปรที่ทดสอบทั้งหมดของการทดสอบเท่ากัน วิธีสร้างการทดลองนี้เรียกว่าวิธีบล็อกแบบสุ่ม การทดลองกับสัตว์ก็ทำเช่นเดียวกัน

เมื่อประมวลผลข้อมูลเศรษฐกิจและสังคมโดยใช้วิธีการวิเคราะห์ความแปรปรวน จำเป็นต้องจำไว้ว่าเนื่องจากปัจจัยจำนวนมากและความสัมพันธ์กันของปัจจัยเหล่านั้น จึงเป็นเรื่องยากแม้จะกำหนดระดับเงื่อนไขอย่างระมัดระวังที่สุดก็ตาม ในการกำหนดระดับของวัตถุประสงค์ อิทธิพลของแต่ละปัจจัยต่อลักษณะผลลัพธ์ ดังนั้น ระดับความแปรผันที่เหลือจึงถูกกำหนดไม่เพียงแต่จากสาเหตุแบบสุ่มเท่านั้น แต่ยังพิจารณาจากปัจจัยสำคัญที่ไม่ได้นำมาพิจารณาเมื่อสร้างแบบจำลองการวิเคราะห์ความแปรปรวนด้วย ด้วยเหตุนี้ ความแปรปรวนคงเหลือที่เป็นพื้นฐานสำหรับการเปรียบเทียบบางครั้งก็ไม่เพียงพอต่อวัตถุประสงค์ มีการประเมินมูลค่าสูงเกินไปอย่างชัดเจน และไม่สามารถทำหน้าที่เป็นเกณฑ์สำหรับความสำคัญของอิทธิพลของปัจจัยต่างๆ ได้ ในเรื่องนี้ เมื่อสร้างแบบจำลองการวิเคราะห์ความแปรปรวน ปัญหาในการเลือกปัจจัยที่สำคัญที่สุดและการปรับระดับเงื่อนไขสำหรับการสำแดงการกระทำของแต่ละรายการจะมีความเกี่ยวข้อง นอกจาก. การใช้การวิเคราะห์ความแปรปรวนจะถือว่าการกระจายตัวของประชากรทางสถิติที่อยู่ในการศึกษานี้เป็นปกติหรือใกล้เคียงกับปกติ หากไม่ตรงตามเงื่อนไขนี้ ค่าประมาณที่ได้จากการวิเคราะห์ความแปรปรวนจะเกินความจริง

ในกิจกรรมภาคปฏิบัติของแพทย์เมื่อทำการวิจัยทางชีวการแพทย์ สังคมวิทยา และเชิงทดลอง จำเป็นต้องสร้างอิทธิพลของปัจจัยต่างๆ ต่อผลการศึกษาสถานะสุขภาพของประชากร เมื่อประเมินกิจกรรมทางวิชาชีพและประสิทธิผลของนวัตกรรม

มีวิธีการทางสถิติหลายวิธีที่ทำให้สามารถกำหนดความแข็งแกร่ง ทิศทาง รูปแบบของอิทธิพลของปัจจัยที่มีต่อผลลัพธ์ในประชากรทั่วไปหรือกลุ่มตัวอย่าง (การคำนวณเกณฑ์ I, การวิเคราะห์สหสัมพันธ์, การถดถอย, Χ 2 - (ความดีของเพียร์สัน - เกณฑ์ที่เหมาะสม ฯลฯ ) การวิเคราะห์การกระจายได้รับการพัฒนาและเสนอโดยนักวิทยาศาสตร์นักคณิตศาสตร์และนักพันธุศาสตร์ชาวอังกฤษ Ronald Fisher ในช่วงทศวรรษที่ 20 ของศตวรรษที่ XX

การวิเคราะห์ความแปรปรวนมักใช้ในการวิจัยทางวิทยาศาสตร์และเชิงปฏิบัติในด้านสาธารณสุขและการดูแลสุขภาพ เพื่อศึกษาอิทธิพลของปัจจัยตั้งแต่หนึ่งปัจจัยขึ้นไปต่อลักษณะผลลัพธ์ มันขึ้นอยู่กับหลักการของ "สะท้อนความหลากหลายของค่าของปัจจัยต่อความหลากหลายของค่าของลักษณะผลลัพธ์" และสร้างความแข็งแกร่งของอิทธิพลของปัจจัยในประชากรตัวอย่าง

สาระสำคัญของวิธีการวิเคราะห์ความแปรปรวนคือการวัดความแปรปรวนส่วนบุคคล (ผลรวม, แฟคทอเรียล, คงเหลือ) และกำหนดความแข็งแกร่ง (ส่วนแบ่ง) ของอิทธิพลของปัจจัยที่ศึกษาเพิ่มเติม (การประเมินบทบาทของแต่ละปัจจัยหรืออิทธิพลร่วมกัน) คุณลักษณะผลลัพธ์ (s)

การวิเคราะห์ความแปรปรวนเป็นวิธีทางสถิติในการประเมินความสัมพันธ์ระหว่างปัจจัยและลักษณะการปฏิบัติงานในกลุ่มต่างๆ โดยการสุ่มเลือก โดยพิจารณาจากความแตกต่าง (ความหลากหลาย) ของค่าของคุณลักษณะ การวิเคราะห์ความแปรปรวนขึ้นอยู่กับการวิเคราะห์ความเบี่ยงเบนของทุกหน่วยของประชากรที่ศึกษาจากค่าเฉลี่ยเลขคณิต เพื่อเป็นการวัดความเบี่ยงเบน การกระจาย (B) จะถูกนำไปใช้ - กำลังสองเฉลี่ยของการเบี่ยงเบน การเบี่ยงเบนที่เกิดจากอิทธิพลของคุณลักษณะปัจจัย (ปัจจัย) จะถูกเปรียบเทียบกับขนาดของการเบี่ยงเบนที่เกิดจากสถานการณ์สุ่ม หากการเบี่ยงเบนที่เกิดจากคุณลักษณะของปัจจัยมีความสำคัญมากกว่าการเบี่ยงเบนแบบสุ่ม ปัจจัยนั้นจะถือว่ามีผลกระทบอย่างมีนัยสำคัญต่อคุณลักษณะผลลัพธ์

ในการคำนวณการกระจายตัว ค่าเบี่ยงเบนของแต่ละตัวเลือก (แต่ละค่าตัวเลขที่ลงทะเบียนของคุณสมบัติ) จากค่าเฉลี่ยเลขคณิตจะถูกยกกำลังสอง สิ่งนี้จะกำจัดสัญญาณเชิงลบ จากนั้นการเบี่ยงเบน (ความแตกต่าง) เหล่านี้จะถูกสรุปและหารด้วยจำนวนการสังเกตเช่น ส่วนเบี่ยงเบนเฉลี่ย ดังนั้นจึงได้ค่าความแปรปรวน

ความสำคัญของระเบียบวิธีที่สำคัญสำหรับการใช้การวิเคราะห์ความแปรปรวนคือการเลือกตัวอย่างที่ถูกต้อง กลุ่มตัวอย่างสามารถสุ่มสร้างได้โดยอิสระจากกัน ขึ้นอยู่กับเป้าหมายและวัตถุประสงค์ (กลุ่มควบคุมและกลุ่มทดลองเพื่อศึกษาตัวบ่งชี้บางอย่าง เช่น ผลของความดันโลหิตสูงต่อการพัฒนาของโรคหลอดเลือดสมอง) ตัวอย่างดังกล่าวเรียกว่าเป็นอิสระ

บ่อยครั้งที่มีการศึกษาผลลัพธ์ของการสัมผัสกับปัจจัยในกลุ่มตัวอย่างเดียวกัน (เช่น ผู้ป่วยรายเดียวกัน) ก่อนและหลังการสัมผัส (การรักษา การป้องกัน มาตรการฟื้นฟู) ตัวอย่างดังกล่าวเรียกว่าขึ้นอยู่กับ

การวิเคราะห์ความแปรปรวนซึ่งทดสอบอิทธิพลของปัจจัยหนึ่งเรียกว่าการวิเคราะห์ปัจจัยเดียว (การวิเคราะห์ตัวแปรเดียว) เมื่อศึกษาอิทธิพลของปัจจัยมากกว่าหนึ่งปัจจัย จะใช้การวิเคราะห์ความแปรปรวนหลายตัวแปร (การวิเคราะห์หลายตัวแปร)

ลักษณะปัจจัยคือลักษณะที่มีอิทธิพลต่อปรากฏการณ์ที่กำลังศึกษา
คุณลักษณะที่มีประสิทธิผลคือคุณลักษณะที่เปลี่ยนแปลงภายใต้อิทธิพลของคุณลักษณะปัจจัย

เพื่อทำการวิเคราะห์ความแปรปรวน สามารถใช้ทั้งคุณลักษณะเชิงคุณภาพ (เพศ วิชาชีพ) และเชิงปริมาณ (จำนวนการฉีด ผู้ป่วยในวอร์ด จำนวนวันที่นอน)

การวิเคราะห์วิธีความแปรปรวน:

  1. วิธีฟิชเชอร์ - เกณฑ์ F (สำหรับค่า F ดูภาคผนวกหมายเลข 1)
    วิธีการนี้ใช้ในการวิเคราะห์ความแปรปรวนแบบทางเดียว โดยความแปรปรวนรวมของค่าที่สังเกตได้ทั้งหมดจะถูกแบ่งออกเป็นความแปรปรวนภายในแต่ละกลุ่ม และความแปรปรวนระหว่างกลุ่ม
  2. วิธี "แบบจำลองเชิงเส้นทั่วไป"
    ขึ้นอยู่กับการวิเคราะห์สหสัมพันธ์หรือการถดถอยที่ใช้ในการวิเคราะห์หลายตัวแปร

โดยทั่วไปแล้ว ในการวิจัยทางชีวการแพทย์จะใช้เพียงปัจจัยเดียวหรือมากที่สุดสองปัจจัยเท่านั้นในการกระจายเชิงซ้อน สามารถศึกษาคอมเพล็กซ์หลายปัจจัยได้โดยการวิเคราะห์ตามลำดับเชิงซ้อนหนึ่งหรือสองปัจจัยที่แยกได้จากประชากรที่สังเกตทั้งหมด

เงื่อนไขในการใช้การวิเคราะห์ความแปรปรวน:

  1. วัตถุประสงค์ของการศึกษาคือเพื่อกำหนดความแข็งแกร่งของอิทธิพลของปัจจัยหนึ่ง (มากถึง 3) ต่อผลลัพธ์ หรือเพื่อกำหนดความแข็งแกร่งของอิทธิพลรวมของปัจจัยต่าง ๆ (เพศและอายุ การออกกำลังกายและโภชนาการ ฯลฯ )
  2. ปัจจัยที่กำลังศึกษาจะต้องเป็นอิสระ (ไม่เกี่ยวข้องกัน) ซึ่งกันและกัน ตัวอย่างเช่น เป็นไปไม่ได้ที่จะศึกษาอิทธิพลร่วมกันของประสบการณ์การทำงาน อายุ ส่วนสูงและน้ำหนักของเด็ก เป็นต้น เรื่องการเจ็บป่วยของประชาชน
  3. การคัดเลือกกลุ่มสำหรับการศึกษาจะดำเนินการแบบสุ่ม (การคัดเลือกแบบสุ่ม) การจัดโครงสร้างการกระจายตัวที่ซับซ้อนโดยใช้หลักการสุ่มในการเลือกตัวเลือกเรียกว่าการสุ่ม (แปลจากภาษาอังกฤษ - สุ่ม) เช่น เลือกโดยการสุ่ม
  4. สามารถใช้ทั้งคุณลักษณะเชิงปริมาณและเชิงคุณภาพ (ระบุแหล่งที่มา)

เมื่อทำการวิเคราะห์ความแปรปรวนทางเดียว ขอแนะนำ (เงื่อนไขที่จำเป็นสำหรับการใช้งาน):

  1. ความเป็นปกติของการกระจายตัวของกลุ่มที่วิเคราะห์หรือการโต้ตอบของกลุ่มตัวอย่างกับประชากรทั่วไปที่มีการแจกแจงแบบปกติ
  2. ความเป็นอิสระ (ไม่เกี่ยวข้อง) ของการกระจายการสังเกตในกลุ่ม
  3. ความพร้อมของความถี่ (การทำซ้ำ) ของการสังเกต

ความปกติของการแจกแจงถูกกำหนดโดยเส้นโค้งเกาส์ (De Mavoor) ซึ่งสามารถอธิบายได้ด้วยฟังก์ชัน y = f(x) เนื่องจากเป็นหนึ่งในกฎการกระจายที่ใช้ในการประมาณคำอธิบายของปรากฏการณ์ที่สุ่มความน่าจะเป็น ในธรรมชาติ. หัวข้อของการวิจัยทางชีวการแพทย์คือปรากฏการณ์ความน่าจะเป็นซึ่งพบการแจกแจงแบบปกติค่อนข้างบ่อยในการวิจัยดังกล่าว

หลักการประยุกต์การวิเคราะห์วิธีความแปรปรวน

ขั้นแรกมีการกำหนดสมมติฐานว่างนั่นคือสันนิษฐานว่าปัจจัยที่ศึกษาไม่มีผลกระทบใด ๆ ต่อค่าของลักษณะผลลัพธ์และความแตกต่างที่ได้รับจะเป็นแบบสุ่ม

จากนั้นเราจะพิจารณาว่าความน่าจะเป็นที่จะได้รับความแตกต่างที่สังเกตได้ (หรือรุนแรงกว่า) คืออะไร โดยมีเงื่อนไขว่าสมมติฐานว่างนั้นเป็นจริง

หากความน่าจะเป็นนี้มีน้อย* เราจะปฏิเสธสมมติฐานว่างและสรุปว่าผลการศึกษามีนัยสำคัญทางสถิติ นี่ไม่ได้หมายความว่าผลกระทบของปัจจัยที่กำลังศึกษาได้รับการพิสูจน์แล้ว (นี่คือคำถามประการแรกคือการวางแผนการวิจัย) แต่ก็ยังไม่น่าเป็นไปได้ที่ผลลัพธ์จะเกิดจากโอกาส
__________________________________
* ความน่าจะเป็นที่ยอมรับได้สูงสุดในการปฏิเสธสมมติฐานว่างที่แท้จริงเรียกว่าระดับนัยสำคัญ และกำหนดให้ α = 0.05

หากตรงตามเงื่อนไขทั้งหมดสำหรับการใช้การวิเคราะห์ความแปรปรวน การสลายตัวของความแปรปรวนรวมในทางคณิตศาสตร์จะมีลักษณะดังนี้:

ยอดรวม = D ข้อเท็จจริง + D ส่วนที่เหลือ ,

ยอดรวม - การกระจายรวมของค่าที่สังเกตได้ (ตัวแปร) มีลักษณะเฉพาะโดยการกระจายตัวของตัวแปรจากค่าเฉลี่ยทั่วไป วัดความแปรผันของคุณลักษณะทั้งหมดภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้ ความหลากหลายโดยรวมประกอบด้วยความหลากหลายระหว่างกลุ่มและภายในกลุ่ม

ข้อเท็จจริง D - การกระจายตัวแบบแฟคทอเรียล (ระหว่างกลุ่ม) โดดเด่นด้วยความแตกต่างในค่าเฉลี่ยในแต่ละกลุ่มและขึ้นอยู่กับอิทธิพลของปัจจัยที่กำลังศึกษาซึ่งทำให้แต่ละกลุ่มมีความแตกต่างกัน ตัวอย่างเช่นในกลุ่มที่แตกต่างกันในปัจจัยสาเหตุของโรคปอดบวมทางคลินิกระดับเฉลี่ยของการนอนต่อวันไม่เหมือนกัน - สังเกตความหลากหลายของกลุ่มระหว่างกัน

ง. พักผ่อน - ความแปรปรวนที่เหลือ (ภายในกลุ่ม) ซึ่งแสดงลักษณะการกระจายตัวของตัวแปรภายในกลุ่ม สะท้อนถึงความแปรผันแบบสุ่ม เช่น ส่วนหนึ่งของการเปลี่ยนแปลงที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่ระบุและไม่ขึ้นอยู่กับลักษณะ - ปัจจัยที่สร้างพื้นฐานของกลุ่ม ความแปรผันของลักษณะที่ศึกษาขึ้นอยู่กับความแข็งแกร่งของอิทธิพลของปัจจัยสุ่มที่ไม่สามารถระบุได้ ทั้งปัจจัยที่จัด (กำหนดโดยผู้วิจัย) และปัจจัยสุ่ม (ไม่ทราบ)

ดังนั้น ความแปรผันรวม (ความแปรปรวน) จึงประกอบด้วยความแปรผันที่เกิดจากปัจจัยที่ถูกจัด (ให้มา) เรียกว่า ความแปรผันแฟคทอเรียล และปัจจัยที่ไม่มีการรวบรวมกัน กล่าวคือ ความแปรผันของสารตกค้าง (สุ่ม, ไม่ทราบ)

การวิเคราะห์ความแปรปรวนแบบคลาสสิกดำเนินการในขั้นตอนต่อไปนี้:

  1. การก่อสร้างคอมเพล็กซ์การกระจายตัว
  2. การคำนวณค่าเบี่ยงเบนกำลังสองเฉลี่ย
  3. การคำนวณความแปรปรวน
  4. การเปรียบเทียบปัจจัยและความแปรปรวนคงเหลือ
  5. การประเมินผลลัพธ์โดยใช้ค่าทางทฤษฎีของการแจกแจงฟิชเชอร์ - สนีเดคคอร์ (ภาคผนวกหมายเลข 1)

อัลกอริธึมสำหรับการวิเคราะห์ความแปรปรวนโดยใช้ตัวเลือกที่เรียบง่าย

อัลกอริธึมสำหรับการวิเคราะห์ความแปรปรวนโดยใช้วิธีที่ง่ายช่วยให้คุณได้รับผลลัพธ์เดียวกัน แต่การคำนวณจะง่ายกว่ามาก:

ด่านที่ 1 การก่อสร้างคอมเพล็กซ์การกระจายตัว

การสร้างกลุ่มการกระจายตัวหมายถึงการสร้างตารางที่จะแยกแยะปัจจัย สัญญาณที่มีประสิทธิผล และการเลือกข้อสังเกต (ผู้ป่วย) ลงในแต่ละกลุ่มได้อย่างชัดเจน

สารเชิงซ้อนแฟกเตอร์ตัวเดียวประกอบด้วยการไล่ระดับหลายระดับของแฟกเตอร์เดียว (A) การไล่สีคือตัวอย่างจากประชากรทั่วไปที่แตกต่างกัน (A1, A2, AZ)

คอมเพล็กซ์สองปัจจัย - ประกอบด้วยการไล่ระดับหลายระดับของสองปัจจัยรวมกัน ปัจจัยสาเหตุของอุบัติการณ์ของโรคปอดบวมจะเหมือนกัน (A1, A2, AD) เมื่อรวมกับรูปแบบทางคลินิกของโรคปอดบวมที่แตกต่างกัน (H1 - เฉียบพลัน, H2 - เรื้อรัง)

ตัวบ่งชี้ผลลัพธ์ (จำนวนวันที่นอนโดยเฉลี่ย) ปัจจัยสาเหตุที่ทำให้เกิดโรคปอดบวม
A1 A2 A3
H1 H2 H1 H2 H1 H2
ม = 14 วัน

ด่านที่สอง การคำนวณค่าเฉลี่ยทั่วไป (M รวม)

การคำนวณตัวเลือกผลรวมสำหรับแต่ละการไล่ระดับของปัจจัย: Σ Vj = V 1 + V 2 + V 3

การคำนวณจำนวนรวมของตัวเลือก (รวม Σ V) สำหรับการไล่ระดับทั้งหมดของคุณลักษณะปัจจัย: Σ V ทั้งหมด = Σ Vj 1 + Σ Vj 2 + Σ Vj 3

การคำนวณลักษณะปัจจัยของค่าเฉลี่ยกลุ่ม (M gr.): M gr. = Σ วีเจ / ยังไม่มีข้อความ,
โดยที่ N คือผลรวมของจำนวนการสังเกตสำหรับการไล่ระดับทั้งหมดของคุณลักษณะแฟคเตอร์ I (Σn ตามกลุ่ม)

ด่านที่สาม การคำนวณผลต่าง:

หากตรงตามเงื่อนไขทั้งหมดสำหรับการใช้การวิเคราะห์ความแปรปรวน สูตรทางคณิตศาสตร์จะเป็นดังนี้:

ยอดรวม = D ข้อเท็จจริง + D ส่วนที่เหลือ

ยอดรวม - การกระจายตัวทั้งหมด โดดเด่นด้วยการแพร่กระจายของตัวแปร (ค่าที่สังเกตได้) จากค่าเฉลี่ยทั่วไป
ข้อเท็จจริง - การกระจายแบบแฟคทอเรียล (ระหว่างกลุ่ม) กำหนดลักษณะการแพร่กระจายของค่าเฉลี่ยกลุ่มจากค่าเฉลี่ยโดยรวม
ง. พักผ่อน - ความแปรปรวนที่เหลือ (ภายในกลุ่ม) กำหนดลักษณะการกระจายตัวของตัวแปรภายในกลุ่ม

  1. การคำนวณความแปรปรวนแฟคทอเรียล (ข้อเท็จจริง D):ข้อเท็จจริง = Σ ชั่วโมง - ฮ
  2. การคำนวณ h ดำเนินการตามสูตร:ชั่วโมง = (Σ Vj) / N
  3. การคำนวณ N ดำเนินการตามสูตร: H = (ΣV)2/N
  4. การคำนวณความแปรปรวนคงเหลือ:ง. พักผ่อน = (Σ V) 2 - Σ ชม
  5. การคำนวณความแปรปรวนทั้งหมด:ยอดรวม = (Σ V) 2 - Σ H

ด่านที่ 4 การคำนวณตัวบ่งชี้หลักของความเข้มแข็งของอิทธิพลของปัจจัยที่กำลังศึกษาตัวบ่งชี้ความแข็งแกร่งของอิทธิพล (η 2) ของลักษณะปัจจัยต่อผลลัพธ์ถูกกำหนดโดยส่วนแบ่งของความแปรปรวนแฟคทอเรียล (ข้อเท็จจริง D) ในด้านความแปรปรวนทั้งหมด (รวม D), η 2 (eta) - แสดงให้เห็นว่ามีการแบ่งปันอะไร อิทธิพลของปัจจัยที่กำลังศึกษาอยู่ท่ามกลางปัจจัยอื่น ๆ ทั้งหมดและถูกกำหนดโดยสูตร :

เวทีวี. การพิจารณาความน่าเชื่อถือของผลการวิจัยโดยใช้วิธีฟิชเชอร์นั้นดำเนินการโดยใช้สูตร:


F - การทดสอบของฟิชเชอร์;
เอฟเซนต์ - ค่าตาราง (ดูภาคผนวก 1)
σ 2 ข้อเท็จจริง, σ 2 ที่เหลือ - ค่าเบี่ยงเบนแฟคทอเรียลและค่าตกค้าง (จากภาษาละติน de - จาก, ผ่าน - ถนน) - ค่าเบี่ยงเบนจากเส้นกึ่งกลางกำหนดโดยสูตร:


r คือจำนวนการไล่ระดับของคุณลักษณะแฟคเตอร์

การเปรียบเทียบเกณฑ์ฟิชเชอร์ (F) กับมาตรฐาน (ตาราง) F ดำเนินการตามคอลัมน์ของตารางโดยคำนึงถึงระดับความเป็นอิสระ:

โวลต์ 1 = n - 1
โวลต์ 2 = ยังไม่มีข้อความ - 1

กำหนดแนวนอน v 1 ในแนวตั้ง - v 2 ที่จุดตัดกันกำหนดค่าตาราง F โดยที่ค่าตารางด้านบน p ≥ 0.05 และด้านล่างสอดคล้องกับ p > 0.01 และเปรียบเทียบกับเกณฑ์ที่คำนวณได้ F หากค่าของการคำนวณ เกณฑ์ F เท่ากับหรือมากกว่าตาราง ดังนั้นผลลัพธ์จึงเชื่อถือได้ และ H 0 จะไม่ถูกปฏิเสธ

งาน:

ที่สถานประกอบการของ N. ระดับการบาดเจ็บเพิ่มขึ้นดังนั้นแพทย์จึงได้ทำการศึกษาปัจจัยส่วนบุคคลโดยศึกษาประสบการณ์การทำงานของผู้ที่ทำงานในเวิร์คช็อปด้วย ตัวอย่างถูกสร้างขึ้นที่องค์กร N. จากการประชุมเชิงปฏิบัติการ 4 แห่งที่มีเงื่อนไขและลักษณะงานคล้ายคลึงกัน อัตราการบาดเจ็บคำนวณต่อพนักงาน 100 คนในปีที่ผ่านมา

เมื่อศึกษาปัจจัยประสบการณ์การทำงาน จะได้ข้อมูลดังนี้

จากข้อมูลของการศึกษาได้มีการหยิบยกสมมติฐานว่าง (H 0) เกี่ยวกับอิทธิพลของประสบการณ์การทำงานที่มีต่อระดับการบาดเจ็บของพนักงานขององค์กร A

ออกกำลังกาย
ยืนยันหรือหักล้างสมมติฐานว่างโดยใช้การวิเคราะห์ความแปรปรวนทางเดียว:

  1. กำหนดความแข็งแกร่งของอิทธิพล
  2. ประเมินความน่าเชื่อถือของอิทธิพลของปัจจัย

ขั้นตอนการใช้ ANOVA
เพื่อกำหนดอิทธิพลของปัจจัย (ประสบการณ์การทำงาน) ต่อผลลัพธ์ (อัตราการบาดเจ็บ)

บทสรุป.ในกลุ่มตัวอย่างพบว่าอิทธิพลของประสบการณ์การทำงานที่มีต่ออัตราการบาดเจ็บคือ 80% ของจำนวนปัจจัยอื่นๆ ทั้งหมด สำหรับการประชุมเชิงปฏิบัติการทั้งหมดของโรงงาน สามารถระบุได้ด้วยความน่าจะเป็น 99.7% (13.3 > 8.7) ว่าประสบการณ์การทำงานส่งผลต่อระดับการบาดเจ็บ

ดังนั้นสมมติฐานว่าง (H 0) จะไม่ถูกปฏิเสธและอิทธิพลของประสบการณ์การทำงานที่มีต่อระดับการบาดเจ็บในการประชุมเชิงปฏิบัติการของโรงงาน A ได้รับการพิจารณาแล้ว

ค่า F (การทดสอบฟิชเชอร์) มาตรฐานที่ p ≥ 0.05 (ค่าบน) ที่ p ≥ 0.01 (ค่าต่ำกว่า)

1 2 3 4 5 6 7 8 9 10 11
6 6,0
13,4
5,1
10,9
4,8
9,8
4,5
9,2
4,4
8,8
4,3
8,5
4,2
8,3
4,1
8,1
4,1
8,0
4,1
7,9
4,0
7,8
7 5,6
12,3
4,7
9,6
4,4
8,5
4,1
7,9
4,0
7,5
3,9
7,2
3,8
7,0
3,7
6,8
3,7
6,7
3,6
6,6
3,6
6,5
8 5,3
11,3
4,6
8,7
4,1
7,6
3,8
7,0
3,7
6,6
3,6
6,4
3,5
6,2
3,4
6,0
3,4
5,9
3,3
5,8
3,1
5,7
9 5,1
10,6
4,3
8,0
3,6
7,0
3,6
6,4
3,5
6,1
3,4
5,8
3,3
5,6
3,2
5,5
3,2
5,4
3,1
5,3
3,1
5,2
10 5,0
10,0
4,1
7,9
3,7
6,6
3,5
6,0
3,3
5,6
3,2
5,4
3,1
5,2
3,1
5,1
3,0
5,0
2,9
4,5
2,9
4,8
11 4,8
9,7
4,0
7,2
3,6
6,2
3,6
5,7
3,2
5,3
3,1
5,1
3,0
4,9
3,0
4,7
2,9
4,6
2,9
4,5
2,8
4,5
12 4,8
9,3
3,9
6,9
3,5
6,0
3,3
5,4
3,1
5,1
3,0
4,7
2,9
4,7
2,9
4,5
2,8
4,4
2,8
4,3
2,7
4,2
13 4,7
9,1
3,8
6,7
3,4
5,7
3,2
5,2
3,0
4,9
2,9
4,6
2,8
4,4
2,8
4,3
2,7
4,2
2,7
4,1
2,6
4,0
14 4,6
8,9
3,7
6,5
3,3
5,6
3,1
5,0
3,0
4,7
2,9
4,5
2,8
4,3
2,7
4,1
2,7
4,0
2,6
3,9
2,6
3,9
15 4,5
8,7
3,7
6,4
3,3
5,4
3,1
4,9
2,9
4,6
2,8
4,3
2,7
4,1
2,6
4,0
2,6
3,9
2,5
3,8
2,5
3,7
16 4,5
8,5
3,6
6,2
3,2
5,3
3,0
4,8
2,9
4,4
2,7
4,2
2,7
4,0
2,6
3,9
2,5
3,8
2,5
3,7
2,5
3,6
17 4,5
8,4
3,6
6,1
3,2
5,2
3,0
4,7
2,8
4,3
2,7
4,1
2,6
3,9
2,6
3,8
2,5
3,8
2,5
3,6
2,4
3,5
18 4,4
8,3
3,5
6,0
3,2
5,1
2,9
4,6
2,8
4,2
2,7
4,0
2,6
3,8
2,5
3,7
2,7
3,6
2,4
3,6
3,4
3,5
19 4,4
8,2
3,5
5,9
3,1
5,0
2,9
4,5
2,7
4,2
2,6
3,9
2,5
3,8
2,5
3,6
2,4
3,5
2,4
3,4
2,3
3,4
20 4,3
8,1
3,5
5,8
3,1
4,9
2,9
4,4
2,7
4,1
2,6
3,9
2,5
3,7
2,4
3,6
2,4
3,4
2,3
3,4
2,3
3,3

  1. วลาซอฟ วี.วี. ระบาดวิทยา. - อ.: GEOTAR-MED, 2547. 464 หน้า
  2. Arkhipova G.L., Lavrova I.G., Troshina I.M. วิธีการวิเคราะห์ทางสถิติสมัยใหม่บางอย่างในทางการแพทย์ - อ.: เมโทรสนาบ, 2514. - 75 น.
  3. Zaitsev V.M., Liflyandsky V.G., Marinkin V.I. สถิติทางการแพทย์ประยุกต์ - เซนต์ปีเตอร์สเบิร์ก: FOLIANT Publishing House LLC, 2546 - 432 หน้า
  4. พลาโตนอฟ เอ.อี. การวิเคราะห์ทางสถิติในการแพทย์และชีววิทยา: งาน คำศัพท์เฉพาะทาง ตรรกะ วิธีคอมพิวเตอร์ - อ.: สำนักพิมพ์ของ Russian Academy of Medical Sciences, 2000. - 52 น.
  5. โพลคินสกี้ เอ็น.เอ. ไบโอเมตริกซ์ - สำนักพิมพ์ของสาขาไซบีเรียของ USSR Academy of Sciences Novosibirsk - พ.ศ. 2504 - 364 น.

การวิเคราะห์ความแปรปรวนคือการวิเคราะห์ความแปรปรวนของคุณลักษณะที่มีประสิทธิผลภายใต้อิทธิพลของปัจจัยตัวแปรที่ได้รับการควบคุม (ในวรรณคดีต่างประเทศเรียกว่า ANOVA – “การวิเคราะห์ความแปรปรวน”)

ลักษณะผลลัพธ์เรียกอีกอย่างว่าลักษณะเฉพาะและปัจจัยที่มีอิทธิพลเรียกว่าลักษณะอิสระ

ข้อจำกัดของวิธีการ: คุณลักษณะอิสระสามารถวัดได้ในระดับที่กำหนด ลำดับ หรือเมตริก ขึ้นอยู่กับคุณลักษณะเฉพาะ - ในระดับเมตริกเท่านั้น เพื่อทำการวิเคราะห์ความแปรปรวน จะมีการระบุการไล่ระดับของคุณลักษณะแฟคเตอร์หลายระดับ และองค์ประกอบตัวอย่างทั้งหมดจะถูกจัดกลุ่มตามการไล่ระดับเหล่านี้

การตั้งสมมติฐานในการวิเคราะห์ความแปรปรวน

สมมติฐานว่าง: “ค่าเฉลี่ยของลักษณะผลลัพธ์ในทุกเงื่อนไขของปัจจัย (หรือการไล่ระดับของปัจจัย) จะเท่ากัน”

สมมติฐานทางเลือก: “ค่าเฉลี่ยของลักษณะที่มีประสิทธิผลภายใต้เงื่อนไขที่แตกต่างกันของปัจจัยนั้นแตกต่างกัน”

การวิเคราะห์ความแปรปรวนสามารถแบ่งออกเป็นหลายประเภท ขึ้นอยู่กับ:

ตามจำนวนปัจจัยอิสระที่พิจารณา

จำนวนตัวแปรผลลัพธ์ที่สัมผัสกับปัจจัย

เกี่ยวกับธรรมชาติ ธรรมชาติของการได้มา และการมีอยู่ของความสัมพันธ์ระหว่างตัวอย่างค่าที่เปรียบเทียบ

หากมีปัจจัยหนึ่งที่กำลังศึกษาอิทธิพลอยู่ การวิเคราะห์ความแปรปรวนเรียกว่าการวิเคราะห์ปัจจัยเดียว และแบ่งออกเป็นสองประเภท:

- การวิเคราะห์ตัวอย่างที่ไม่เกี่ยวข้อง (เช่น ต่างกัน) . ตัวอย่างเช่น ผู้ตอบแบบสอบถามกลุ่มหนึ่งแก้ไขปัญหาในสภาพที่เงียบสงบ กลุ่มที่สอง - ในห้องที่มีเสียงดัง (ในกรณีนี้สมมุติฐานว่างจะมีลักษณะดังนี้: “เวลาเฉลี่ยในการแก้ปัญหาประเภทนี้จะเท่ากันในห้องที่เงียบสงบและเสียงดัง” กล่าวคือไม่ขึ้นอยู่กับเสียงรบกวน ปัจจัย.)

- การวิเคราะห์ตัวอย่างที่เชื่อมโยง นั่นคือการวัดสองครั้งดำเนินการกับกลุ่มผู้ตอบแบบสอบถามกลุ่มเดียวกันภายใต้เงื่อนไขที่ต่างกัน ตัวอย่างเดียวกัน: ครั้งแรกที่ปัญหาได้รับการแก้ไขอย่างเงียบ ๆ ครั้งที่สอง - ปัญหาที่คล้ายกัน - ในสภาวะที่มีการรบกวนทางเสียง (ในทางปฏิบัติ การทดลองดังกล่าวควรได้รับการดำเนินการด้วยความระมัดระวัง เนื่องจากอาจมีปัจจัยที่ไม่สามารถนับรวมได้คือ "ความสามารถในการเรียนรู้" ซึ่งผู้วิจัยเสี่ยงต่อการเปลี่ยนแปลงเงื่อนไข กล่าวคือ เสียงรบกวน)

หากมีการศึกษาอิทธิพลของปัจจัยสองปัจจัยขึ้นไปพร้อมกัน เรากำลังเผชิญกับ การวิเคราะห์ความแปรปรวนหลายตัวแปร ซึ่งสามารถแบ่งย่อยตามประเภทตัวอย่างได้

หากตัวแปรหลายตัวได้รับผลกระทบจากปัจจัย เรากำลังพูดถึง การวิเคราะห์หลายตัวแปร . การทำการวิเคราะห์ความแปรปรวนหลายตัวแปรจะดีกว่าการวิเคราะห์ตัวแปรเดียวเฉพาะเมื่อตัวแปรตามไม่เป็นอิสระจากกันและมีความสัมพันธ์ซึ่งกันและกัน

โดยทั่วไป งานของการวิเคราะห์ความแปรปรวนคือการระบุความแปรผันเฉพาะสามประการจากความแปรปรวนทั่วไปของลักษณะ:

    ความแปรปรวนที่เกิดจากการกระทำของตัวแปรอิสระ (ปัจจัย) แต่ละตัวที่กำลังศึกษาอยู่

    ความแปรปรวนอันเนื่องมาจากปฏิสัมพันธ์ของตัวแปรอิสระที่กำลังศึกษาอยู่

    ความแปรปรวนแบบสุ่มเนื่องจากสถานการณ์ที่ไม่สามารถระบุได้ทั้งหมด

เพื่อประเมินความแปรปรวนที่เกิดจากการกระทำของตัวแปรที่ศึกษาและการโต้ตอบของตัวแปรเหล่านั้น จะมีการคำนวณอัตราส่วนของตัวบ่งชี้ที่สอดคล้องกันของความแปรปรวนและความแปรปรวนแบบสุ่ม ตัวบ่งชี้ความสัมพันธ์นี้คือการทดสอบ Fisher F

ยิ่งความแปรปรวนของคุณลักษณะมากเท่าใดเนื่องจากการกระทำของปัจจัยที่มีอิทธิพลหรือปฏิสัมพันธ์ของพวกมัน ค่าเชิงประจักษ์ของเกณฑ์ก็จะยิ่งสูงขึ้นเท่านั้น .

ในสูตรการคำนวณเกณฑ์ รวมถึงการประมาณค่าความแปรปรวนด้วย ดังนั้นวิธีนี้จึงอยู่ในหมวดหมู่ของพารามิเตอร์

การวิเคราะห์ความแปรปรวนแบบทางเดียวแบบไม่มีพารามิเตอร์สำหรับตัวอย่างอิสระคือการทดสอบ Kruskal-Wallace คล้ายกับการทดสอบ Mann-Whitney สำหรับตัวอย่างอิสระ 2 ตัวอย่าง ยกเว้นว่าจะรวมอันดับสำหรับแต่ละตัวอย่าง กลุ่ม

นอกจากนี้ สามารถใช้เกณฑ์มัธยฐานในการวิเคราะห์ความแปรปรวนได้ เมื่อใช้งาน แต่ละกลุ่มจะมีการกำหนดจำนวนการสังเกตที่เกินค่ามัธยฐานที่คำนวณได้สำหรับทุกกลุ่ม และจำนวนการสังเกตที่น้อยกว่าค่ามัธยฐาน หลังจากนั้นจึงสร้างตารางฉุกเฉินแบบสองมิติ

การทดสอบฟรีดแมนเป็นการสรุปทั่วไปแบบไม่มีพารามิเตอร์ของการทดสอบทีแบบคู่สำหรับกรณีตัวอย่างที่มีการวัดซ้ำ เมื่อจำนวนตัวแปรที่ถูกเปรียบเทียบมากกว่าสองตัว

ต่างจากการวิเคราะห์สหสัมพันธ์ ในการวิเคราะห์ความแปรปรวน ผู้วิจัยดำเนินการจากการสันนิษฐานว่าตัวแปรบางตัวทำหน้าที่เป็นตัวที่มีอิทธิพล (เรียกว่าปัจจัยหรือตัวแปรอิสระ) ในขณะที่ตัวแปรอื่นๆ (ลักษณะผลลัพธ์หรือตัวแปรตาม) ได้รับอิทธิพลจากปัจจัยเหล่านี้ แม้ว่าสมมติฐานนี้จะเป็นไปตามขั้นตอนการคำนวณทางคณิตศาสตร์ แต่ก็ยังต้องใช้ความระมัดระวังในการสรุปเกี่ยวกับเหตุและผล

ตัวอย่างเช่นหากเราตั้งสมมติฐานเกี่ยวกับการพึ่งพาความสำเร็จของงานของเจ้าหน้าที่ในปัจจัย H (ความกล้าหาญทางสังคมตาม Cattell) ก็จะไม่รวมสิ่งที่ตรงกันข้าม: ความกล้าหาญทางสังคมของผู้ถูกกล่าวหาสามารถเกิดขึ้น (เพิ่มขึ้น) ในฐานะ ผลลัพธ์ของความสำเร็จในการทำงานของเขา - นี่คือด้านหนึ่ง ในทางกลับกัน เราควรตระหนักว่า “ความสำเร็จ” วัดกันอย่างไร? หากไม่ได้ขึ้นอยู่กับลักษณะวัตถุประสงค์ (เช่น "ปริมาณการขาย" ที่ทันสมัยในปัจจุบัน ฯลฯ ) แต่ขึ้นอยู่กับการประเมินโดยผู้เชี่ยวชาญของเพื่อนร่วมงาน ก็มีความเป็นไปได้ที่จะแทนที่ "ความสำเร็จ" ด้วยลักษณะพฤติกรรมหรือส่วนบุคคล (เชิงปริมาณ การสื่อสาร อาการภายนอกของความก้าวร้าว ฯลฯ )

การวิเคราะห์ความแปรปรวน

1. แนวคิดการวิเคราะห์ความแปรปรวน

การวิเคราะห์ความแปรปรวนคือการวิเคราะห์ความแปรปรวนของลักษณะภายใต้อิทธิพลของปัจจัยตัวแปรควบคุมใดๆ ในวรรณคดีต่างประเทศ การวิเคราะห์ความแปรปรวนมักเรียกว่า ANOVA ซึ่งแปลว่าการวิเคราะห์ความแปรปรวน (การวิเคราะห์ความแปรปรวน)

ปัญหาความแปรปรวนประกอบด้วยการแยกความแปรปรวนประเภทอื่นออกจากความแปรปรวนทั่วไปของลักษณะ:

ก) ความแปรปรวนเนื่องจากการกระทำของตัวแปรอิสระแต่ละตัวที่อยู่ในการศึกษา

b) ความแปรปรวนเนื่องจากปฏิสัมพันธ์ของตัวแปรอิสระที่กำลังศึกษา

c) ความแปรปรวนแบบสุ่มเนื่องจากตัวแปรที่ไม่รู้จักอื่นๆ ทั้งหมด

ความแปรปรวนเนื่องจากการกระทำของตัวแปรภายใต้การศึกษาและการโต้ตอบของตัวแปรมีความสัมพันธ์กับความแปรปรวนแบบสุ่ม ตัวบ่งชี้ความสัมพันธ์นี้คือการทดสอบ F ของฟิชเชอร์

สูตรในการคำนวณเกณฑ์ F ประกอบด้วยการประมาณค่าความแปรปรวน ซึ่งก็คือพารามิเตอร์การกระจายของคุณลักษณะ ดังนั้นเกณฑ์ F จึงเป็นเกณฑ์แบบพาราเมตริก

ยิ่งความแปรปรวนของคุณลักษณะมีสาเหตุมาจากตัวแปร (ปัจจัย) ที่กำลังศึกษาอยู่หรือปฏิสัมพันธ์ของตัวแปรเหล่านั้นมากเท่าใด ก็จะยิ่งสูงขึ้นเท่านั้น ค่าเกณฑ์เชิงประจักษ์.

ศูนย์ สมมติฐานในการวิเคราะห์ความแปรปรวนจะระบุว่าค่าเฉลี่ยของคุณลักษณะที่มีประสิทธิผลที่ศึกษาจะเท่ากันในการไล่ระดับทั้งหมด

ทางเลือก สมมติฐานจะระบุว่าค่าเฉลี่ยของลักษณะผลลัพธ์ในการไล่ระดับที่แตกต่างกันของปัจจัยที่กำลังศึกษานั้นแตกต่างกัน

การวิเคราะห์ความแปรปรวนช่วยให้เราสามารถระบุการเปลี่ยนแปลงในลักษณะแต่ไม่ได้ระบุ ทิศทางการเปลี่ยนแปลงเหล่านี้

เรามาเริ่มการพิจารณาการวิเคราะห์ความแปรปรวนด้วยกรณีที่ง่ายที่สุด เมื่อเราศึกษาการกระทำเท่านั้น หนึ่งตัวแปร (ปัจจัยหนึ่ง)

2. การวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้อง

2.1. วัตถุประสงค์ของวิธีการ

วิธีการวิเคราะห์ความแปรปรวนแบบปัจจัยเดียวจะใช้ในกรณีที่มีการศึกษาการเปลี่ยนแปลงในลักษณะที่มีประสิทธิผลภายใต้อิทธิพลของเงื่อนไขที่เปลี่ยนแปลงหรือการไล่ระดับของปัจจัย ในวิธีการเวอร์ชันนี้ อิทธิพลของการไล่ระดับของแฟคเตอร์แต่ละค่าจะเป็นอย่างไร แตกต่างตัวอย่างวิชา จะต้องมีการไล่ระดับปัจจัยอย่างน้อยสามระดับ (อาจมีการไล่ระดับสองระดับ แต่ในกรณีนี้ เราไม่สามารถสร้างการขึ้นต่อกันแบบไม่เชิงเส้นได้ และดูเหมือนว่าจะสมเหตุสมผลกว่าที่จะใช้การไล่ระดับที่ง่ายกว่า)

การวิเคราะห์ประเภทนี้ในเวอร์ชันที่ไม่ใช่พารามิเตอร์คือการทดสอบ Kruskal-Wallis H

สมมติฐาน

H 0: ความแตกต่างระหว่างเกรดปัจจัย (เงื่อนไขที่แตกต่างกัน) จะไม่มากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม

H 1: ความแตกต่างระหว่างเกรดปัจจัย (เงื่อนไขที่แตกต่างกัน) มากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม

2.2. ข้อจำกัดของการวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้อง

1. การวิเคราะห์ความแปรปรวนทางเดียวจำเป็นต้องมีการไล่ระดับปัจจัยอย่างน้อยสามระดับ และอย่างน้อยสองวิชาในการไล่ระดับแต่ละครั้ง

2. ลักษณะผลลัพธ์จะต้องกระจายตามปกติในกลุ่มตัวอย่างที่กำลังศึกษา

จริงอยู่ โดยปกติไม่ได้ระบุว่าเรากำลังพูดถึงการกระจายตัวของคุณลักษณะในตัวอย่างที่สำรวจทั้งหมดหรือในส่วนนั้นที่ประกอบเป็นการกระจายตัวที่ซับซ้อน

3. ตัวอย่างการแก้ปัญหาโดยใช้วิธีวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้องโดยใช้ตัวอย่าง:

กลุ่มวิชาที่แตกต่างกันสามกลุ่มจากหกวิชาได้รับรายการคำศัพท์สิบคำ กลุ่มแรกนำเสนอคำด้วยความเร็วต่ำ - 1 คำต่อ 5 วินาที กลุ่มที่สองด้วยความเร็วเฉลี่ย - 1 คำต่อ 2 วินาที และกลุ่มที่สามด้วยความเร็วสูง - 1 คำต่อวินาที คาดว่าประสิทธิภาพในการสืบพันธุ์จะขึ้นอยู่กับความเร็วของการนำเสนอคำ ผลลัพธ์แสดงไว้ในตาราง 1.

จำนวนคำที่ทำซ้ำ ตารางที่ 1

เรื่องเลขที่

ความเร็วต่ำ

ความเร็วเฉลี่ย

ความเร็วสูง

จำนวนเงินทั้งหมด

H 0: ความแตกต่างในช่วงการผลิตคำ ระหว่างกลุ่มไม่เด่นชัดมากไปกว่าความแตกต่างแบบสุ่ม ข้างในแต่ละกลุ่ม

H1: ความแตกต่างในปริมาณการผลิตคำ ระหว่างกลุ่มมีความเด่นชัดมากกว่าความแตกต่างแบบสุ่ม ข้างในแต่ละกลุ่ม โดยใช้ค่าทดลองที่แสดงในตาราง 1 เราจะกำหนดค่าบางอย่างที่จำเป็นในการคำนวณเกณฑ์ F

การคำนวณปริมาณหลักสำหรับการวิเคราะห์ความแปรปรวนทางเดียวแสดงไว้ในตาราง:

ตารางที่ 2

ตารางที่ 3

ลำดับการดำเนินการในการวิเคราะห์ความแปรปรวนทางเดียวสำหรับตัวอย่างที่ไม่เกี่ยวข้องกัน

มักพบในตารางนี้และตารางต่อๆ ไป การกำหนด SS เป็นตัวย่อของ "ผลรวมของกำลังสอง" คำย่อนี้มักใช้ในแหล่งข้อมูลที่แปล

เอสเอส ข้อเท็จจริงหมายถึงความแปรปรวนของลักษณะเนื่องจากการกระทำของปัจจัยที่กำลังศึกษา

เอสเอส โดยทั่วไป- ความแปรปรวนทั่วไปของลักษณะ

ซี.เอ.-ความแปรปรวนเนื่องจากปัจจัยที่ไม่สามารถนับได้ ความแปรปรวน "สุ่ม" หรือ "คงเหลือ"

นางสาว- "ค่าเฉลี่ยกำลังสอง" หรือค่าคาดหวังทางคณิตศาสตร์ของผลรวมของกำลังสอง ซึ่งเป็นค่าเฉลี่ยของ SS ที่สอดคล้องกัน

df - จำนวนระดับความเป็นอิสระซึ่งเมื่อพิจารณาเกณฑ์ที่ไม่ใช่พารามิเตอร์เราจะแสดงด้วยตัวอักษรกรีก โวลต์.

สรุป: H 0 ถูกปฏิเสธ H 1 ได้รับการยอมรับ ความแตกต่างในการจำคำระหว่างกลุ่มมากกว่าความแตกต่างแบบสุ่มภายในแต่ละกลุ่ม (α=0.05) ดังนั้นความเร็วในการนำเสนอคำจึงส่งผลต่อปริมาณการทำซ้ำ

ตัวอย่างของการแก้ปัญหาใน Excel แสดงไว้ด้านล่าง:

ข้อมูลเริ่มต้น:

การใช้คำสั่ง: เครื่องมือ -> การวิเคราะห์ข้อมูล -> การวิเคราะห์ความแปรปรวนแบบทางเดียว เราได้รับผลลัพธ์ดังต่อไปนี้:

กำลังโหลด...กำลังโหลด...