Disperzijska analiza eksperimentalnih podatkov. Analiza večfaktorja disperzijo. Načrti s ponovljenimi meritvami

Analitična statistika A.

7.1 Analiza disperzije.. 2

V tej izvedbi je učinek vsake diplome predmet različnih vzorcev predmetov. Gradacije faktorja morajo biti vsaj tri.

Primer 1.Tri različne skupine šestih subjektov so prejele sezname iz desetih besed. Prva skupina besed je bila predstavljena z nizko hitrostjo -1 besedo v 5 sekundah, druga skupina po povprečni hitrosti - 1 besedo v 2 sekundah in tretjo skupino pri visoki hitrosti - 1 besedo na sekundo. Predvidevano je bilo, da bodo kazalniki predvajanja odvisni od stopnje predstavitve besed. Rezultati so predstavljeni v tabeli. Ena.

Tabela 1. Število reproduciranih besed (zJ. Greene, M D "Olivera, 1989, str. 99

Testna številka

Skupina 1 nizka hitrost

Skupina 2 Povprečna hitrost

Skupina 3 visoka hitrost

znesek

sredina

7,17

6,17

4,00

Skupni znesek

Analiza disperzije Eno-faktor vam omogoča, da preverite hipoteze:

H 0. : Razlike v besedah \u200b\u200bReprodukcija medskupine niso bolj izrazite kot naključne razlike notranjostvsaka skupina

H1. : Razlike v besedah \u200b\u200bReprodukcija medskupine so bolj izrazite kot naključne razlike notranjostvsaka skupina.

Zaporedje operacij v analizi disperzij z enim faktorjem za nepovezane vzorce:

1. Štetje SS dejstvo - variabilnost atributa, ki je posledica delovanja preiskovanega faktorja. Pogosto pojavljajo označbaSs. - zmanjšanje od "vsote kvadratov" (\\ tvsota kvadratov. ). To zmanjšanje se najpogosteje uporablja v prevedenih virih (glej na primer: steklo J., Stanley J., 1976).

,(1)

kjer je t C vsota posameznih vrednosti za vsakega od pogojev. Za naš primer 43, 37, 24 (glej tabelo 1);

c - število pogojev (stopnjevanja) faktorja (\u003d 3);

n. - število subjektov v vsaki skupini (\u003d 6);

N. - skupno število posameznih vrednosti (\u003d 18);

Square Skupna količina posameznih vrednosti (\u003d 104 2 \u003d 10816)

Upoštevamo razliko med tem, kje so vse posamezne vrednosti najprej povišane na kvadratu, nato pa so povzete in, kjer se posamezne vrednosti najprej povzemo, da dobijo skupni znesek, nato pa se ta znesek vgrajen na kvadrat .

S formulo (1), ki je izračunala dejansko variabilnost lastnosti, dobimo:

2. Štetje SS skupno- Splošna variabilnost znaka:


(2)

3. Izračunamo naključno (preostalo) vrednostSS SL.Zaradi neodloženih dejavnikov:

(3)

4.Število stopenj svobodeprav tako:

=3-1=2(4)

5."Srednji trg"ali povprečna vrednost ustreznih SS SH kvadratov, ki je enaka:

(5)

6.New. merila statistika F emp.izračunajte s formulo:

(6)

Za naš primer imamo : F EMP \u003d 15,72 / 2,11 \u003d 7,45

7. Mine. F crt. Po statističnih tabelah Dodatki 3. Za DF 1 \u003d K 1 \u003d 2 in DF 2 \u003d K 2 \u003d 15 Vrednost tabele statistike je 3.68

8. IF. F emp.< F Kreta, ničelna hipoteza je sprejeta, sicer se vzame alternativna hipoteza. Za naš primer F emp. \u003e F Kreta (7,45\u003e 3.68), zato

Izhod: Razlike v obsegu besed med skupinami so bolj izrazite kot naključne razlike v vsaki skupini (P<0,05). Т.о. скорость предъявления слов влияет на объем их воспроизведения.

7.1.2 Analiza disperzij za povezane vzorce

Metoda disperzijske analize za povezane vzorce se uporablja v primerih, ko je vpliv različnih stopenj faktorja ali različnih pogojev na isti vzorec predmetov.Gradacije faktorja morajo biti vsaj tri.

V tem primeru so razlike med subjektom morebitni neodvisni vir razlik. Analiza razpršenosti z enim faktorjem za povezane vzorceto bo ugotovilo, kaj prevlada tendenca, krivulja izrazitih faktorjev, ali posamezne razlike med temami. Faktor posameznih razlik je lahko pomembnejši od faktorja sprememb v eksperimentalnih pogojih.

Primer 2.Skupina 5 predmetov je bila pregledana s pomočjo treh eksperimentalnih nalog, namenjenih preučevanju intelektualne, vztrajnosti (Sidorenko E. V., 1984). Vsaka oseba je posamično predstavljena zaporedno trije enake anagrame: štiri črke, petletne in šest-črke. Ali je mogoče domnevati, da faktor dolžine anagrama vpliva na trajanje poskusov, da ga reši?

Tabela 2. Trajanje odločanja Anagrame (SEC)

Testna koda

Stanje 1. Four-pisma Anagram

Pogoj 2. Anagram s petimi črkami

Stanje 3. šestmetni anagram

Zneski pod preskusom

znesek

1244

1342

Oblikovamo hipoteze. Kape hipoteze v tem primeru sta dva.

Nastavite A..

H 0 (A): Razlike v času trajanja poskusov reševanja anagramov različnih dolžin ni bolj izrazita od razlik, ki jih povzročajo naključni vzroki.

H1 (a): Razlike v času trajanja poskusov odločitev so bolj izrazite od razlik zaradi naključnih razlogov.

SET B.

N o (b): posamezne razlike med temami niso bolj izrazita od razlik, ki jih povzročajo naključni vzroki.

H1 (b): Posamezne razlike med temami so izrazitejše od razlik, ki jih povzročajo naključni vzroki.

Zaporedje poslovanja v analizi disperzij z enim faktorjem za povezane vzorce:

1. Štetje SS dejstvo - variabilnost funkcije, ki jo povzroča delovanje faktorja v študiju pod formulo (1).

kjer je T C vsota posameznih vrednosti za vsakega od pogojev (stolpcev). Za naš primer 51, 1244, 47 (glej tabelo 2); C - število pogojev (stopnjevanja) faktorja (\u003d 3);n. - število subjektov v vsaki skupini (\u003d 5);N. - skupno število posameznih vrednosti (\u003d 15); - Kvadratni skupni znesek posameznih vrednosti (\u003d 1342 2)

2. Štetje Ss. - variabilnost funkcije zaradi posameznih vrednosti subjektov.

Kjer t in - vsota posameznih vrednosti za vsak predmet. Za naš Primer 247, 631, 100, 181, 183 (glej tabelo 2); C - število pogojev (stopnjevanja) faktorja (\u003d 3);N. - skupno število posameznih vrednosti (\u003d 15);

3. Štetje SS skupno- Splošna variabilnost znaka po formuli (2): \\ t


4. Izračunajte naključno (preostalo) velikostSS SL.Zaradi neodloženih dejavnikov v skladu s formulo (3):

5. Število stopenj svobodeenaka (4):

; ; ;

6. "Srednji trg"ali matematično pričakovanje vsote kvadratovpovprečna vrednost ustreznih zneskov SS kvadratov je enaka (5):

;

7. vrednost statistike merila F emp.izračunajte s formulo (6):

;

8. opredelimo F Kreto v skladu s statističnimi tabelami iz Dodatka 3 za DF 1 \u003d K 1 \u003d 2 in DF 2 \u003d K2 \u003d 8 tabele vrednost statistike F CRETE_FF \u003d 4,46, in za DF 3 \u003d K 3 \u003d 4 in DF 2 \u003d K 2 \u003d 8 frete_ip \u003d 3.84

9. F emf_fak. \u003e Frete_fact (6,872\u003e 4.46), zato alternativna hipoteza se dviga.

10. F emf_ip. < F крит_исп (1,054<3,84), следовательно пnič hipoteza se dviga.

Izhod: Razlike v obsegu besed v različnih pogojih so bolj izrazite od razlik zaradi naključnih vzrokov (P<0,05).Индивидуальные различия между испытуе­мыми являются не более выраженными, чем различия, обусловленные случайными причинами.

7.2 Korelacijska analiza

7.2.1 Korelirani koncept.

Raziskovalec pogosto zanima, kako so dve ali več spremenljivk v enem ali več vzorcih med seboj povezani. Na primer, ali lahko študenti z visoko stopnjo tesnobe dokažejo stabilne akademske dosežke, ali pa je trajanje učiteljevega dela povezano v šoli z velikostjo njene plače, ali s katerim je raven razvoja duševnega učenja povezan - s svojimi Uspešnost matematike ali v literaturi itd.?

Ta vrsta odvisnosti med spremenljivkami se imenuje korelacija ali korelacija. Korelacijo komunikacija - To je dosledna sprememba dveh znakov, ki odraža dejstvo, da je variabilnost ene značilnosti v skladu z variabilnostjo drugega.

Znano je, na primer, da v povprečju opazimo pozitivno povezavo med rastjo ljudi in njihove teže, in tako, da je večja rast, večja je teža osebe. Vendar pa ima to pravilo izjeme, ko so relativno nizki ljudje prekomerno telesno težo, in, nasprotno, astemo, z visoko rastjo, imajo majhno težo. Razlog za takšne izjeme je, da je vsaka biološka, \u200b\u200bfiziološka ali psihološka značilnost določena z vplivom številnih dejavnikov: okoljske, genetske, socialne, okoljske itd.

Korelacijske obveznice so verjetnostne spremembe, ki jih je mogoče preučiti le na reprezentativnih vzorcih z metodami matematične statistike. "Oba sta izrazi - piše e.v. SIDORENKO, - odvisnost korelacije in korelacije - Pogosto se uporablja kot sinonimi. Odvisnost pomeni vpliv, komunikacija - vse dogovorjene spremembe, ki jih je mogoče razložiti na stotine razlogov. Korelacijske obveznice ni mogoče obravnavati kot dokaz o vzročnosti odvisnosti, ki jih pričajo le, da spremembe v eni značilnosti praviloma spremljajo nekatere spremembe v drugi.

Odvisnost korelacije - to so spremembe, zaradi katerih vrednosti ene značilnosti v verjetnosti videza različnih vrednosti druge značilnosti (E.V. Sidorenko, 2000).

Problem korelacijske analize se zmanjša na določanje smeri (pozitivne ali negativne) in oblike (linearne, nelinearne) povezave med različnimi znaki, merjenje njegove raztopine in končno, da preveri raven pomembnosti pridobljenih koeficientov korelacije.

Odlikuje se korelacijske obveznice v obliki, smeri in stopnji (moč).

V obliki Korelacijska vez je lahko ravna ali ukrivljena. Enako lahko na primer povezava med številom treninga na simulatorju in količino pravilno rešenih nalog na nadzorni seji. Kurvilinear je lahko na primer odnos med stopnjo motivacije in učinkovitosti naloge (glej sliko 1). S povečanjem motivacije se učinkovitost naloge najprej poveča, potem je dosežena optimalna stopnja motivacije, ki ustreza največji učinkovitosti naloge; Nadaljnje povečanje motivacije je že priloženo zmanjšanje učinkovitosti.

Sl.1. Komunikacija med učinkovitostjo reševanja problema

in silo motivacijskega trenda (J. W.t K v Sin, 1974, P 200)

Proti Korelacijska vez je lahko pozitivna ("ravna") in negativna ("obratno"). S pozitivno enostavno korelacijo, višje vrednosti iste funkcije ustrezajo višjim vrednostim drugega, in nižje vrednosti drugega so nizke vrednosti druge. Z negativno korelacijo, razmerje razmerja. S pozitivno korelacijo, korelacijski koeficient ima pozitiven znak, na primerr \u003d + 0,207z negativno korelacijo - negativni znak, na primerr \u003d -0.2207..

Stopnja, moč ali blizu Korelacija se določi z obsegom korelacijskega koeficienta.

Sila komunikacije ni odvisna od njegove smeri in se določi z absolutno vrednostjo korelacijskega koeficienta.

Največja možna absolutna vrednost korelacijskega koeficientar \u003d 1,00; Najmanj r \u003d 0,00..

Splošna klasifikacija korelacijskih vezi (Ivanter E.V., Korowov A.V., 1992):

močna, Or. težko s korelacijskim razmerjemr\u003e 0,70.;

povprečjeza 0,50< r.<0,69 ;

zmernaza 0,30< r.<0,49 ;

Šibkeza 0,20< r.<0,29 ;

zelo slaboza r.<0,19 .

Spremenljivke X in Y se lahko merijo v različnih tehtnicah, ki določa izbiro ustreznega korelacijskega koeficienta (glej tabelo 3):

Tabela 3. Uporaba korelacijskega koeficienta, odvisno od vrste spremenljivk

Vrsta obsega

Ukrepite komunikacijo

Spremenljivka X.

Spremenljivka U.

Interval ali odnos

Interval ali odnos

Pearson koeficient.

Rank, interval ali odnos

Koeficient Spearman

Rankovaya.

Rankovaya.

Kendalla koeficient.

Dichotomic.

Dichotomic.

Koeficient "J"

Dichotomic.

Rankovaya.

Rank Biserial.

Dichotomic.

Interval ali odnos

Biserial.

7.2.2 Koeficient korekcijskega koeficienta Pearsona

Izraz "korelacija" je bil uveden v znanost o izjemen angleški naturalist Francis Galton leta 1886. Vendar pa je bila natančna formula za štetje korelacijskega koeficienta razvila njegov študent Karl Pearson.

Koeficient označuje prisotnost le linearne povezave med značilnostmi, ki so navedene, kot pravilo, X in Y simbole. Formula za izračun korelacijskega koeficienta je zgrajena tako, da če je razmerje med značilnostmi linearno v naravi, je Pearson Koeficient natančno vzpostavlja bližino te povezave. Zato se imenuje tudi Pearson linearni korelacijski koeficient. Če je povezava med spremembami X inY. Ni linearno, potem je Pearson ponudil, da ocenimo temeljitost te povezave tako imenovani korelacijski odnos.

Velikost linearnega korelacijskega koeficienta Pearsona ne sme presegati +1 in je manjša od -1. Ti dve številki +1 in -1 so meje za korelacijski koeficient. Ko je vrednost dobljena velika +1 ali manj -1 - zato je prišlo do napake pri izračunih.

Znak korelacije koeficienta je zelo pomemben za razlago prejetih komunikacij. Poudarjamo, da če je znak linearnega korelacijskega koeficienta plus, je povezava med korelacijskimi funkcijami taka, da večja vrednost ene funkcije (spremenljivka) ustreza veliki vrednosti druge funkcije (druga spremenljivka). Z drugimi besedami, če se en kazalnik (spremenljivka) povečuje, se še en kazalnik (spremenljivka) ustrezno poveča. Ta odvisnost se imenuje neposredno sorazmerna z odvisnostjo.

Če dobimo minus znak, večja vrednost enega znaka ustreza manjši vrednosti drugega. Z drugimi besedami, če je znak minus, povečanje ene spremenljivke (značilnosti, vrednosti) ustreza zmanjšanju druge spremenljivke. Ta odvisnost se imenuje sorazmerna odvisnost.

Na splošno je formula za izračun korelacijskega koeficienta, kot sledi:

(7)

kje h. JAZ. - vrednosti, posnete v vzorcu x, \\ t

y i. - vrednosti, posnete v vzorcu Y;

Povprečje x, - povprečje y.

Izračun koeficienta korekcijskega kovansa Pearson kaže, da se spremenljivke X in Y razdelijo v redu.

V formuli (7) se vrednost pojavi Pri razdelitvin. (Število vrednosti spremenljivke X ali Y) se imenuje covaria.. Formula (7) predvideva tudi, da je pri izračunu korelacijskih koeficientov, število vrednosti spremenljivke X je enako številu spremenljivih vrednostiY.

Število stopenj svobodek \u003d n -2.

Primer 3.1 0 Šolski otroci so bili testi za vizualno oblikovano in verbalno razmišljanje. Izmerjen je bil povprečni čas za reševanje preskusnih nalog v sekundah. Raziskovalec zanima vprašanje: Ali obstaja kakšen odnos med reševanjem teh nalog? Spremenljivka X - označuje povprečni čas raztopine vizualne oblike in spremenljivka Y je povprečni čas za reševanje ustnih nalog preskusov.

Sklep. Izvedite izvorne podatke v obliki tabele 4, v kateri so dodatni stolpci uvedeni za izračun formule (7).

Tabela 4.

Testna številka

x.

x i -

(X I -) 2

y i -

(Y i -) 2

16,7

278,89

51,84

120,24

13,69

17,2

295,84

63,64

7,29

51,84

19,44

68,89

14,44

31,54

59,29

7,84

21,56

0,49

46,24

4,76

10,89

17,64

13,86

10,89

51,84

23,76

68,89

10,8

116,64

89,64

68,89

18,8

353,44

156,04

Vsota

357

242

588,1

1007,6

416,6

Povprečje

35,7

24,2

Izračunamo empirično vrednost korelacijskega koeficienta s formulo (7):

Določite kritične vrednosti za nastale korelacijski koeficient v skladu s tabelo Dodatka 3. Ko so kritične vrednosti izračunanega linearnega korelacijskega koeficienta Pearsona, se število stopenj svobode izračuna kot K \u003dn - 2 \u003d 8.

na Kreto \u003d 0,72\u003e 0,54, zato je hipoteza H1 zavrnjena in hipoteza je sprejeta.H 0. Z drugimi besedami, povezava med reševanjem vizualnih in ustnih nalog preskusa ni dokazana.

7.3 Regresijska analiza

To je skupina metod, namenjenih identifikaciji in matematičnem izrazu sprememb in odvisnosti, ki se odvijajo v sistemu naključnih spremenljivk. Če tak sistem simulira pedagoško, zato, tako z regresijsko analizo, psihološkimi in pedagoškimi pojavi in \u200b\u200bodvisnosti med njimi se razkrivajo in matematično izražene. Značilnosti teh pojavov se merijo v različnih lestvicah, ki nalagajo omejitve za metode matematičnega izražanja sprememb in odvisnosti, ki jih preučuje učitelj.

Metode regresijske analize se izračunajo predvsem v primeru trajnostne normalne porazdelitve, v katerih se spremembe iz izkušenj v poskusu kažejo le v obliki neodvisnih preskusov.

Razlikujejo se različni formalni problemi regresijske analize. Morda so preproste ali zapletene z besedilom, glede na matematična sredstva in kompleksnost. Navajamo in upoštevamo primere, ki se jim zdi, da so glavni.

Prva naloga - razkrivajo dejstvo variabilnosti pojav je preučen na določenih, vendar ne vedno jasno določenih pogojev. V prejšnjem predavanju smo to težavo že rešili s pomočjo parametričnih in negeagetričnih meril.

Druga naloga - preglejte težnjo kot periodična sprememba znaka. Ta funkcija je sama po sebi odvisna ali ni odvisna od spremenljivke stanja (lahko je odvisna od neznanih pogojev ali nekontroliranega raziskovalca). Toda to ni pomembno za obravnavano nalogo, ki je omejena le na identifikacijo trenda in njegovih značilnosti.

Preverjanje hipotez odsotnosti ali prisotnosti trendov se lahko izvede z merilom Abbeya . Merila ABBE. Zasnovan za preverjanje hipotez o enakosti povprečnih vrednosti, določenih za 4

Empirična vrednost merila ABBE se izračuna s formulo:

(8)

kje je povprečna aritmetika vzorca;

str- število vrednosti v vzorcu.

V skladu z merilom se hipoteza enakosti medija odkloni (se vzame alternativna hipoteza), če je vrednost statistike. Tabela (kritična) Vrednost statistike se določi iz tabele za q-kriterije ABBE, ki se z okrajšavami izposoje iz L.N. Knjiga Bolya in n.v. Smirneva (glej Dodatek 3).

Ker takšne količine, za katere lahko merilo opatija izvaja selektivne delnice ali odstotke, povprečna aritmetična in druga statistika selektivnih porazdelitev, če so blizu normalne (ali prednastalizirane). Zato se lahko merilo ABBE-a pogosto uporablja v psiholoških in pedagoških študijah. Razmislite o primeru identifikacije trendov z merilom ABBE.

Primer 4. V zavihku. 5 prikazuje dinamiko odstotka študentovIV. Seveda, na "odličnih" predanih izpitih v zimskih sejah 10 let delovanja postavk orodij ,. bo zahteval trend izboljšanja zmogljivosti.

Tabela 5. Dinamika odstotka odličnih študentov četrtega tečaja za 10 let dela fakultete

Študijsko leto

1995-96

10,8

1996-97

16,4

1997-98

17,4

1998-99

22,0

1999-00

23,0

2000-01

21,5

2001-02

26,1

2002-03

17,2

2003-04

27,5

2004-05

33,0

Sodišče nič Preverjamo hipotezo o odsotnosti trenda, to je enakost interesa.

Povprečje obresti v tabeli. 5, Ugotavljamo, da \u003d 21.5. Izračunajte razliko med naslednjimi in prejšnjimi vrednostmi v vzorcu, bomo postavljeni na kvadrat in povzetki:

Podobno izračuna imenovalca v formuli (8), ki povzema kvadrate razlik med vsako meritev in povprečno aritmetiko:

Zdaj po formuli (8) dobimo:

V tabeli merilo ABBE iz Dodatka 3 ugotovimo, da je z N \u003d 10 in stopnjo pomembnega 0,05 ključnega pomena, da je bolj prejeta 0.41 ZDA, zato mora biti hipoteza enakosti odstotka "odličnih študentov" zavrnjena in ena lahko sprejme alternativno hipotezo o prisotnosti trenda..

Tretja naloga je odkrivanje vzorcev, izraženih v obliki korelacijske enačbe (regresija).

Primer 5. Estonskega raziskovalca ya. Mikk, preučevali težave pri razumevanju besedila, vzpostavili "formulo berljivosti", ki je več linearne regresije:

Ocena težavnosti razumevanja besedila, \\ t

kjer je x 1 dolžina neodvisnih ponudb v številu tiskanih znakov,

x 2 - odstotek različnih neznancev,

x 3 - Povzetek ponavljajočih se konceptov, ki jih je izrazil samostalnik .

S primerjavo regresijskih koeficientov, ki izražajo stopnjo vpliva dejavnikov, lahko vidimo, da je težava razumevanja besedila določena predvsem z abrazijo. Dvakrat manj (0,27) Težava razumevanja besedila je odvisna od števila neznanih besed in skoraj ni odvisna od dolžine ponudbe.

Zgornje tehnike za preverjanje statističnih hipotez na pomembnosti razlik med dvema povprečja v praksi imajo omejeno uporabo. To je posledica dejstva, da je treba ugotoviti delovanje vseh možnih pogojev in dejavnikov produktivnega znaka, polja in laboratorijskih eksperimentov, ki se običajno izvajajo z uporabo ne dveh, ampak večjega števila vzorcev (1220 ali več).

Pogosto raziskovalci primerjajo srednje velike vzorce, združene v en sam kompleks. Na primer, s preučevanjem učinka različnih vrst in odmerkov gnojil na pridelek pridelkov se eksperimenti ponovijo v različnih različicah. V teh primerih, paper primerjave postajajo obsežnega, in statistična analiza celotnega kompleksa zahteva uporabo posebne metode. Ta metoda, razvita v matematični statistiki, je bila imenovana disperzijska analiza. Prvič, angleški statistični R. Fisher je bil uporabljen pri obdelavi rezultatov agronomskih poskusov (1938).

Analiza disperzije.- To je metoda statistične ocene zanesljivosti manifestacije odvisnosti od značilnosti enega ali več dejavnikov. S pomočjo metode disperzijske analize se statistične hipoteze pregledajo glede na povprečje v več splošnih sodelovanjih, ki imajo normalno porazdelitev.

Disperzijska analiza je ena od glavnih metod statistične ocene rezultatov poskusa. Prav tako prejme analizo ekonomskih informacij. Analiza disperzij omogoča vzpostavitev, kako deforktivni kazalniki povezave učinkovitih in faktorskih lastnosti zadostujejo za razširjanje podatkov, izbranih na splošni populaciji. Prednost te metode je, da daje dovolj zanesljivih sklepov o vzorcih majhnih števil.

Raziskovanje variacije učinkovite funkcije pod vplivom enega ali več dejavnikov, ki uporabljajo disperzijsko analizo, je mogoče doseči poleg splošnih ocen pomembnosti odvisnosti, tudi ocenjevanje razlik v vrednosti povprečja, ki se oblikujejo na različnih ravneh dejavnikov in pomembnost interakcije dejavnikov. Disperzijska analiza se uporablja za preučevanje odvisnosti od kvantitativnih in kvalitativnih znakov, kot tudi, ko se združijo.

Bistvo te metode je v statistični študiji o verjetnosti vpliva enega ali več dejavnikov, kot tudi njihovo interakcijo na produktivni osnovi. V skladu s tem, s pomočjo disperzijske analize, so rešene tri glavne naloge: 1) celovita ocena razlik pomembnosti med povprečjem skupine; 2) ocena verjetnosti interakcije dejavnikov; 3) Ocena razlik pomembnosti med srednjimi pari. Najpogosteje morajo take naloge rešiti raziskovalce pri izvajanju poljskih in zootehničnih poskusov, ko se preučuje vpliv več dejavnikov.

Shematski diagram disperzijske analize vključuje vzpostavitev glavnih virov variacije produktivne značilnosti in določitve sprememb (vsote kvadratov odstopanj) z viri njegove tvorbe; določanje števila stopenj svobode, ki ustreza komponentam celotne variacije; Izračuni disperzij kot razmerje med ustreznimi količinami sprememb na njihovo število stopenj svobode; Analiza odnosa med disperzijami; Ocena natančnosti razlike med povprečjem in oblikovanjem zaključkov.

Navedena shema je shranjena tako s preprostimi modeli variance, ko so podatki združeni z eno funkcijo in v primeru kompleksnih modelov, ko so podatki razvrščeni v dva in velika številka. Vendar pa je postopek s povečanjem števila skupinskih značilnosti, je proces zapleten z razgradnjo skupne variacije na virih svojega izobraževanja.

V skladu s shematskim diagramom je lahko disperzijska analiza zastopana v obliki petih dosledno opravljenih korakov:

1) Identifikacija in razgradnja variacije;

2) določitev števila sprememb glede svobode;

3) izračun disperzij in njihovih razmerij;

4) analiza disperzij in njihovih razmerij;

5) Ocena zanesljivosti razlike med povprečjem in oblikovanjem sklepov za preverjanje ničelne hipoteze.

Najbolj dolgotrajni del disperzijske analize je prva faza - opredelitev in razgradnja variacije na virih njegove tvorbe. Postopek za razgradnjo skupne variacije je bil podrobno obravnavan v poglavju 5.

Rešitev problema disperzijske analize je zakon razgradnje (dodatek) variacije, v skladu s katerim je skupna variacija (nihanja) produktivnega atributa razdeljena na dva: variacije zaradi delovanja preiskovanega faktorja (faktorjev) in spremembo, ki jo povzroča delovanje naključnih vzrokov, to je,

Predpostavimo, da je v celotnem študiju razdeljen na faktor več skupin, od katerih je vsaka značilna njegova povprečna vrednost učinkovitega znaka. V tem primeru se lahko spreminjanje teh vrednosti pojasni z dvema vrstama razlogov: tisti, ki delujejo na produktivni funkciji, so sistematično in jih je mogoče prilagoditi med opravljenim poskusom in jih ni mogoče prilagoditi. Očitno je, da je medskupina (faktorska ali sistematična) variacija odvisna predvsem od delovanja faktorja v študiju, in intragroup (preostalo ali naključno) je iz naključnih dejavnikov.

Da bi ocenili točnost razlik med povprečjem skupine, je treba določiti medgroupsko in intragroupsko spremembo. Če variacija medskupin (faktorjev) bistveno presega nihanje intragroup (preostale) variacije, je faktor vplival na produktivno podlago, kar bistveno spreminja vrednosti povprečnih vrednosti skupine. Toda vprašanje se pojavi, kakšen je odnos med Mіzhrup in notranjimi variacijami, je mogoče obravnavati kot zadostne za sklepanje o zanesljivosti (pomembnosti) razlik med povprečjem skupine.

Oceniti pomembnost razlik med povprečjem in besedilo naslovov za preskušanje ničelne hipoteze (H0: X1 \u003d X2 \u003d ... \u003d XP) v disperzijski analizi, se uporablja poseben standard - merilo G, katerega Ustanovljen je bil distribucijski zakon, ki je bil R. Fisher. To merilo je razmerje med dvema disperzijama: faktoria, ki ga ustvari dejanje faktorja, ki je predmet študije, in preostanek, ki ga povzroča delovanje naključnih vzrokov:

Disperzijsko razmerje R \u003d £\u003e in : £ * 2 American Statistika SneEla je predlagano, da označimo pismo izumitelja disperzijske analize R. Fisher.

Disperzije ° 2 О2 so ocene razpršenosti splošne populacije. Če so vzorci z disperzijo ° 2 ° 2 izdelani iz istega splošnega niza, kjer so imele različice vrednosti naključnega znaka, potem je naključna neskladje v vrednosti ° 2 ° 2.

Če je v poskusu, se učinek več dejavnikov (A, B, C, itd) preveri, razpršenost zaradi delovanja vsakega od njih mora biti primerljiva z ° E.GR. , jaz.

Če je vrednost faktorja disperzije veliko bolj preostala, je dejavnik bistveno vplival na rezultat in obratno.

V večfaktorskih poskusih, poleg odstopanj, zaradi delovanja vsakega dejavnika, je skoraj vedno variacija zaradi interakcije dejavnikov ($ AV: ^ ls ^ $ $ Liis). Bistvo interakcije je, da se učinek enega dejavnika bistveno razlikuje na različnih ravneh drugega (na primer učinkovitost kakovosti tal pod različnimi odmerki gnojil).

Medsebojno delovanje dejavnikov je treba oceniti tudi s primerjavo ustreznih disperzij 3 ^ V.gr:

Pri izračunu dejanske vrednosti merilo B-merilo v številu se jemlje velika disperzija, tako da B\u003e 1. Očitno je, da bi bilo več merilo, pomembnejše razlike med disperzijami. Če je B \u003d 1, se odstrani vprašanje ocenjevanja pomembnosti razlik v disperzijah.

Da bi določili meje naključnih nihanj, je razmerje razpršilnikov razvilo posebne mize B-distribucije (adjd. 4 in 5). Merilo bi se delovalo z verjetnostjo in je odvisno od števila stopenj svobode variacije k1. in k2 dveh primerjalnih disperzij. Običajno se uporabljata dve tabeli, ki omogočata sklepanje o največji visoki vrednosti merila za ravni pomembnosti 0,05 in 0,01. Raven pomena je 0,05 (ali 5%), pomeni, da lahko le v 5 primerih od 100 merila B sprejme vrednost, ki je enaka določeni v tabeli ali nad njim. Zmanjšanje stopnje pomembnosti od 0,05 do 0,01 vodi k povečanju vrednosti merilo, bi bila med dvema disperzijama zaradi delovanja samo naključnih vzrokov.

Vrednost merila je odvisna tudi neposredno od števila svobode svobode dveh primerjalnih disperzij. Če število stopenj svobode nagiba k neskončnosti (K-M), potem je odnos do dveh disperzij prizadeva za enoto.

Vrednost tabele merilo B kaže na možno naključno spremenljivko razmerja dveh disperzij na dani stopnji pomena in ustrezno število stopenj svobode za vsako od primerjanih disperzij. Navedene tabele zagotavljajo vrednost, ki se uporablja za vzorce iz iste splošne populacije, kjer so razlogi za spremembe vrednosti le naključni.

Vrednost R se nahaja ob tabelah (adj. 4 in 5) na križišču ustreznega stolpca (število stopenj svobode za večjo disperzijo je K1) in linije (število stopenj svobode za manjšo disperzijo je K2 ). Torej, če je več disperzij (števca D) K1 \u003d 4, in manjši (imenovalec D) K2 \u003d 9, potem hektarji na ravni pomembnosti a \u003d 0,05 bo 3,63 (adj. 4). Torej, zaradi delovanja naključnih razlogov, saj majhne vzorce, disperzija enega vzorca lahko na 5-odstotni ravni pomembnosti presega disperzijo za drugi vzorec za 3,63 krat. Z zmanjšanjem ravni pomembnosti od 0,05 do 0,01, se bo vrednost tabele merilo, kot je navedeno zgoraj, povečala. Tako bo pod enakimi stopnjami svobode K1 \u003d 4 in K2 \u003d 9 in A \u003d 0,01, vrednost tabele merila M merila MIR 6,99 (AD. 5).

Razmislite o postopku za določanje števila stopenj svobode v disperziji. Število stopenj svobode, ki ustreza skupnemu znesku kvadratov odstopanj, se zniža na ustrezne komponente v podobnem razgradnji zneska odstopanj odstopanj (^ Total \u003d Ne. ^ GR +] ¥ VHR) , to pomeni, da je skupno število stopenj svobode (K ") razdeljeno s številom stopenj svobode za medskupino (K1) in intragroup (K2) različice.

Torej, če selektivni agregat sestavljen iz N. Opažanja, razdeljena t. skupine (število možnosti izkušenj) in str podskupine (število ponovitev), število stopenj svobode, da ustrezno bo:

a) za skupno vsoto kvadratov odstopanj (Y7ZAG)

b) za medsebojno vsoto kvadratov odstopanj ^ M.gr)

c) za vsoto intragroupskih kvadratov odstopanj vvg)

V skladu s pravili dodajanja, različic:

Na primer, če so bile izkušnje v eksperimentu (T \u003d 4) v petih popravil (n \u003d 5), in skupno število opazovanj n \u003d \u003d \u003d \u003d t. o n \u003d 4 * 5 \u003d 20, nato pa je število stopenj svobode:

Poznavanje vsote kvadratov odstopanj Število stopenj svobode lahko določite nepovezane (prilagojene) ocene za tri disperzije:

Nič hipoteza H0 z merilom B se preveri na enak način kot v skladu z merili študenta. Če želite sprejeti odločitev o preverjanju H0, je treba izračunati dejansko vrednost merila in jo primerjati z vrednostjo tabele BA za sprejeto raven pomembnosti a in število svobode k1. in K2 za dve disperzije.

Če BFAKG\u003e BA, potem v skladu s sprejeto ravnijo, se lahko sklene, da se razlike v selektivnih disperzijah določijo ne le z naključnimi dejavniki; Bistveni so. Nič hipoteza v tem primeru zavrača in obstaja razlog za povedati, da dejavnik bistveno vpliva na rezultat rezultata. Če.< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Uporaba modela disperzijske analize je odvisna od količine proučevanih dejavnikov in načina oblikovanja vzorca.

glede na število dejavnikov, ki določajo spremembo produktivne funkcije, lahko vzorce oblikuje z enim, dvema in velikima številom dejavnikov. V skladu s tem je disperzijska analiza razdeljena na enkratni faktor in večfaktorje. V nasprotnem primeru se imenuje tudi kompleks z enim faktorjem in večfatorjem.

Shema razgradnja splošnih sprememb je odvisna od oblikovanja skupin. Morda je naključno (opazovanje iste skupine ni povezano s pripombami druge skupine) in nekontrole (opazovanje obeh vzorcev je medsebojno povezano z ravnijo eksperimentalnih pogojev). V skladu s tem, neodvisni in odvisni od vzorcev. Neodvisni vzorci se lahko oblikujejo z gladkimi in neenakomernimi številkami. Nastajanje odvisnih vzorcev pomeni njihovo enako število.

Če so skupine oblikovane v golim, potem skupna variacija produktivne funkcije vključuje skupaj s faktorjem (Mіzhrupovo) in preostalo spremembo variacije ponovitev, to je

V praksi morate v večini primerov upoštevati odvisne vzorce, ko se pogoji za skupine in podskupine izravnavajo. Torej, na terenskih izkušnjah, je celotno območje razdeljeno v bloke, z najbolj vino pogojev. Hkrati pa vsaka izkušnja izkušenj dobi enake možnosti, ki jih je treba predstaviti v vseh blokih, kot je izravnavanje pogojev za vse preverljive možnosti, dosežene izkušnje. Ta metoda izkušenj izgradnje je prejela ime metode RenDodition Blocks. Podobno potekajo tudi eksperimenti z živalmi.

Pri obdelavi z metodo disperzijske analize socialno-ekonomskih podatkov, je treba upoštevati, da je na podlagi bugatiselnosti dejavnikov in njihovih odnosov težko vzpostaviti stopnjo objektivnega vpliva vsakega posameznega dejavnika na učinkovitost znak. Zato je raven preostale variacije določena ne le z naključnimi vzroki, temveč tudi pomembni dejavniki, ki niso bili upoštevani pri gradnji modela disperzijske analize. Posledično je preostala, disperzija kot osnova za primerjavo včasih neustrezna za njen predvideni namen, je očitno zasenčena v velikosti in ne more delovati kot merilo za pomen vpliva dejavnikov. V zvezi s tem, ko gradimo modele disperzijske analize, problem izbora bistvenih dejavnikov in izravnalnih pogojev za manifestacijo vsakega od njih postane pomembna. Poleg tega. Uporaba disperzijske analize kaže na normalno ali običajno porazdelitev preučenih statističnih agregatov. Če ta pogoj ni prenesen, bodo ocene, pridobljene v disperziji analize, pretirane.

V praktičnih dejavnostih zdravniki pri izvajanju medicinskih in bioloških, socioloških in eksperimentalnih študij je treba ugotoviti vpliv dejavnikov na rezultate preučevanja zdravja prebivalstva, pri ocenjevanju poklicnih dejavnosti, učinkovitosti inovacij.

Obstajajo številne statistične metode za določitev sile, smeri, vzorcev vpliva dejavnikov na rezultat splošnih ali selektivnih sklopov (izračun merilo I, korelacijska analiza, regresija, χ 2 - (merilo za soglasje Pearson et Al.). Razpršena analiza je razvila in predlagala angleški znanstveniki, matematika in genetski Ronald Fisher v 20-ih XX stoletja.

Disperzijska analiza se pogosteje uporablja v raziskavah javnega zdravja in zdravstvenih raziskav, da bi preučila vpliv enega ali več dejavnikov na rezultat. Temelji na načelu "odsev raznolikosti vrednot dejavnikov (-ov) o raznolikosti vrednosti učinkovitega znaka" in vzpostavlja učinek vpliva faktorja (-ov) v selektivni agregati.

Bistvo metode disperzijske analize je merjenje posameznih disperzij (splošno, faktorial, preostalih) in nadaljnje določanje moči (delež) vpliva raziskanih dejavnikov (ocene vloge vsakega od dejavnikov ali njihovega sklepa učinkoviti (e) znak (-i).

Analiza disperzije. - To je statistična metoda za ocenjevanje razmerja med faktorjem in učinkovitimi značilnostmi v različnih skupinah, izbranih naključno na podlagi opredelitve razlik (raznolikost) znakov znakov. Disperzijska analiza temelji na analizi odstopanj vseh enot skupne kombinacije povprečne aritmetike. Kot merilo odstopanj, disperzijo (b) je vzet - povprečni kvadrat odstopanj. Odstopanja, ki jo povzročajo učinki ocene faktorja (faktor), se primerjajo z obsegom odstopanj, ki jih povzročajo naključne okoliščine. Če so odstopanja zaradi atributa faktorja pomembnejša od naključnih odstopanj, se verjame, da ima dejavnik pomemben vpliv na rezultat.

Za izračun disperzije vrednosti odstopanj vsake možnosti (vsaka zabeležena numerična vrednost elementa) iz povprečne aritmetične višine na kvadrat. S tem se znebite negativnih znakov. Nato se ta odstopanja (razlike) seštejejo in delijo s številom opazovanj, tj. Odstopanja. Pridobimo se vrednosti disperzijskih vrednosti.

Pomembna metodološka vrednost za uporabo disperzijske analize je pravilna tvorba vzorca. Odvisno od namena in nalog se lahko selektivne skupine oblikujejo naključno neodvisno drug od drugega (nadzorne in eksperimentalne skupine za preučevanje nekaterih kazalnikov, na primer, učinek visokega krvnega tlaka na razvoj kapi). Takšni vzorci se imenujejo neodvisni.

Pogosto se rezultati učinkov dejavnikov preiskujejo iz iste selektivne skupine (na primer, pri istih bolnikih) pred in po izpostavljenosti (zdravljenje, preprečevanje, rehabilitacijske dejavnosti), se taki vzorci imenujejo odvisni.

Disperzijska analiza, v kateri se preveri vpliv ene faktorja, se imenuje eno-faktor (enodimenzionalna analiza). Pri preučevanju učinka več kot enega dejavnika se uporablja večfaktorska disperzija analiza (večdimenzionalna analiza).

Faktorski znaki so tisti znaki, ki vplivajo na preučeni pojav.
Izvršilne značilnosti so tisti znaki, ki se spreminjajo pod vplivom faktorjev znakov.

Za disperzijsko analizo, tako visokokakovostno (spol, poklic) in kvantitativni znaki (število bolnikov vbrizgavanja na oddelku, se lahko uporabi število dni posteljnih dni).

Metode disperzijske analize:

  1. Metoda Fisher (Fisher) je merilo F (vrednote f glej Dodatek N 1);
    Metoda se uporablja pri analizi disperzij z enim faktorjem, ko je skupna disperzija vseh opazovanih vrednosti zavrnjena na disperzijo znotraj posameznih skupin in disperzije med skupinami.
  2. Metoda "Splošni linearni model".
    Temelji na korelacijski ali regresijski analizi, ki se uporablja v večnamenski analizi.

Običajno se v medicinsko-bioloških študijah uporabljajo samo en sam faktor, največ en faktor disperzijskih kompleksov. Večfaktorske komplekse lahko preiskujejo, zaporedno analiziranje enega ali dveh faktorskih kompleksov, dodeljenih iz celotnega opazovanega agregata.

Pogoji uporabe disperzijske analize:

  1. Cilj študije je določiti moč vpliva enega (do 3) dejavnikov na rezultat ali določitev moči skupnega vpliva različnih dejavnikov (spolov in starost, telesna dejavnost in prehrana itd.).
  2. Študijski dejavniki morajo biti neodvisni (nepovezani) med seboj. Na primer, nemogoče je preučiti skupni vpliv izkušenj in starosti, rasti in teže otrok itd. o pojavnosti prebivalstva.
  3. Izbira skupin za raziskave se izvaja randomizirana (naključna izbira). Organizacija disperzijskega kompleksa z izvajanjem načela možnosti za izbiro možnosti se imenuje randomizacija (prevod iz angleščine - naključno), tj. Naključno izbrana.
  4. Lahko uporabite tako kvantitativne in kakovostne (atributne) funkcije.

Pri izvajanju analize razpršenosti z enim faktorjem je priporočljivo (potreben pogoj za uporabo):

  1. Normalnost porazdelitve analiziranih skupin ali skladnost selektivnih skupin s splošnimi agregati z običajno distribucijo.
  2. Neodvisnost (neobjavljena) porazdelitev opazovanj v skupinah.
  3. Prisotnosti frekvence (ponavljanja) opazovanj.

Normalnost distribucije je določena z Gauss Curve (de MaeVur), ki jo je mogoče opisati s funkcijo Y \u003d F (X), kot se nanaša na število zakonov o distribuciji, ki se uporablja za približen opis pojavov, ki so naključni , verjetnostna narava. Predmet medicinskih in bioloških raziskav je verjetnostne pojave, običajno porazdelitev v takšnih študijah se zelo pogosto najde.

Načelo uporabe metode disperzijske analize

Najprej je formulirana z ničelno hipotezo, to je, predpostavlja, da preučeni dejavniki nimajo nobenega vpliva na vrednosti uspešnosti in razlike, ki so bile prejete naključne.

Potem ugotovimo, kakšna je verjetnost pridobivanja opazovanih (ali močnejših) razlik, ob upoštevanju pravice ničelne hipoteze.

Če je ta verjetnost majhna, potem zavrnemo ničelno hipotezo in ugotovite, da so rezultati študije statistično pomembni. To ne pomeni, da se dokaže z delovanjem študija dejavnikov (to je vprašanje, prvič, raziskovalno načrtovanje), vendar je še vedno malo verjetno, da je rezultat posledica nesreče.
__________________________________
* Največja sprejemljiva verjetnostna zavrnitev Pravilna ničelna hipoteza se imenuje raven pomembnosti in označena α \u003d 0,05.

Pri izvajanju vseh pogojev za uporabo disperzijske analize, razgradnjo skupne razpršenosti matematično na naslednji način:

D. \u003d D DEJSTVA + D OST. .

D. - Skupna razpršenost opazovanih vrednosti (opcija) je značilna različica skupnega povprečja. Ukrepi spremembo funkcije v celotnem prebivalstvu pod vplivom vseh dejavnikov, ki so povzročili to spremembo. Skupna raznolikost je sestavljena iz medskupine in intragroup;

D Dejstvo - Faktor (Intergroup) Dispersion, je značilna razlika med povprečjem v vsaki skupini in je odvisna od vpliva preiskovanega faktorja, v skladu s katerim je vsaka skupina diferencirana. Na primer, v skupinah različnih v etiološkem dejavniku kliničnega potek pljučnice, je povprečna raven navzkrižnega ne-etikacinov - opaženo medskupino raznolikost.

D ost. - preostalo (intragroup) disperzijo, ki označuje možnost razpršitve znotraj skupin. Odraža naključno variacijo, t.e. Del variacije, ki se pojavlja pod vplivom nedoločenih dejavnikov in neodvisno od znaka faktorja, položene v dnu skupine. Različica preučevanega atributa je odvisna od moči vpliva nekaterih nenadzorovanih naključnih dejavnikov, ki jih organizirajo (ki ga je določil raziskovalec) kot iz naključnih (neznanih) dejavnikov.

Zato je skupna variacija (disperzija) sestavljena iz variacije, ki jo povzročajo organizirani (vnaprej določeni) dejavniki, imenovani faktorska variacija in ameriški dejavniki, tj. Preostala variacija (naključna, neznana).

Analiza klasične disperzije se izvede na naslednjih korakih:

  1. Izgradnjo disperzijskega kompleksa.
  2. Izračun srednje trge odstopanj.
  3. Izračun disperzije.
  4. Primerjava faktorja in preostalih disperzij.
  5. Ocena rezultatov s teoretičnimi vrednostmi porazdelitve ribiškega sedekarja (Dodatek N 1).

Algoritem za vodenje disperzijske analize na poenostavljeni različici

Algoritem za izvedbo disperzijske analize na poenostavljeni metodi omogoča, da dobimo enake rezultate, vendar se izračuni izvedejo veliko lažje:

Faza I. Izgradnja disperzijskega kompleksa

Izgradnja disperzijskega kompleksa pomeni izgradnjo tabele, v kateri so bili dejavniki, rezultat, in izbor opazovanj (bolniki) v vsaki skupini so bili jasno razlikovali.

Eno faktorski kompleks je sestavljen iz več razdalje ene faktorja (a). Gradacije so vzorci iz različnih splošnih nastavitev (A1, A2, AZ).

Kompleks dvofaktorja - je sestavljen iz več razdalje dveh dejavnikov v kombinaciji med seboj. Etiološki dejavniki Pojavnost pljučnice so enake (A1, A2, AZ) v kombinaciji z različnimi oblikami kliničnega pretoka pljučnice (H1 - akutni, H2 - kronični).

Izvršni znak (število dni v povprečju) Etiološki dejavniki za razvoj pljučnice
A1. A2. A3.
H1. H2. H1. H2. H1. H2.
M \u003d 14 dni

Faza II. Izračun skupne sredine (m subash)

Izračun zneska opcije za vsako stopnjo faktorjev: Σ VJ \u003d V 1 + V2 + V3

Izračun skupne količine možnosti (Σ V skupaj) Za vse stopnje obrata faktorja: Σ V skupaj \u003d Σ VJ 1 + Σ VJ 2 + Σ VJ 3

Izračun srednje skupine (M GR.) Faktorski znak: M GR. \u003d Σ VJ / N,
kjer je n vsota števila opazovanj v vseh razglasih faktorja, ki ga podpišemo (σn po skupinah).

III. Izračun disperzije:

Pod vsemi pogoji za uporabo disperzijske analize je matematična formula naslednja:

D. \u003d D DEJSTVA + D OST.

D. - skupna disperzija je značilna različica (opazovane vrednosti) iz skupnega povprečja;
Dejstvo. - disperzija faktorja (medskupina), označuje spremembo povprečja skupin iz skupnega povprečja;
D ost. - Rezidualna (intragroupska) disperzija, označena z razmazovanjem možnosti znotraj skupin.

  1. Izračun faktorialne disperzije (dejstvo.): Dejstvo. \u003d Σ h - h
  2. Kalcičenje H se izvaja s formulo: H \u003d (Σ VJ) / N
  3. Calration H se izvaja s formulo: H \u003d (Σ V) 2 / N
  4. Izračun preostale disperzije: D ost. \u003d (Σ v) 2 - σ h
  5. Izračun splošne razpršenosti: D. \u003d (Σ v) 2 - σ h

IV faza. Izračun glavnega kazalnika vpliva vplivega dejavnika Kazalnik učinka vpliva (η 2) faktorja rezultata se določi z delnicami disperzijsko disperzijo (D.) na splošno disperzijo (D.), η 2 (to) - kaže, kateri delež povzroča vpliv obravnavanega faktorja med vsemi drugimi dejavniki in se določi s formulo:

V fazi. Določitev zanesljivosti rezultatov študije s strani ribolovne metode se izvaja s formulo: \\ t


F - Fisher's merilo;
F st. - vrednost tabele (glejte poglavje 1).
Σ 2 dejstvo, σ 2 ost. - faktorial in preostala odstopanja (od lat. de - od, preko ceste) - odstopanje od srednje črte, določajo formule: \\ t


r je število faktorjev.

Primerjava ribiškega merilo (F) s standardom (tabela) F se izvede z grafi za tabele, ob upoštevanju stopenj svobode: \\ t

v 1 \u003d n - 1
v 2 \u003d n - 1

Horizontalna je odvisna od VAS Vertical - V 2, na njihovem križišču, vrednost tabele F se določi, kjer je najvišja vrednost tabele p ≥ 0,05, in nižja ustreza P\u003e 0,01 in v primerjavi z izračunanim merilom F. Če Vrednost izračunanega merila F Prav tako ali več tabularna, rezultati so zanesljivi in \u200b\u200bH 0 ni zavrnjen.

Naloga:

V podjetju N. povečala raven poškodb v zvezi s katerimi je zdravnik izvedel študijo posameznih dejavnikov, med katerimi je bila preučena delovna izkušnja dela na delavnicah. Vzorci so narejeni v N. Podjetje 4 delavnice s tesnimi pogoji in naravo dela. Škodljive ravni so zasnovane za 100 delavcev v preteklem letu.

Pri preučevanju faktorja delavnice so dobili naslednje podatke:

Na podlagi podatkov o študiji je bila ničelna hipoteza (H 0) navedla na učinek delovnih izkušenj na poškodbo zaposlenih v podjetju A.

Naloga
Potrdite ali ovržemo ničelno hipotezo z analizo disperzijočev z enim faktorjem:

  1. določite moč vpliva;
  2. natančnost faktorja vpliva.

Stopnje uporabe disperzijske analize
za določitev vpliva faktorja (delovne izkušnje) na rezultat (stopnja poškodbe)

Izhod. V vzorčnem kompleksu je bilo razkrito, da je moč vpliva delovnih izkušenj na stopnjo škode 80% v skupnem številu drugih dejavnikov. Za vse rastlinske trgovine je možno z verjetnostjo 99,7% (13,3\u003e 8.7), da se trdijo, da delovne izkušnje vplivajo na stopnjo škode.

Tako ničelna hipoteza (H 0) ne zavrača in vpliv izkušenj z delom na ravni poškodb v tovarniških trgovinah A velja za dokazano.

Vrednost F (Fisher's Merilo) je standardna pri p ≥ 0,05 (najvišja vrednost) pri p ≥ 0,01 (nižja vrednost)

1 2 3 4 5 6 7 8 9 10 11
6 6,0
13,4
5,1
10,9
4,8
9,8
4,5
9,2
4,4
8,8
4,3
8,5
4,2
8,3
4,1
8,1
4,1
8,0
4,1
7,9
4,0
7,8
7 5,6
12,3
4,7
9,6
4,4
8,5
4,1
7,9
4,0
7,5
3,9
7,2
3,8
7,0
3,7
6,8
3,7
6,7
3,6
6,6
3,6
6,5
8 5,3
11,3
4,6
8,7
4,1
7,6
3,8
7,0
3,7
6,6
3,6
6,4
3,5
6,2
3,4
6,0
3,4
5,9
3,3
5,8
3,1
5,7
9 5,1
10,6
4,3
8,0
3,6
7,0
3,6
6,4
3,5
6,1
3,4
5,8
3,3
5,6
3,2
5,5
3,2
5,4
3,1
5,3
3,1
5,2
10 5,0
10,0
4,1
7,9
3,7
6,6
3,5
6,0
3,3
5,6
3,2
5,4
3,1
5,2
3,1
5,1
3,0
5,0
2,9
4,5
2,9
4,8
11 4,8
9,7
4,0
7,2
3,6
6,2
3,6
5,7
3,2
5,3
3,1
5,1
3,0
4,9
3,0
4,7
2,9
4,6
2,9
4,5
2,8
4,5
12 4,8
9,3
3,9
6,9
3,5
6,0
3,3
5,4
3,1
5,1
3,0
4,7
2,9
4,7
2,9
4,5
2,8
4,4
2,8
4,3
2,7
4,2
13 4,7
9,1
3,8
6,7
3,4
5,7
3,2
5,2
3,0
4,9
2,9
4,6
2,8
4,4
2,8
4,3
2,7
4,2
2,7
4,1
2,6
4,0
14 4,6
8,9
3,7
6,5
3,3
5,6
3,1
5,0
3,0
4,7
2,9
4,5
2,8
4,3
2,7
4,1
2,7
4,0
2,6
3,9
2,6
3,9
15 4,5
8,7
3,7
6,4
3,3
5,4
3,1
4,9
2,9
4,6
2,8
4,3
2,7
4,1
2,6
4,0
2,6
3,9
2,5
3,8
2,5
3,7
16 4,5
8,5
3,6
6,2
3,2
5,3
3,0
4,8
2,9
4,4
2,7
4,2
2,7
4,0
2,6
3,9
2,5
3,8
2,5
3,7
2,5
3,6
17 4,5
8,4
3,6
6,1
3,2
5,2
3,0
4,7
2,8
4,3
2,7
4,1
2,6
3,9
2,6
3,8
2,5
3,8
2,5
3,6
2,4
3,5
18 4,4
8,3
3,5
6,0
3,2
5,1
2,9
4,6
2,8
4,2
2,7
4,0
2,6
3,8
2,5
3,7
2,7
3,6
2,4
3,6
3,4
3,5
19 4,4
8,2
3,5
5,9
3,1
5,0
2,9
4,5
2,7
4,2
2,6
3,9
2,5
3,8
2,5
3,6
2,4
3,5
2,4
3,4
2,3
3,4
20 4,3
8,1
3,5
5,8
3,1
4,9
2,9
4,4
2,7
4,1
2,6
3,9
2,5
3,7
2,4
3,6
2,4
3,4
2,3
3,4
2,3
3,3

  1. Vlasov V.V. Epidemiologija. - M.: Gootar-medu, 2004. 464 str.
  2. Arkcionanova ch., Lavrova i.g., Trohina i.m. Nekatere sodobne metode statistične analize v medicini. - M.: Metrosnab, 1971. - 75 str.
  3. Zaitsev V.M., LIFLYANDSKY V.G., Marinkin V.I. Medicinske statistike. - St. Petersburg: LLC "Založništvo Foliant", 2003. - 432 str.
  4. Platonov a.e. Statistična analiza v medicini in biologiji: naloge, terminologija, logika, računalniške metode. M.: Publisher ramen, 2000. - 52 str.
  5. Pochinsky n.a. Biometrija. - Založnik Sibirskega oddelka Akademije znanosti ZSSR Novosibirsk. - 1961. - 364 str.

Disperzijska analiza je analiza variabilnosti učinkovite funkcije pod vplivom vseh nadzorovanih spremenljivih dejavnikov. (V tuji literaturi se ANOVA imenuje anasis variance).

Rezultat se imenuje tudi odvisni znak, in vplivajo na dejavnike - neodvisni znaki.

Omejitev metode: Neodvisne funkcije se lahko merijo z nominalnim, rednim ali metričnim odvisnim lestvici - samo na metrični. Za disperzijsko analizo se razlikujejo več tovarn in vsi elementi vzorca so razvrščeni v skladu s temi izravnavanji.

Besedilo hipotez v disperzijski analizi.

Ničelna hipoteza: "Srednje vrednosti učinkovite funkcije v vseh pogojih faktorja (ali faktorska gradacija) so enake."

Alternativna hipoteza: "Povprečne vrednosti produktivne lastnosti v različnih pogojih dejanja faktorja so različne."

Disperzijska analiza je mogoče razdeliti na več kategorij, odvisno od:

o številu obravnavanih neodvisnih dejavnikov;

iz števila učinkovitih spremenljivk, ki so predmet dejavnikov;

iz narave, narave pridobivanja in odnos v primerjavi z vzorci vrednot.

V prisotnosti enega dejavnika, katerega vpliv se preiskuje, se disperzijska analiza imenuje enkratni faktor in razpade za dve sorti:

- Analiza nepovezanih vzorcev (i.e. - različne) . Na primer, ena skupina anketirancev rešuje problem v pogojih tišine, druga je v hrupnem prostoru. (V tem primeru bi se z ničelno hipotezo zveni takole: "Povprečni čas za reševanje problemov takega tipa bo enako v tišini in v hrupnem prostoru," to je odvisno od faktorja hrupa .)

- Analiza povezanih vzorcev , To pomeni, da sta dva zamrznjena za isto skupino anketirancev v različnih pogojih. Isti primer: Prvič je bila naloga rešena v tišini, druga pa je podoben problem - pod pogoji motenj hrupa. (V praksi bi bilo treba takšne poskuse približati previdno, saj lahko neupravičeni "učni" dejavnik začne delovati, katerega vpliva Explorer tveganje pripisuje pri atributu sprememb pogojev, in sicer - hrup.)

V primeru, da se preiskuje sočasni vpliv dveh ali več dejavnikov, se ukvarjamo analiza večfaktorske disperzije, ki jih je mogoče razdeliti tudi z vrsto vzorca.

Če so učinki dejavnikov predmet več spremenljivk - gre za večdimenzionalna analiza . Večdimenzionalna analiza disperzij je bolj primerna za enodimenzionalno le, če odvisne spremenljivke niso neodvisne drug od drugega in se medsebojno povezujejo.

Generaliziran problem disperzijske analize je, da iz skupne variabilnosti znaka razlikovanja treh zasebnih sprememb:

    variabilnost zaradi delovanja vsake od preučevanih neodvisnih spremenljivk (dejavnikov).

    variabilnost zaradi interakcije preučevanih neodvisnih spremenljivk.

    variabilnost je naključna zaradi vseh neodgovornih okoliščin.

Za oceno spremenljive spremenljive variable in njihovo interakcijo se izračuna razmerje med ustreznim kazalnikom variabilnosti in naključne variabilnosti. Kazalnik tega razmerja je merilo F - Fisher.

Večja je spremenljivost znaka posledica dejanja vplivanja na dejavnike ali njihovo interakcijo, višje so empirične vrednosti merila .

V formuli merila izračuna merilo obstajajo vrednotenja disperzij in zato se ta metoda nanaša na izpust parametric.

Neavametrični analog analize disperzij z enim faktorjem za neodvisne vzorce je merilo Kraklala-Wallace. Je kot merilo Mann-Whitneyja za dva neodvisna vzorca, izjema, ki povzema vrste za vsako od njih skupina.

Poleg tega se lahko mediano merilo uporabi pri analizi disperzij. Ko se uporablja za vsako skupino, se določi število opazovanj, ki presega mediano, izračunano v vseh skupinah, in število pripomb, ki so manjša od srednjega, po katerem je zgrajena dvodimenzionalna konjugacijska tabela.

Kriterij Friedmana je ne-parametrična generalizacija par t-merilo za vzorce s ponovljenimi meritvami, ko je število spremenljivke primerjalo več kot dva.

V nasprotju s korelacijsko analizo, v disperzijski analizi, raziskovalec izhaja iz predpostavke, da nekatere spremenljivke delujejo kot vplivajo (imenovane dejavnike ali neodvisne spremenljivke), druge (učinkovite značilnosti ali odvisne spremenljivke) vplivajo ti dejavniki. Čeprav taka predpostavka temelji na matematičnih postopkih izračuna, vendar pa zahteva previdnost glede vzroka in posledic.

Na primer, če smo navedli hipotezo o odvisnosti uspeha uradnika iz faktorja H (socialni pogum na Kattel), potem nasprotno ni izključeno: Socialni pogum anketiranja se lahko pojavi (okrepi) zaradi uspeha njenega dela na eni strani. Po drugi strani pa: Ali bi se morali izmeriti poročilo o tem, kako je bil izmerjen uspeh "? Če ni bilo objektivnih značilnosti (modne "obseg" prodaje ", itd.), In strokovne ocene sodelavcev, potem obstaja možnost, da se" uspeh "lahko nadomesti z vedenjskimi ali osebnimi značilnostmi (voljna, komunikativna, zunanje manifestacije agresivnost. itd.

Analiza disperzije.

1. Koncept disperzijske analize

Analiza disperzije.- To je analiza variabilnosti znaka pod vplivom nadzorovanih spremenljivih faktorjev. V tuji literaturi je disperzijska analiza pogosto označena kot ANOVA, ki se prevede kot analiza variabilnosti (analiza variance).

Problem disperzijske analize To je iz skupne variabilnosti znaka identifikacije variabilnosti druge vrste:

a) variabilnost zaradi delovanja vsake od preučevanih neodvisnih spremenljivk;

b) variabilnost zaradi interakcije preučevanih neodvisnih spremenljivk;

c) naključna variabilnost zaradi vseh drugih neznanih spremenljivk.

Variabilnost, ki jo povzroča delovanje preučenih spremenljivk, in njihova interakcija s korelacijo z naključno variabilnostjo. Kazalnik tega razmerja je merilo F Fisher.

V formuli za izračun merila F obstajajo ocene disperzij, to je parametri porazdelitve funkcije, zato merilo F je parametrični merilo.

Večja je spremenljivost funkcije zaradi spremenljivke (faktorje) študije (dejavniki) ali njihova interakcija, višje empirične vrednosti merila.

Nič hipoteza v disperziji analizo bo navedena, da so povprečne vrednosti preiskovalnega preskusa v vseh razdaljah enaka.

Alternativa hipoteza bo trdila, da so povprečne vrednosti nastale značilnosti v različnih razdaljih faktorja v študiji različne.

Analiza disperzij nam omogoča, da navajamo spremembo znaka, vendar ne navaja smerte spremembe.

začnimo razmisliti o disperzijski analizi iz najpreprostejšega primera, ko se dejanje preiskuje enospremenljivka (en faktor).

2. Analiza disperzije z enim faktorjem za nepovezane vzorce

2.1. Namen metode

Metoda analize disperzij z enim faktorjem se uporablja v primerih, ko se spremembe preiskujejo s spremembami produktivnosti pod vplivom spreminjajočih se pogojev ali izrednih razdalje vsakega dejavnika. V tej izvedbi je izpostavljen učinek vsakega od diplomiranja faktorjev drugačenvzorčenja predmetov. Gradacije faktorja morajo biti vsaj tri. (Razvrščanje so lahko dva, vendar v tem primeru ne bomo mogli vzpostaviti nelinearnih odvisnosti in bolj inteligentna uporaba je enostavnejša).

Ne-parametrična varianta te vrste analize je merilo zajak Wallis.

Hipoteza

H 0: Razlike med faktorirami (različni pogoji) niso bolj izrazite kot naključne razlike v vsaki skupini.

H 1: Razlike med faktorirami (različni pogoji) so bolj izrazite kot naključne razlike v vsaki skupini.

2.2. Omejitve analize disperzij z enim faktorjem za nepovezane vzorce

1. Analiza razpršenosti z enim faktorjem zahteva vsaj tri stopnjevanja faktorja in vsaj dve osebi v vsaki stopnji.

2. Nastala značilnost mora biti običajno porazdeljena v vzorcu v študiji.

Res je, ponavadi ni navedeno, ali gre za porazdelitev lastnosti v celotnem pregledanem vzorcu ali v delu njegovega dela, ki predstavlja disperzijski kompleks.

3. Primer reševanja problema z analizo disperzije z enim faktorjem za nepovezane vzorce na primer:

Tri različne skupine šestih subjektov so prejele sezname iz desetih besed. Prva skupina besed je bila predstavljena z nizko hitrostjo -1 besedo v 5 sekundah, druga skupina po povprečni hitrosti - 1 besedo v 2 sekundah in tretjo skupino pri visoki hitrosti - 1 besedo na sekundo. Predvidevano je bilo, da bodo kazalniki predvajanja odvisni od stopnje predstavitve besed. Rezultati so predstavljeni v tabeli. Ena.

Število reproduciranih besed Tabela 1.

Testna številka

nizka hitrost

povprečna hitrost

visoka hitrost

skupni znesek

H 0: Razlike v obsegu besed medskupine niso bolj izrazite kot naključne razlike notranjostvsaka skupina.

H 1: Razlike v obsegu besed medskupine so bolj izrazite kot naključne razlike notranjostvsaka skupina. Z uporabo eksperimentalnih vrednosti, predstavljenih v tabeli. 1, določite nekatere vrednosti, ki bodo potrebne za izračun merilo F.

Izračun osnovnih vrednosti za analizo disperzij z enim faktorjem je prisoten v tabeli:

Tabela 2.

Tabela 3.

Zaporedje operacij v analizi disperzij z enim faktorjem za nepovezane vzorce

Oznaka SS se pogosto najde v tem in naslednjih tabelah - zmanjšanje od "vsote kvadratov" (vsota kvadratov). To zmanjšanje se najpogosteje uporablja v prevodnih virih.

Ss. dejstvo pomeni variabilnost funkcije, ki jo povzroča delovanje preiskovanega faktorja;

Ss. običajni - splošna variabilnost znaka;

S. Ca. -Tagnosti zaradi neodloženih dejavnikov, "naključne" ali "preostale" variabilnosti.

GOSPA. - "Srednji kvadrat" ali matematično pričakovanje vsote kvadratov, povprečne vrednosti ustreznih SS.

dF. - število stopenj svobode, ki, ko razmišljajo o neparametričnih merilih, označujemo grško pismo v..

Zaključek: H 0 odstopa. Sprejel H1. Razlike v obsegu reprodukcije besed med skupinami so bolj izrazite kot naključne razlike v vsaki skupini (α \u003d 0,05). Torej, stopnja predstavitve besed vpliva na njihovo razmnoževanje.

Spodaj je predstavljen primer reševanja naloge v Excelu:

Začetni podatki:

Z ukazom: Service-\u003e Analiza podatkov-\u003e Analiza disperzije Eno faktor, dobimo naslednje rezultate:

Nalaganje ...Nalaganje ...