parametrii distribuiți - studopediya

Parametrul numit valoarea de distribuție calculată de setul de observații și oferă informații specifice despre proprietățile de mijloc sau de altă distribuție :. valori Scatter, asimetrii, etc. coeficientul de boltire diverșilor parametri pot fi rezumate în următoarele grupe.







Parametrii centrului de distribuție

1) Moda. După cum sa menționat deja, moda se numește abscisa graficului de distribuție de top. Moda este notat cu M (Signet Roundhand TCA) sau.

În cazul în care distribuția este foarte oblică, moda - o bună aproximare a centrului împreună, sau mijlocul probei.

În cazul în care datele sunt grupate și construite histograme, grupul cu cea mai mare valoare se numește bandă de frecvență modal (de exemplu, The tabl.2.5 al nouălea grup și fig.2.3). Mid-modal grup corespunde aproximativ modei.

2) Median. Se numește valoare x mediană pentru care 50% din setul agregat de observații sau mai mică decât această valoare, iar 50% - mai mult ea. mediană Desemnarea sau Me.

Mediana se calculează după cum urmează. În primul rând, aranja observațiile în ordine crescătoare. În cazul în care un număr impar de observații, mediana este valoarea centrală. În cazul în care chiar și - că jumătate din suma valorilor mediane.

Dupa comanda: S1U =. Mediana pentru un număr impar de observații: = 8.

Comandat de probă: S2u =. Mediana un număr par de observații:

Me = ¾¾¾ = 10.

3) Media aritmetică. Media aritmetică a setului de N observații obținute prin însumarea tuturor valorilor și împărțirea acestei sume de N.

Pentru tabelul de frecvență mai întâi compilate grupat de date, și apoi calculate pe formula medie ponderată:

f1. f2, ¼fi, ¼fK - frecvența relativă a grupului

K - numărul de grupuri.

Exemplul 2.7. Dana tabelul de frecvență:

`X = ¾¾¾. (2.13a)

In formula (2.13a) mi - banda de frecventa, servind aici ca o "greutate" observații, N - mărimea eșantionului. Conform exemplului 2.7:

În cazul în care datele sunt grupate, formula (2.13) oferă doar o valoare aproximativă. Folosind această formulă se bazează pe presupunerea că fiecare observație din grup coincide cu media în acest grup, care, desigur, nu este adevărat. Pe de altă parte, erorile rezultate au tendința de rambursare reciprocă, deoarece în general, una grupuri de observare au peste valorile medii, altele - de mai jos. Prin urmare, abordarea bazată pe grupare (agregare) a datelor tinde să fie bun.







4) Relația dintre modul, mediană și medie. În cazul în care distribuția este simetrică. atunci:

adică acestea sunt toate la fel. Pentru distribuția unimodale și nu foarte asimetrică a formula relația aproximativă existentă:

Figura 2.7. Dispunerea reciprocă a mediei aritmetice, modul și mediana în

poze distribuții simetrice și ușor asimetrice.

1) Variația. Variația - măsură mai simplă a răspândirii setului de observații. Aceasta reprezintă diferența dintre valorile extreme ale eșantionului:

Exemplul 2.8. Dana Picks: S =. Se calculează variația. Folosind formula (2.16):

O variantă este utilizată atunci când se lucrează cu eșantioane mici. De exemplu, pentru controlul calității, care constă în verificarea valorii abaterii mărime de la producția de masă a anumitor limite.

2) Abaterea de la sredneyd (valoare aleatoare centrată).

Acest parametru este o măsură mai bună a răspândirii, în mod inutil. Ea nu se bazează pe cele două valori extreme, ca și cea anterioară, precum și toate observațiile:

d = (xi -), i = (1,2 N.) (2.17)

Pentru proba X =, având o = 5, set d:

Dezavantajul acestei opțiuni este că aceasta este determinată de un număr mare de valori (egal cu valoarea eșantionului N).

3) Deviația standard - o măsură a dispersiei, notată s și calculează cu formula:

D = ¾¾¾¾ = 28/6 = 4667;

Trebuie remarcat faptul că, în conformitate cu (2.18) și (2.19), C.K.O. Meter are dimensiunea și varianța - metrul patrat.

3) Relația dintre b și distribuție. Valoarea indică aproximativ în cazul în care centrul de distribuție, și b poartă informații despre răspândirea ei în jurul valorii. Pentru cele mai multe distribuții unimodale prin următoarele relații:

n 95% din distribuția se situează între valorile: (-2b) și (+ 2b), adică în medie, mai puțin de o observație de mărimea eșantionului N = 20 se află în afara acestui interval;

n distribuție mai mare de 99% cuprins între: (-3b) și (+ 3b), cu alte cuvinte, în afara intervalului ± b este, în medie, mai puțin de o observație a mărimii eșantionului N = 100). La această proprietate distribuții bazate pe reguli de trei Sigma. dacă prelucrarea statistică a valorilor eșantion de observații, dincolo de intervalul „trei sigma“ sunt aruncate ca improbabil, adică legate de măsurătorile de alunecare.

Aceste proprietăți pot fi ilustrate prin exemplul următor. Dacă creșterea elevilor L distribuite în mod normal (distribuția este strict formă simetrică) și etom`L = 178 cm și s = 8, aproximative de 95% și 99% limitele de distribuție Configuratie va fi: (178 ± 16) și (178 ± 24) cm.

Din relația dintre media și moda se poate observa că pentru asimetrie de distribuție pozitivă> și negativă> .chem asimetrie mai mare, cu atât mai mare diferența dintre aceste valori, adică diferența (-) poate fi considerată ca o măsură a asimetriei. Pentru cantitatea adimensionala ca o astfel de măsură se calculează coeficientul Pearson 1:

(-)

Coeficientul Pearson a doua este de aproximativ egal cu primul, dacă la calcularea medianei în loc să ia de moda:

Atât coeficientul de asimetrie egal cu zero pentru distribuții simetrice sunt pozitive pentru pozitive și negative asimetriei negative (Wed formula 2.20 și 2.21 cu curbele din figura 2.7).

model de indicator a atins punctul culminant sau de distribuție tupovershinnost estimată a Lindberg:

unde P - procent (%) din numărul de măsurători în intervalul ± s / 2 din media aritmetică. În cazul distribuțiilor aplatizate acest indice este negativ pentru atins punctul culminant - pozitiv.