Typy štatistických odhadov. Štatistické vyhodnotenie

Plán prednášok:

    Koncept hodnotenia

    Vlastnosti štatistických odhadov

    Metódy zisťovania bodových odhadov

    Odhad intervalového parametra

    Interval spoľahlivosti pre matematické očakávanie so známym rozptylom normálne rozloženej populácie.

    Chi-kvadrát distribúcia a Studentova distribúcia.

    Interval spoľahlivosti pre matematické očakávanie náhodnej premennej, ktorá má normálne rozdelenie s neznámym rozptylom.

    Interval spoľahlivosti pre štandardnú odchýlku normálneho rozdelenia.

Bibliografia:

    Wentzel, E.S. Teória pravdepodobnosti [Text] / E.S. Wentzel. - M.: Vysoká škola, 2006. - 575 s.

    Gmurman, V.E. Teória pravdepodobnosti a matematická štatistika [Text] / V.E. Gmurman. - M.: Vysoká škola, 2007. - 480 s.

    Kremer, N.Sh. Teória pravdepodobnosti a matematická štatistika [Text] / N.Sh. Kremer - M: UNITI, 2002. - 543 s.

P.1. Koncept hodnotenia

Rozdelenia ako binomické, exponenciálne, normálne sú rodiny rozdelení, ktoré závisia od jedného alebo viacerých parametrov. Napríklad exponenciálne rozdelenie s hustotou pravdepodobnosti závisí od jedného parametra λ, normálneho rozdelenia
- z dvoch parametrov m a σ. Z podmienok skúmaného problému je spravidla zrejmé, o ktorej rodine rozdelení sa diskutuje. Konkrétne hodnoty parametrov tohto rozdelenia, ktoré sú zahrnuté vo vyjadreniach charakteristík rozdelenia, ktoré nás zaujímajú, však zostávajú neznáme. Preto je potrebné poznať aspoň približnú hodnotu týchto veličín.

Nech je distribučný zákon všeobecnej populácie definovaný až do hodnôt parametrov zahrnutých v jeho rozdelení
, z ktorých niektoré môžu byť známe. Jednou z úloh matematickej štatistiky je nájsť odhady neznámych parametrov zo vzorky pozorovaní
od bežnej populácie. Odhad neznámych parametrov spočíva v zostrojení funkcie
z náhodnej vzorky tak, že hodnota tejto funkcie sa približne rovná odhadovanému neznámemu parametru θ . Funkcia volal štatistiky parameter θ .

Štatistické hodnotenie(ďalej len hodnotenie) parameter θ teoretické rozdelenie sa nazýva jeho približná hodnota v závislosti od údajov výberu.

stupňa je náhodná premenná, pretože je funkciou nezávislých náhodných premenných
; ak vytvoríte inú vzorku, funkcia bude vo všeobecnosti mať inú hodnotu.

Existujú dva typy odhadov – bodové a intervalové.

bodkovaný sa nazýva odhad určený jedným číslom. Pri malom počte pozorovaní môžu tieto odhady viesť k hrubým chybám. Aby sa im zabránilo, používajú sa intervalové odhady.

Interval sa nazýva odhad, ktorý je určený dvoma číslami - koncami intervalu, v ktorých je odhadnutá hodnota uzavretá s danou pravdepodobnosťou θ .

P. 2 Vlastnosti štatistických odhadov

hodnota
volal presnosť hodnotenia. Menej
, čím lepšie, tým presnejšie sa určí neznámy parameter.

Na odhad akéhokoľvek parametra je kladených množstvo požiadaviek, ktoré musí spĺňať, aby bol „blízko“ skutočnej hodnote parametra, t.j. byť v istom zmysle „benígnym“ hodnotením. Kvalita odhadu je určená kontrolou, či má vlastnosti nestrannosti, efektívnosti a konzistentnosti.

stupňa parameter θ volal nezaujatý(bez systematických chýb), ak je priemer odhadu rovnaký ako skutočná hodnota θ :

. (1)

Ak neplatí rovnosť (1), potom odhad volal premiestnený(so systematickými chybami). Toto skreslenie môže byť spôsobené chybami v meraní, počítaní alebo nenáhodnou povahou vzorky. Systematické chyby vedú k preceňovaniu alebo podceňovaniu.

Pre niektoré problémy matematickej štatistiky môže existovať niekoľko nezaujatých odhadov. Zvyčajne sa dáva prednosť tomu, ktorý má najmenší rozptyl (disperzia).

stupňa volal efektívne ak má najmenší rozptyl spomedzi všetkých možných nezaujatých odhadov parametra θ .

Nechaj D() je minimálny rozptyl a
je rozptyl akéhokoľvek iného nestranného odhadu parameter θ . Potom efektívnosť odhadu rovná sa

. (2)

To je jasné
. Bližšie
na 1, tým je hodnotenie efektívnejšie . Ak
pri
, potom sa volá odhad asymptoticky účinný.

Komentujte: Ak skóre posunutý, potom malosť jeho rozptylu neznamená malosť jeho chyby. Vezmime si napríklad ako odhad parametra θ nejaké číslo , získame odhad aj s nulovým rozptylom. V tomto prípade však chyba (chyba)
môže byť ľubovoľne veľká.

stupňa volal bohatý, ak so zväčšením veľkosti vzorky (
) odhad konverguje v pravdepodobnosti k presnej hodnote parametra θ , t.j. ak pre nejaké

. (3)

Konzistentnosť hodnotenia parameter θ znamená, že s rastom n kvalita hodnotenia veľkosti vzorky sa zlepšuje.

Veta 1. Priemer vzorky je nezaujatý a konzistentný odhad očakávania.

Veta 2. Opravený rozptyl vzorky je nezaujatý a konzistentný odhad rozptylu.

Veta 3. Empirická distribučná funkcia vzorky je nezaujatý a konzistentný odhad distribučnej funkcie náhodnej premennej.

Rozdelenia v matematickej štatistike sú charakterizované mnohými štatistickými parametrami. Odhad neznámych parametrov distribúcie založený na rôznych vzorových údajoch umožňuje zostaviť distribúcie náhodnej premennej.

Nájdite štatistický odhad neznámeho distribučného parametra - nájdite funkciu pozorovaných náhodných veličín, ktorá dá približnú hodnotu odhadovaného parametra.

Štatistické odhady možno rozdeliť na nezaujaté, neobjektívne, efektívne a konzistentné.

Definícia 1

Nestranný odhad-- štatistický odhad $Q^*$, ktorý má pre akúkoľvek hodnotu veľkosti vzorky matematické očakávanie rovné odhadovanému parametru, tj.

Definícia 2

Skreslený odhad-- štatistický odhad $Q^*$, ktorý má pre akúkoľvek hodnotu veľkosti vzorky matematické očakávanie, ktoré sa nerovná odhadovanému parametru, tj.

Definícia 4

Dôsledné hodnotenie-- štatistický odhad, v ktorom s veľkosťou vzorky smerujúcou do nekonečna pravdepodobne smeruje k odhadovanému parametru $Q.$

Definícia 5

Dôsledné hodnotenie-- štatistický odhad, v ktorom pri veľkosti vzorky smerujúcej k nekonečnu má rozptyl nezaujatého odhadu tendenciu k nule.

Všeobecné a vzorové prostriedky

Definícia 6

Všeobecný priemer-- aritmetický priemer hodnôt variantu bežnej populácie.

Definícia 7

Ukážkový priemer-- aritmetický priemer hodnôt variantu vzorky populácie.

Hodnoty všeobecného a vzorového priemeru možno nájsť pomocou nasledujúcich vzorcov:

  1. Ak hodnoty variantu $x_1,\ x_2,\bodky ,x_k$ majú frekvencie $n_1,\ n_2,\bodky ,n_k$, potom
  1. Ak sú hodnoty variantu $x_1,\ x_2,\bodky,x_k$ odlišné, potom

S týmto pojmom súvisí aj pojem odchýlka od priemeru. Táto hodnota sa zistí podľa nasledujúceho vzorca:

Stredná odchýlka má tieto vlastnosti:

    $\sum(n_i\left(x_i-\overline(x)\right)=0)$

    Stredná hodnota odchýlky je nulová.

Všeobecné, vzorové a opravené odchýlky

Ďalším z hlavných parametrov je koncept všeobecného a výberového rozptylu:

Všeobecná odchýlka:

Vzorový rozptyl:

Tieto pojmy sú tiež spojené so všeobecnými a vzorovými štandardnými odchýlkami:

Ako odhad všeobecného rozptylu sa zavádza koncept opraveného rozptylu:

Zavádza sa aj koncept opravenej smerodajnej odchýlky:

Príklad riešenia problému

Príklad 1

Počet obyvateľov je daný nasledujúcou distribučnou tabuľkou:

Obrázok 1.

Nájdite pre ňu všeobecný priemer, všeobecný rozptyl, všeobecnú smerodajnú odchýlku, opravený rozptyl a opravenú smerodajnú odchýlku.

Na vyriešenie tohto problému najskôr vytvoríme výpočtovú tabuľku:

Obrázok 2

Hodnota $\overline(x_v)$ (stredná hodnota vzorky) sa zistí podľa vzorca:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(87)(30)=2,9\]

Poďme nájsť všeobecný rozptyl pomocou vzorca:

Všeobecná štandardná odchýlka:

\[(\sigma )_v=\sqrt(D_v)\približne 1,42\]

Opravený rozptyl:

\[(S^2=\frac(n)(n-1)D)_in=\frac(30)(29)\cdot 2,023\približne 2,09\]

Opravená štandardná odchýlka.

Nech sa vyžaduje študovať kvantitatívny znak bežnej populácie. Predpokladajme, že na základe teoretických úvah bolo možné určiť, ktoré rozdelenie má vlastnosť. Problémom je odhadnutie parametrov, ktoré určujú toto rozdelenie. Napríklad, ak je vopred známe, že študovaný znak je distribuovaný vo všeobecnej populácii podľa normálneho zákona, potom je potrebné odhadnúť matematické očakávanie a smerodajnú odchýlku, pretože tieto dva parametre úplne určujú normálne rozdelenie. Ak existujú dôvody domnievať sa, že prvok má Poissonovo rozdelenie, potom je potrebné odhadnúť parameter , ktorý toto rozdelenie určuje. Zvyčajne existujú iba vzorové údaje získané ako výsledok pozorovaní: , , ... , . Prostredníctvom týchto údajov a vyjadriť odhadovaný parameter. Ak vezmeme do úvahy , , ... , ako hodnoty nezávislých náhodných premenných , , ... , , môžeme povedať, že nájsť štatistický odhad neznámeho parametra teoretického rozdelenia znamená nájsť funkciu pozorovaných náhodných premenných, ktorý udáva približnú hodnotu odhadovaného parametra.

takze štatistické vyhodnotenie neznámy parameter teoretického rozdelenia sa nazýva funkcia pozorovaných náhodných premenných. Štatistické vyhodnotenie neznámeho parametra bežnej populácie jedným číslom sa nazýva bod. Nižšie sú uvedené nasledujúce bodové odhady: neobjektívne a nezaujaté, efektívne a konzistentné.

Aby štatistické odhady poskytovali dobré aproximácie odhadovaných parametrov, musia spĺňať určité požiadavky. Upresnime tieto požiadavky. Nech existuje štatistický odhad neznámeho parametra teoretického rozdelenia. Predpokladajme, že odhad sa nájde na základe objemovej vzorky. Experiment zopakujme, t. j. vytiahneme z bežnej populácie ďalšiu vzorku rovnakej veľkosti a pomocou jej údajov nájdeme odhad atď. Získame čísla , , ... , , ktoré sa budú líšiť od navzájom. Odhad teda možno považovať za náhodnú premennú a čísla , , ... , - za jej možné hodnoty.

Ak odhad poskytuje približnú hodnotu s prekročením, potom číslo zistené z údajov vzorky ( ) bude väčšia ako skutočná hodnota. V dôsledku toho bude matematické očakávanie (stredná hodnota) náhodnej premennej väčšie ako , t.j. Ak uvádza približnú hodnotu s nevýhodou, potom .

Použitie štatistického odhadu, ktorého matematické očakávanie sa nerovná odhadovanému parametru, by teda viedlo k systematickým chybám. Preto je potrebné vyžadovať, aby sa matematické očakávanie odhadu rovnalo odhadovanému parametru. Súlad eliminuje systematické chyby.

nezaujatý nazývaný štatistický odhad, ktorého matematické očakávanie sa rovná odhadovanému parametru, t.j.

Premiestnený nazývaný štatistický odhad, ktorého matematické očakávanie sa nerovná odhadovanému parametru.

Je však chybou predpokladať, že nestranný odhad vždy poskytuje dobrú aproximáciu odhadovaného parametra. Možné hodnoty môžu byť skutočne veľmi rozptýlené okolo ich strednej hodnoty, t.j. rozptyl hodnoty môže byť významný. V tomto prípade sa odhad zistený napríklad z údajov jednej vzorky môže ukázať ako veľmi vzdialený od svojej priemernej hodnoty , a teda od samotného odhadovaného parametra. Ak vezmeme približnú hodnotu, urobili by sme veľkú chybu. Ak požadujete, aby rozptyl hodnoty bol malý, potom bude vylúčená možnosť urobiť veľkú chybu. Preto sa na štatistické vyhodnotenie kladú požiadavky na efektivitu.

efektívne nazývaný štatistický odhad, ktorý (pre danú veľkosť vzorky) má najmenší možný rozptyl. Pri zvažovaní vzoriek veľkého objemu podliehajú štatistické odhady požiadavke konzistentnosti.

Bohatí sa nazýva štatistický odhad, ktorý v pravdepodobnosti smeruje k odhadovanému parametru. Napríklad, ak má rozptyl nezaujatého odhadu tendenciu k nule, potom sa takýto odhad tiež ukáže ako konzistentný.

Zamyslime sa nad otázkou, ktoré charakteristiky vzorky najlepšie odhadnú všeobecný priemer a rozptyl z hľadiska nezaujatosti, efektívnosti a konzistentnosti.

Nech sa študuje diskrétna všeobecná populácia s ohľadom na kvantitatívny atribút. Všeobecný stredoškolský sa nazýva aritmetický priemer hodnôt vlastnosti bežnej populácie. Dá sa vypočítať pomocou vzorcov resp , kde sú hodnoty znamienka celkovej populácie objemu , sú zodpovedajúce frekvencie a .

Nech sa zo všeobecnej populácie v dôsledku nezávislých pozorovaní kvantitatívneho znaku extrahuje vzorka objemu s hodnotami znaku . Ukážkový priemer sa nazýva aritmetický priemer vzorky. Dá sa vypočítať pomocou vzorcov resp , kde sú hodnoty atribútu vo vzorovej množine objemu , sú zodpovedajúce frekvencie a .

Ak je všeobecný priemer neznámy a je potrebné ho odhadnúť z údajov vzorky, potom sa za odhad všeobecného priemeru považuje výberový priemer, ktorý je nezaujatým a konzistentným odhadom. Z toho vyplýva, že ak sa na nájdenie priemerov vzoriek použije niekoľko vzoriek dostatočne veľkého objemu z tej istej všeobecnej populácie, budú sa navzájom približne rovnať. Toto je nehnuteľnosť stabilita prostriedkov vzorky.

Všimnite si, že ak sú rozptyly dvoch populácií rovnaké, potom blízkosť priemerov vzorky k všeobecným nezávisí od pomeru veľkosti vzorky k veľkosti všeobecnej populácie. Závisí to od veľkosti vzorky: čím väčšia je veľkosť vzorky, tým menej sa priemer vzorky líši od všeobecného.

Aby sa charakterizoval rozptyl hodnôt kvantitatívneho atribútu všeobecnej populácie okolo jej priemernej hodnoty, zavádza sa súhrnná charakteristika - všeobecný rozptyl. Všeobecný rozptyl nazývaný aritmetický priemer štvorcových odchýlok hodnôt znamienka všeobecnej populácie od ich strednej hodnoty, ktorá sa vypočíta podľa vzorcov: , alebo .

Aby sa charakterizoval rozptyl pozorovaných hodnôt kvantitatívneho atribútu vzorky okolo jeho strednej hodnoty, zavádza sa súhrnná charakteristika - rozptyl vzorky. Ukážkový rozptyl nazývaný aritmetický priemer kvadrátov odchýlok pozorovaných hodnôt prvku od ich strednej hodnoty, ktorý sa vypočíta podľa vzorcov: , alebo .

Okrem rozptylu na charakterizáciu rozptylu hodnôt vlastnosti všeobecnej (vzorkovej) populácie okolo jej priemernej hodnoty používajú súhrnnú charakteristiku - smerodajnú odchýlku. Všeobecná štandardná odchýlka nazývaná druhá odmocnina zo všeobecného rozptylu: . Štandardná odchýlka vzorky nazývaná druhá odmocnina výberového rozptylu:

Nech sa vyberie vzorka objemu zo všeobecnej populácie ako výsledok nezávislých pozorovaní kvantitatívneho znaku. Je potrebné odhadnúť neznámy všeobecný rozptyl z údajov vzorky. Ak berieme výberový rozptyl ako odhad všeobecného rozptylu, potom tento odhad povedie k systematickým chybám, čo vedie k podhodnotenej hodnote všeobecného rozptylu. Vysvetľuje to skutočnosť, že rozptyl vzorky je skreslený odhad; inými slovami, stredná hodnota rozptylu vzorky sa nerovná odhadovanému všeobecnému rozptylu, ale rovná sa .

Je ľahké opraviť rozptyl vzorky tak, aby sa jeho priemer rovnal všeobecnému rozptylu. Na to stačí vynásobiť zlomkom. Výsledkom je opravený rozptyl, ktorý sa zvyčajne označuje ako . Opravený rozptyl bude nezaujatým odhadom všeobecného rozptylu: .

2. Intervalové odhady.

Spolu s bodovým odhadom sa štatistická teória odhadu parametrov zaoberá otázkami intervalového odhadu. Problém odhadu intervalu možno formulovať nasledovne: na základe vzorových údajov zostrojte číselný interval, vzhľadom na ktorý s vopred zvolenou pravdepodobnosťou môžeme povedať, že odhadovaný parameter sa nachádza vo vnútri tohto intervalu. Intervalový odhad je potrebný najmä pri malom počte pozorovaní, kedy je bodový odhad prevažne náhodný, a teda málo spoľahlivý.

Interval spoľahlivosti pre parameter sa nazýva taký interval, vzhľadom na ktorý je možné s vopred zvolenou pravdepodobnosťou blízkou jednej tvrdiť, že obsahuje neznámu hodnotu parametra, t.j. . Čím menšie číslo pre zvolenú pravdepodobnosť, tým presnejší je odhad neznámeho parametra. A naopak, ak je toto číslo veľké, potom je odhad urobený pomocou tohto intervalu pre prax málo užitočný. Keďže konce intervalu spoľahlivosti závisia od prvkov vzorky, hodnoty a môžu sa meniť od vzorky k vzorke. Pravdepodobnosť sa zvyčajne nazýva pravdepodobnosť spoľahlivosti (spoľahlivosť). Zvyčajne je spoľahlivosť odhadu stanovená vopred a ako hodnota sa berie číslo blízke jednej. Výber pravdepodobnosti spoľahlivosti nie je matematickým problémom, ale je určený konkrétnym riešeným problémom. Spoľahlivosť je najčastejšie nastavená na ; ; .

Uveďme bez odvodenia interval spoľahlivosti pre všeobecný priemer so známou hodnotou smerodajnej odchýlky za predpokladu, že náhodná premenná (kvantitatívny atribút) je normálne rozložená:

kde je vopred určené číslo blízke jednej a hodnoty funkcie sú uvedené v prílohe 2.

Význam tohto vzťahu je nasledovný: možno spoľahlivo konštatovať, že interval spoľahlivosti ( ) pokrýva neznámy parameter , presnosť odhadu je . Počet sa určí z rovnosti , príp. Podľa tabuľky (príloha 2) sa nájde argument, ktorý zodpovedá hodnote Laplaceovej funkcie rovnajúcej sa .

Príklad 1. Náhodná premenná má normálne rozdelenie so známou smerodajnou odchýlkou. Nájdite intervaly spoľahlivosti pre odhad neznámeho všeobecného priemeru z priemeru vzorky, ak je uvedená veľkosť vzorky a spoľahlivosť odhadu.

Riešenie. Poďme nájsť. Z pomeru dostaneme, že . Podľa tabuľky (Príloha 2) nájdeme. Zistite presnosť odhadu . Intervaly spoľahlivosti budú: . Napríklad, ak , potom má interval spoľahlivosti nasledujúce medze spoľahlivosti: ; . Hodnoty neznámeho parametra v súlade so vzorovými údajmi teda spĺňajú nerovnosť .

Interval spoľahlivosti pre všeobecný priemer normálneho rozdelenia znaku s neznámou hodnotou smerodajnej odchýlky je daný výrazom .

Z toho vyplýva, že možno spoľahlivo konštatovať, že interval spoľahlivosti pokrýva neznámy parameter.

Existujú hotové tabuľky (príloha 4), pomocou ktorých možno nájsť pre dané a nájsť pravdepodobnosť , a naopak, pre dané a možno nájsť.

Príklad 2. Kvantitatívny znak bežnej populácie je normálne rozdelený. Na základe objemovej vzorky sa zistil výberový priemer a korigovaná smerodajná odchýlka. Odhadnite neznámy priemer populácie pomocou intervalu spoľahlivosti so spoľahlivosťou.

Riešenie. Poďme nájsť. Pomocou tabuľky (príloha 4) pre a nájdeme:. Poďme nájsť hranice spoľahlivosti:

Takže so spoľahlivosťou je neznámy parameter uzavretý v intervale spoľahlivosti.

3. Pojem štatistická hypotéza. Všeobecné vyhlásenie o probléme testovania hypotéz.

Testovanie štatistických hypotéz úzko súvisí s teóriou odhadu parametrov. V prírodných vedách, technike a ekonómii sa často na objasnenie tej či onej náhodnej skutočnosti uchyľujú k vysloveniu hypotéz, ktoré je možné testovať štatisticky, teda na základe výsledkov pozorovaní v náhodnej vzorke. Pod štatistické hypotézy myslia sa také hypotézy, ktoré sa týkajú buď typu alebo jednotlivých parametrov distribúcie náhodnej premennej. Takže napríklad štatistická hypotéza hovorí, že rozdelenie produktivity práce pracovníkov vykonávajúcich rovnakú prácu v rovnakých podmienkach má normálny zákon rozdelenia. Štatistická bude aj hypotéza, že priemerné rozmery dielov vyrábaných na rovnakom type paralelných strojov sa navzájom nelíšia.

Štatistická hypotéza je tzv jednoduché ak jednoznačne určuje rozdelenie náhodnej premennej , inak sa hypotéza nazýva komplexný. Napríklad jednoduchá hypotéza je predpoklad, že náhodná premenná je rozdelená podľa normálneho zákona s matematickým očakávaním rovným nule a rozptylom rovným jednej. Ak sa predpokladá, že náhodná premenná má normálne rozdelenie s rozptylom rovným jednej a matematickým očakávaním je číslo zo segmentu , potom ide o komplexnú hypotézu. Ďalším príkladom komplexnej hypotézy je predpoklad, že spojitá náhodná premenná nadobúda hodnotu z intervalu s pravdepodobnosťou, v tomto prípade môže byť rozdelenie náhodnej premennej ktorékoľvek z triedy spojitých rozdelení.

Často je distribúcia veličiny známa a je potrebné otestovať predpoklady o hodnote parametrov tohto rozdelenia pomocou vzorky pozorovaní. Takéto hypotézy sa nazývajú parametrické.

Hypotéza, ktorá sa má testovať, je tzv nulová hypotéza a je označený. Spolu s hypotézou sa uvažuje aj o jednej z alternatívnych (konkurenčných) hypotéz. Napríklad, ak sa testuje hypotéza, že parameter sa rovná nejakej danej hodnote , t.j. : , potom jednu z nasledujúcich hypotéz možno považovať za alternatívnu hypotézu: : ; : ; : ; : , kde je nastavená hodnota, . Voľba alternatívnej hypotézy je daná konkrétnou formuláciou problému.

Pravidlo, podľa ktorého sa rozhoduje o prijatí alebo zamietnutí hypotézy, sa nazýva kritérium. Keďže sa rozhoduje na základe vzorky pozorovaní náhodnej premennej , je potrebné zvoliť vhodnú štatistiku, v tomto prípade nazývanú testovacia štatistika . Pri testovaní jednoduchej parametrickej hypotézy: ako kritérium sa zvolí rovnaká štatistika ako pre odhad parametra.

Štatistické testovanie hypotéz je založené na princípe, že udalosti s nízkou pravdepodobnosťou sa považujú za nemožné a udalosti s vysokou pravdepodobnosťou za isté. Tento princíp je možné implementovať nasledujúcim spôsobom. Pred rozborom vzorky sa zafixuje nejaká malá pravdepodobnosť, tzv úroveň významnosti. Nech je množina hodnôt štatistiky a je taká podmnožina, že za podmienky, že hypotéza je pravdivá, pravdepodobnosť, že štatistika kritéria spadá, je rovná , t.j. .

Označme výberovou hodnotou štatistiky vypočítanej zo vzorky pozorovaní. Kritérium je formulované takto: zamietnuť hypotézu, ak ; prijať hypotézu, ak . Volá sa test založený na použití vopred stanovenej hladiny významnosti kritérium významnosti. Volá sa množina všetkých hodnôt štatistiky kritéria, pre ktoré sa rozhodne zamietnuť hypotézu kritická oblasť; oblasť sa nazýva akceptačná oblasť hypotéz.

Úroveň významnosti určuje veľkosť kritickej oblasti. Poloha kritickej oblasti na množine hodnôt štatistiky závisí od formulácie alternatívnej hypotézy. Napríklad, ak je hypotéza testovaná : a alternatívna hypotéza je formulovaná ako : (), potom sa kritická oblasť nachádza na pravom (ľavom) „chvosta“ rozdelenia štatistík, t. j. má tvar nerovnosti : (), kde a sú tie štatistické hodnoty, ktoré sú akceptované s pravdepodobnosťou a za predpokladu, že hypotéza je pravdivá. V tomto prípade je kritérium tzv jednostranný, respektíve pravák a ľavák. Ak je alternatívna hypotéza formulovaná ako: , potom sa kritická oblasť nachádza na oboch „chvostoch“ rozdelenia , t. j. je určená množinou nerovností a ; v tomto prípade je kritérium tzv bilaterálne.

Na obr. 30 ukazuje umiestnenie kritickej oblasti pre rôzne alternatívne hypotézy. Tu je hustota distribúcie štatistiky kritéria za predpokladu, že hypotéza je pravdivá, je oblasťou prijatia hypotézy, .

Testovanie parametrickej štatistickej hypotézy pomocou testu významnosti teda možno rozdeliť do nasledujúcich krokov:

1) formulovať testovateľnú () a alternatívnu () hypotézu;

2) priradiť úroveň významnosti; ako v rozpore s výsledkami pozorovaní; ak , tak prijmite hypotézu , t.j. predpokladajte, že hypotéza nie je v rozpore s výsledkami pozorovaní.

Zvyčajne sa pri vykonávaní položiek 4 - 7 používa štatistika, ktorej kvantily sú tabelované: štatistika s normálnym rozdelením, Študentská štatistika, Fisherova štatistika.

Príklad 3. Podľa údajov z pasu automobilového motora spotreba paliva na 100 km najazdené kilometre sú 10 l. V dôsledku prepracovania motora sa očakáva zníženie spotreby paliva. Na overenie sa vykonávajú testy 25 náhodne vybrané vozidlá s modernizovaným motorom a vzorka priemernej spotreby paliva na 100 km najazdených kilometrov podľa výsledkov testu bol 9,3 l. Predpokladajme, že vzorka spotreby paliva je získaná z normálne rozloženej populácie s priemerom a rozptylom. Za predpokladu, že hypotéza kritickej oblasti pre pôvodnú štatistiku je pravdivá, t. j. rovná sa hladine významnosti. Nájdite pravdepodobnosti chýb prvého a druhého druhu pre kritérium s takouto kritickou oblasťou. má normálne rozdelenie s priemerom rovným a rozptylom rovným . Pravdepodobnosť chyby druhého druhu nájdeme podľa vzorca (11.2):

V súlade s prijatým kritériom teda 13,6 % vozidiel so spotrebou paliva 9 l na 100 km najazdené kilometre sú klasifikované ako vozidlá so spotrebou paliva 10 l.

4. Teoretické a empirické frekvencie. Kritériá súhlasu.

Empirické frekvencie- frekvencie získané ako výsledok skúseností (pozorovania). Teoretické frekvencie vypočítané podľa vzorcov. Pre normálne rozdelenie ich možno nájsť takto:

, (11.3)

Štatistické odhady parametrov bežnej populácie. Štatistické hypotézy

PREDNÁŠKA 16

Nech sa vyžaduje študovať kvantitatívny znak bežnej populácie. Predpokladajme, že na základe teoretických úvah bolo možné určiť, ktoré rozdelenie má vlastnosť. Vzniká tak problém odhadnúť parametre, ktoré určujú toto rozdelenie. Napríklad, ak je známe, že študovaný znak je distribuovaný vo všeobecnej populácii podľa normálneho zákona, potom je potrebné odhadnúť (približne nájsť) matematické očakávanie a smerodajnú odchýlku, pretože tieto dva parametre úplne určujú normálne rozdelenie. . Ak existujú dôvody domnievať sa, že prvok má Poissonovo rozdelenie, potom je potrebné odhadnúť parameter , ktorý toto rozdelenie určuje.

V distribúcii má výskumník zvyčajne iba vzorové údaje, napríklad hodnoty kvantitatívneho znaku získaného ako výsledok pozorovaní (ďalej sa predpokladá, že pozorovania sú nezávislé). Prostredníctvom týchto údajov a vyjadriť odhadovaný parameter.

Berúc do úvahy hodnoty nezávislých náhodných premenných môžeme povedať, že nájsť štatistický odhad neznámeho parametra teoretického rozdelenia znamená nájsť funkciu pozorovaných náhodných veličín, ktorá dáva približnú hodnotu odhadovaného parametra. Napríklad, ako bude uvedené nižšie, na odhadnutie matematického očakávania normálneho rozdelenia sa používa funkcia (aritmetický priemer pozorovaných hodnôt vlastnosti):

.

takze štatistické vyhodnotenie neznámy parameter teoretického rozdelenia sa nazýva funkcia pozorovaných náhodných premenných. Štatistický odhad neznámeho parametra bežnej populácie, zapísaný ako jedno číslo, sa nazýva bod. Zvážte nasledujúce bodové odhady: neobjektívne a nezaujaté, efektívne a konzistentné.

Aby štatistické odhady poskytovali „dobré“ aproximácie odhadovaných parametrov, musia spĺňať určité požiadavky. Upresnime tieto požiadavky.

Nech existuje štatistický odhad neznámeho parametra teoretického rozdelenia. Predpokladajme, že pri vzorkovaní objemu sa nájde odhad. Zopakujme experiment, to znamená, že z bežnej populácie vytiahneme ďalšiu vzorku rovnakej veľkosti a pomocou jej údajov nájdeme odhad atď. Opakovaním experimentu mnohokrát dostaneme čísla , ktoré sa vo všeobecnosti budú navzájom líšiť. Odhad teda možno považovať za náhodnú premennú a čísla ako možné hodnoty.

Je jasné, že ak odhad udáva približnú hodnotu s prebytkom, potom každé číslo zistené z údajov vzoriek bude väčšie ako skutočná hodnota . Preto v tomto prípade bude matematická (stredná hodnota) náhodnej premennej väčšia ako , teda . Je zrejmé, že ak dáva približnú hodnotu s nevýhodou, potom .


Preto použitie štatistického odhadu, ktorého matematické očakávanie sa nerovná odhadovanému parametru, vedie k systematickým chybám (jedno znamienko). Z tohto dôvodu je prirodzené vyžadovať, aby sa matematické očakávanie odhadu rovnalo odhadovanému parametru. Hoci súlad s touto požiadavkou vo všeobecnosti neodstráni chyby (niektoré hodnoty sú väčšie a iné menšie ako ), chyby rôznych znakov sa budú vyskytovať rovnako často. Splnenie požiadavky však zaručuje nemožnosť získať systematické chyby, to znamená, že systematické chyby sa eliminujú.

nezaujatý nazývaný štatistický odhad (chyba), ktorého matematické očakávanie sa rovná odhadovanému parametru pre akúkoľvek veľkosť vzorky, to znamená .

Premiestnený nazývaný štatistický odhad, ktorého matematické očakávanie sa nerovná odhadovanému parametru pre žiadnu veľkosť vzorky, tzn.

Bolo by však mylné predpokladať, že nestranný odhad vždy poskytuje dobrú aproximáciu odhadovaného parametra. Možné hodnoty môžu byť skutočne veľmi rozptýlené okolo ich priemeru, t. j. rozptyl môže byť významný. V tomto prípade sa odhad zistený napríklad z údajov jednej vzorky môže ukázať ako veľmi vzdialený od priemernej hodnoty , a teda od samotného odhadovaného parametra. Ak to teda vezmeme ako približnú hodnotu, urobíme veľkú chybu. Ak sa však požaduje, aby bol rozptyl malý, potom sa možnosť urobiť veľkú chybu vylúči. Z tohto dôvodu je na štatistické vyhodnotenie kladená požiadavka efektívnosti.

efektívne nazývaný štatistický odhad, ktorý (pre danú veľkosť vzorky) má najmenší možný rozptyl.

Bohatí sa nazýva štatistický odhad, ktorý sa v pravdepodobnosti približuje k odhadovanému parametru, to znamená, že rovnosť platí:

.

Napríklad, ak má rozptyl nezaujatého odhadu tendenciu k nule, potom sa takýto odhad tiež ukáže ako konzistentný.

Zvážte otázku, ktoré charakteristiky vzorky najlepšie odhadnú všeobecný priemer a rozptyl z hľadiska nezaujatosti, efektívnosti a konzistentnosti.

Nech sa študuje diskrétna všeobecná populácia s ohľadom na nejaký kvantitatívny atribút.

Všeobecný stredoškolský sa nazýva aritmetický priemer hodnôt vlastnosti bežnej populácie. Vypočítava sa podľa vzorca:

§ - ak sú všetky hodnoty znamienka všeobecnej populácie objemu odlišné;

§ – ak hodnoty znaku všeobecnej populácie majú frekvenciu a . To znamená, že všeobecný priemer je vážený priemer hodnôt vlastností s váhami rovnými zodpovedajúcim frekvenciám.

Komentujte: nech populácia zväzku obsahuje objekty s rôznymi hodnotami atribútu. Predstavte si, že z tejto kolekcie je náhodne vybraný jeden objekt. Pravdepodobnosť, že bude získaný objekt s hodnotou funkcie, napríklad , sa samozrejme rovná . Akýkoľvek iný objekt môže byť extrahovaný s rovnakou pravdepodobnosťou. Hodnotu vlastnosti teda možno považovať za náhodnú premennú, ktorej možné hodnoty majú rovnakú pravdepodobnosť rovnajúcu sa . V tomto prípade nie je ťažké nájsť matematické očakávanie:

Ak teda skúmaný znak všeobecnej populácie považujeme za náhodnú premennú, potom sa matematické očakávanie znaku rovná všeobecnému priemeru tohto znaku: . K tomuto záveru sme dospeli za predpokladu, že všetky objekty bežnej populácie majú rôzne hodnoty funkcie. Rovnaký výsledok sa získa, ak predpokladáme, že všeobecná populácia obsahuje niekoľko objektov s rovnakou hodnotou atribútu.

Zovšeobecnením výsledku získaného na všeobecnú populáciu so spojitým rozložením atribútu definujeme všeobecný priemer ako matematické očakávanie atribútu: .

Nechajte extrahovať vzorku objemu na štúdium všeobecnej populácie s ohľadom na kvantitatívny atribút.

Ukážkový priemer nazývaný aritmetický priemer hodnôt vlastnosti vzorky populácie. Vypočítava sa podľa vzorca:

§ - ak sú všetky hodnoty znamienka objemovej populácie vzorky odlišné;

§ – ak hodnoty vlastnosti vzorkovacieho súboru majú frekvencie a . To znamená, že priemer vzorky je vážený priemer hodnôt vlastností s váhami rovnými zodpovedajúcim frekvenciám.

Komentujte: priemer vzorky zistený z údajov jednej vzorky je zjavne určitý počet. Ak extrahujeme iné vzorky rovnakej veľkosti z rovnakej všeobecnej populácie, potom sa priemer vzorky bude meniť od vzorky k vzorke. Výberový priemer teda možno považovať za náhodnú premennú, a preto môžeme hovoriť o distribúciách (teoretických a empirických) výberového priemeru a numerických charakteristikách tohto rozdelenia, najmä o priemere a rozptyle výberového rozdelenia. .

Ďalej, ak všeobecný priemer nie je známy a je potrebné ho odhadnúť z údajov vzorky, potom sa priemer vzorky berie ako odhad všeobecného priemeru, čo je nezaujatý a konzistentný odhad (navrhujeme dokázať toto tvrdenie na našom vlastné). Z vyššie uvedeného vyplýva, že ak sa na nájdenie priemerov vzoriek použije niekoľko vzoriek dostatočne veľkého objemu z tej istej všeobecnej populácie, budú si navzájom približne rovnaké. Toto je nehnuteľnosť stabilita prostriedkov vzorky.

Všimnite si, že ak sú rozptyly dvoch populácií rovnaké, potom blízkosť priemerov vzorky k všeobecným nezávisí od pomeru veľkosti vzorky k veľkosti všeobecnej populácie. Závisí to od veľkosti vzorky: čím väčšia je veľkosť vzorky, tým menej sa priemer vzorky líši od všeobecného. Ak sa napríklad z jednej sady vyberie 1 % objektov a z inej sady sa vyberú 4 % objektov a objem prvej vzorky sa ukáže byť väčší ako objem druhej, potom sa priemer prvej vzorky bude líšiť od zodpovedajúci všeobecný priemer ako druhý.

štatistický odhad distribučnej vzorky

Odhad je aproximácia hodnôt požadovanej hodnoty získaná na základe výsledkov selektívneho pozorovania. Odhady sú náhodné premenné. Poskytujú možnosť vytvoriť si rozumný úsudok o neznámych parametroch bežnej populácie. Príkladom odhadu všeobecného priemeru je výberový priemer všeobecného rozptylu – výberový rozptyl atď.

Na vyhodnotenie toho, ako „dobre“ hodnotenie spĺňa zodpovedajúcu všeobecnú charakteristiku, boli vyvinuté 4 kritériá: konzistentnosť, nezaujatosť, efektívnosť a dostatočnosť. Tento prístup je založený na skutočnosti, že kvalitu odhadu neurčujú jeho jednotlivé hodnoty, ale charakteristiky jeho rozloženia ako náhodnej veličiny.

Na základe ustanovení teórie pravdepodobnosti je možné dokázať, že z takých charakteristík vzorky, ako je aritmetický priemer, modus a medián, iba aritmetický priemer je konzistentným, nezaujatým, efektívnym a dostatočným odhadom všeobecného priemeru. To určuje preferenciu aritmetického priemeru v množstve ďalších charakteristík vzorky.

nezaujatý hodnotenie sa prejavuje v tom, že jeho matematické očakávanie pre akúkoľvek veľkosť vzorky sa rovná hodnote odhadovaného parametra v bežnej populácii. Ak táto požiadavka nie je splnená, odhad je splnený premiestnený.

Podmienka nezaujatého odhadu je zameraná na elimináciu systematických chýb v odhadoch.

Pri riešení problémov hodnotenia využívajú aj asymptoticky nezaujaté odhady, pre ktoré sa s nárastom veľkosti vzorky matematické očakávanie prikláňa k odhadovanému parametru všeobecnej populácie.

solventnosťštatistických odhadov sa prejavuje v tom, že s rastúcou veľkosťou vzorky sa odhad stále viac približuje k skutočnej hodnote odhadovaného parametra, alebo, ako sa hovorí, odhad konverguje v pravdepodobnosti k požadovanému parametru, alebo smeruje k jeho matematické očakávanie. Praktický význam majú iba konzistentné odhady.

Toto je odhad nestranného parametra, ktorý má najmenší rozptyl pre danú veľkosť vzorky. V praxi sa rozptyl odhadu zvyčajne stotožňuje s chybou odhadu.

Ako opatrenia efektívnosti hodnotenia vezmite pomer minimálneho možného rozptylu k rozptylu iného odhadu.

Odhad, ktorý zabezpečuje úplnosť použitia všetkých informácií obsiahnutých vo vzorke o neznámej charakteristike bežnej populácie, sa nazýva tzv. dostatočné(vyčerpávajúci).

Súlad s vlastnosťami štatistických odhadov diskutovaných vyššie umožňuje považovať charakteristiky vzorky na odhadovanie parametrov všeobecnej populácie za najlepšie možné.

Najdôležitejšou úlohou matematickej štatistiky je získať z údajov vzorky čo najracionálnejšie, „pravdivé“ štatistické odhady želaných parametrov všeobecnej populácie. Existujú dva typy štatistickej inferencie: štatistické vyhodnotenie; testovanie štatistických hypotéz.

Hlavnou úlohou získavania štatistických odhadov je vybrať a zdôvodniť najlepšie odhady, ktoré poskytujú možnosť zmysluplného hodnotenia neznámych parametrov bežnej populácie.

Problém odhadu neznámych parametrov možno vyriešiť dvoma spôsobmi:

  • 1. Neznámy parameter je charakterizovaný jedným číslom (bodom) - používa sa metóda bodového odhadu;
  • 2. intervalový odhad, to znamená, že sa určí interval, v ktorom možno s určitou pravdepodobnosťou nájsť požadovaný parameter.

Bodový odhad neznámeho parametra spočíva v tom, že konkrétna číselná hodnota výberového odhadu sa berie ako najlepšia aproximácia k skutočnému parametru všeobecnej populácie, čiže neznámy parameter všeobecnej populácie sa odhaduje jedným číslom (bodom) určené zo vzorky. Pri tomto prístupe vždy existuje riziko omylu, preto je potrebné bodový odhad doplniť o indikátor možnej chyby pri určitej úrovni pravdepodobnosti.

Jeho štandardná odchýlka sa berie ako priemerná chyba odhadu.

Potom môže byť bodový odhad všeobecného priemeru reprezentovaný ako interval

kde je aritmetický priemer vzorky.

Pri bodovom odhade sa na získanie odhadov zo vzorových údajov používa niekoľko metód:

  • 1. metóda momentov, pri ktorej sa momenty bežnej populácie nahrádzajú momentmi výberového súboru;
  • 2. metóda najmenších štvorcov;
  • 3. metóda maximálnej pravdepodobnosti.

V mnohých problémoch je potrebné nájsť nielen číselný odhad parametra bežnej populácie, ale aj zhodnotiť jeho presnosť a spoľahlivosť. Toto je obzvlášť dôležité pre relatívne malé vzorky. Zovšeobecnenie bodového odhadu štatistického parametra je jeho intervalový odhad- nájdenie číselného intervalu obsahujúceho odhadovaný parameter s určitou pravdepodobnosťou.

Vzhľadom na to, že pri určovaní všeobecných charakteristík z výberových údajov je vždy nejaká chyba, je praktickejšie určiť interval so stredom v zistenom bodovom odhade, v rámci ktorého je skutočná požadovaná hodnota odhadovaného parametra všeobecnej charakteristiky zistená bodovým odhadom. sa nachádza s určitou danou pravdepodobnosťou. Takýto interval sa nazýva interval spoľahlivosti.

Interval spoľahlivosti je číselný interval, ktorý s danou pravdepodobnosťou r pokrýva odhadovaný parameter bežnej populácie. Táto pravdepodobnosť sa nazýva dôvera. Pravdepodobnosť spoľahlivosti r je pravdepodobnosť, ktorá môže byť uznaná ako dostatočná v rámci riešeného problému na posúdenie spoľahlivosti charakteristík získaných na základe pozorovaní vzorky. hodnota

pravdepodobnosť, že urobíte chybu, sa nazýva úroveň významnosti.

Pre selektívny (bodový) odhad AND * (theta) parametra AND všeobecnej populácie s presnosťou ( hraničná chyba) D a pravdepodobnosť r interval spoľahlivosti je určený rovnosťou:

Pravdepodobnosť spoľahlivosti r umožňuje stanoviť hranice spoľahlivosti náhodné kolísanie študovaného parametra A pre danú vzorku.

Nasledujúce hodnoty a im zodpovedajúce hodnoty sa často považujú za úroveň spoľahlivosti úrovne významnosti

Tabuľka 1. Najčastejšie používané hladiny spoľahlivosti a hladiny významnosti

Napríklad 5-percentná hladina významnosti znamená, že v 5 prípadoch zo 100 existuje riziko chyby pri identifikácii charakteristík populácie z údajov vzorky. Alebo inými slovami, v 95 prípadoch zo 100 bude všeobecná charakteristika identifikovaná na základe vzorky ležať v intervale spoľahlivosti.