ecosmak.ru

Asymptotické správanie funkcií. porovnanie infinitezimálnych funkcií

Ako je uvedené v predchádzajúca časťŠtúdium klasických algoritmov sa v mnohých prípadoch môže uskutočniť pomocou asymptotických metód matematickej štatistiky, najmä pomocou metód CLT a konvergenčných metód dedičnosti. Oddelenie klasickej matematickej štatistiky od potrieb aplikovaného výskumu sa prejavilo najmä tým, že populárnym monografiám chýba matematický aparát potrebný najmä na štúdium dvojvýberovej štatistiky. Pointa je, že na limit musíte ísť nie o jeden parameter, ale o dva – objemy dvoch vzoriek. Musel som vypracovať vhodnú teóriu – teóriu dedičnosti konvergencie, uvedenú v našej monografii.

Výsledky takejto štúdie sa však budú musieť použiť s konečnou veľkosťou vzorky. S takýmto prechodom súvisí celý rad problémov. O niektorých z nich sa hovorilo v súvislosti so štúdiom vlastností štatistík konštruovaných zo vzoriek zo špecifických distribúcií.

Pri diskusii o vplyve odchýlok od počiatočných predpokladov na vlastnosti štatistických postupov však vznikajú ďalšie problémy. Aké odchýlky sa považujú za typické? Mali by sme sa zamerať na „najškodlivejšie“ odchýlky, ktoré v najväčšej miere skresľujú vlastnosti algoritmov, alebo by sme sa mali zamerať na „typické“ odchýlky?

Prvým prístupom dostaneme zaručený výsledok, no „cena“ tohto výsledku môže byť zbytočne vysoká. Ako príklad poukážeme na univerzálnu Berry-Esseenovu nerovnosť pre chybu v CLT. Celkom správne zdôrazňuje A.A. Borovkov, že "miera konvergencie v reálnych problémoch sa spravidla ukazuje ako lepšia."

Pri druhom prístupe vyvstáva otázka, ktoré odchýlky sa považujú za „typické“. Môžete sa pokúsiť odpovedať na túto otázku analýzou veľkých polí skutočných údajov. Je celkom prirodzené, že odpovede rôznych výskumných skupín sa budú líšiť, ako vidno napríklad z výsledkov prezentovaných v článku.

Jednou z mylných predstáv je použitie pri analýze možných odchýlok len akejkoľvek konkrétnej parametrickej rodiny - Weibull-Gnedenko rozdelenia, trojparametrová rodina gama rozdelení atď. V roku 1927 akad. Akadémia vied ZSSR S.N. Bernstein diskutoval o metodologickej chybe redukcie všetkých empirických rozdelení na štvorparametrovú Pearsonovu rodinu. Parametrické metódy štatistiky sa však stále tešia veľkej obľube najmä medzi aplikovanými vedcami a vinu za túto mylnú predstavu nesú predovšetkým učitelia štatistických metód (pozri nižšie, ako aj článok).

15. Výber jedného z mnohých kritérií na testovanie konkrétnej hypotézy

V mnohých prípadoch bolo vyvinutých mnoho metód na vyriešenie konkrétneho praktického problému a špecialista na metódy matematického výskumu čelí problému: ktorú z nich by mal ponúknuť aplikovanej osobe na analýzu konkrétnych údajov?

Ako príklad uveďme problém kontroly homogenity dvoch nezávislých vzoriek. Ako viete, pre jeho riešenie môžete ponúknuť veľa kritérií: Študent, Cramer-Welch, Lord, chi-kvadrát, Wilcoxon (Mann-Whitney), Van - der - Waerden, Savage, N. V. Smirnov, ako napríklad omega- štvorec (Lehmann -Rosenblatt), G.V.Martynova a iné.Ktorý si vybrať?

Myšlienka „hlasovania“ prirodzene prichádza na myseľ: testovať podľa mnohých kritérií a potom rozhodnúť „väčšinou hlasov“. Z hľadiska štatistickej teórie takýto postup jednoducho vedie ku konštrukcii ďalšieho kritéria, ktoré nie je a priori o nič lepšie ako predchádzajúce, no je náročnejšie na štúdium. Na druhej strane, ak sú riešenia rovnaké pre všetky uvažované štatistické kritériá založené na rôznych princípoch, potom to v súlade s koncepciou stability zvyšuje dôveru v celkové získané riešenie.

Najmä medzi matematikmi je rozšírený nepravdivý a škodlivý názor o potrebe hľadania optimálnych metód, riešení atď. Faktom je, že optimálnosť zvyčajne zmizne, keď dôjde k odchýlke od počiatočných predpokladov. Aritmetický priemer ako odhad matematického očakávania je teda optimálny len vtedy, keď je pôvodné rozdelenie normálne, zatiaľ čo konzistentný odhad je vždy, ak existuje iba matematické očakávanie. Na druhej strane, pre akúkoľvek svojvoľnú metódu odhadu alebo testovania hypotéz možno zvyčajne formulovať pojem optimality tak, že zvažovaná metóda sa stane optimálnou - z tohto špeciálne zvoleného hľadiska. Vezmime si napríklad medián vzorky ako odhad matematického očakávania. Je, samozrejme, optimálny, aj keď v inom zmysle ako aritmetický priemer (optimálny pre normálne rozdelenie). Totiž pre Laplaceovu distribúciu je výberový medián maximálnym odhadom pravdepodobnosti, a teda optimálnym (v zmysle špecifikovanom v monografii).

Kritériá homogenity boli analyzované v monografii. Existuje niekoľko prirodzených prístupov k porovnávaniu kritérií – založených na asymptotickej relatívnej účinnosti podľa Bahadur, Hodges-Lehman, Pitman. A ukázalo sa, že každé kritérium je optimálne so zodpovedajúcou alternatívou alebo vhodným rozložením na množine alternatív. Pri matematických výpočtoch sa zároveň zvyčajne používa alternatíva posunu, ktorá je v praxi analýzy reálnych štatistických údajov pomerne zriedkavá (v súvislosti s Wilcoxonovým kritériom sme túto alternatívu diskutovali a kritizovali v ). Výsledok je smutný – brilantná matematická technika predvedená v , nám neumožňuje poskytnúť odporúčania na výber testu homogenity pri analýze skutočných údajov. Inými slovami, z pohľadu aplikačného pracovníka, t.j. analýzou konkrétnych údajov je monografia zbytočná. Brilantné ovládanie matematiky a veľká pracovitosť, ktorú predviedol autor tejto monografie, žiaľ, do praxe nič nepriniesli.

Samozrejme, každý prakticky pracujúci štatistik tak či onak rieši problém výberu štatistického kritéria sám. Na základe množstva metodických úvah sme sa rozhodli pre kritérium omega-štvorcového typu (Lehmann-Rosenblatt), ktoré je konzistentné s akoukoľvek alternatívou. Existuje však pocit nespokojnosti z dôvodu nedostatočnej platnosti tejto voľby.

Definícia. Smer definovaný nenulovým vektorom sa nazýva asymptotický smer vo vzťahu k riadku druhého rádu, ak akýkoľvek priamka tohto smeru (teda rovnobežná s vektorom ) má s priamkou buď najviac jeden spoločný bod, alebo je v tejto priamke obsiahnutá.

? Koľko spoločných bodov môže mať priamka druhého rádu a priamka? asymptotický smer o tejto linke?

Vo všeobecnej teórii línií druhého rádu je dokázané, že ak

Potom nenulový vektor ( definuje asymptotický smer vzhľadom na čiaru

(všeobecné kritérium pre asymptotický smer).

Pre linky druhého rádu

ak , potom neexistujú žiadne asymptotické smery,

ak potom existujú dva asymptotické smery,

ak potom existuje len jeden asymptotický smer.

Nasledujúca lemma sa ukazuje ako užitočná ( kritérium pre asymptotický smer priamky parabolického typu).

Lemma . Nech je priamka parabolického typu.

Nenulový vektor má asymptotický smer

pomerne . (5)

(Problém. Dokážte lemu.)

Definícia. Priama čiara asymptotického smeru sa nazýva asymptota čiary druhého rádu, ak sa táto čiara buď nepretína, alebo je v nej obsiahnutá.

Veta . Ak má asymptotický smer vzhľadom na , potom asymptota rovnobežná s vektorom je určená rovnicou

Vypĺňame tabuľku.

ÚLOHY.

1. Nájdite asymptotické smerové vektory pre nasledujúce čiary druhého rádu:

4 - hyperbolický typ, dva asymptotické smery.

Použime kritérium asymptotického smeru:

Má asymptotický smer vzhľadom na daný riadok 4 .

Ak =0, potom =0, teda nula. Potom Divide by Get kvadratická rovnica: , kde t = . Riešime túto kvadratickú rovnicu a nájdeme dve riešenia: t = 4 a t = 1. Potom asymptotické smery priamky .

(Môžu sa zvážiť dva spôsoby, pretože čiara je parabolického typu.)

2. Zistite, či súradnicové osi majú asymptotické smery vzhľadom na priamky druhého rádu:

3. Napíšte všeobecnú rovnicu riadku druhého rádu, pre ktorý

a) os x má asymptotický smer;

b) Obe súradnicové osi majú asymptotické smery;

c) súradnicové osi majú asymptotické smery a O je stred priamky.

4. Napíšte asymptotné rovnice pre riadky:

a) ng w:val="EN-US"/>r=0"> ;

5. Dokážte, že ak má priamka druhého rádu dve nerovnobežné asymptoty, ich priesečník je stredom tejto priamky.

Poznámka: Pretože existujú dve neparalelné asymptoty, existujú dva asymptotické smery, potom , a preto je čiara centrálna.

Napíšte asymptotné rovnice všeobecný pohľad a systém na nájdenie centra. Všetko je zrejmé.

6.(№920) Napíšte rovnicu hyperboly prechádzajúcej bodom A(0, -5) a majúcej asymptoty x - 1 = 0 a 2x - y + 1 = 0.

indikáciou. Použite vyjadrenie predchádzajúceho problému.

Domáca úloha . , č. 915 (c, e, e), č. 916 (c, d, e), č. 920 (ak ste nemali čas);

Detské postieľky;

Silajev, Timošenko. Praktické úlohy podľa geometrie,

1 semester S.67, otázky 1-8, s.70, otázky 1-3 (ústne).

PRIEMERY LINKY DRUHÉHO OBJEDNÁVKY.

SPOJENÉ PRIEMERY.

Je daný afinný súradnicový systém.

Definícia. priemer línia druhého rádu, konjugovaná s vektorom neasymptotického smeru vzhľadom na , je množina stredových bodov všetkých akordov priamky rovnobežnej s vektorom .

Na prednáške sa dokázalo, že priemer je priamka a získala sa jej rovnica

Odporúčania: Ukážte (na elipse), ako je skonštruovaná (nastavte neasymptotický smer; nakreslite [dve] priame čiary tohto smeru pretínajúce čiaru; nájdite stredy odrezaných akordov; nakreslite priamku cez stredy - toto je priemer).

Diskutujte:

1. Prečo sa pri definícii priemeru berie vektor neasymptotického smeru. Ak nevedia odpovedať, požiadajte ich, aby vytvorili priemer, napríklad pre parabolu.

2. Má nejaký vlasec druhého rádu aspoň jeden priemer? prečo?

3. Na prednáške bolo dokázané, že priemer je priamka. Stred ktorej tetivy je bod M na obrázku?


4. Pozrite sa na zátvorky v rovnici (7). Čo pripomínajú?

Záver: 1) každý stred patrí ku každému priemeru;

2) ak existuje priamka stredov, potom existuje jeden priemer.

5. Aký je smer priemerov parabolických čiar? (Asymptotické)

Dôkaz (pravdepodobne na prednáške).

Nech je priemer d daný rovnicou (7`) konjugovaný s vektorom neasymptotického smeru. Potom jeho smerový vektor

(-(), ). Ukážme, že tento vektor má asymptotický smer. Použime kritérium asymptotického smerového vektora pre parabolickú priamku (pozri (5)). Nahrádzame a uisťujeme (nezabudnite, že .

6. Koľko priemerov má parabola? Ich relatívna pozícia? Koľko priemerov má zvyšok parabolických čiar? prečo?

7. Ako zostrojiť celkový priemer niektorých párov priamok druhého rádu (pozri otázky 30, 31 nižšie).

8. Vyplníme tabuľku, nezabudnite urobiť výkresy.

1. Napíšte rovnicu pre množinu stredov všetkých akordov rovnobežných s vektorom

2. Napíšte rovnicu pre priemer d prechádzajúci bodom K(1,-2) pre priamku.

Kroky riešenia:

1. spôsob.

1. Určte typ (aby ste vedeli, ako sa správajú priemery tohto vlasca).

V tomto prípade je čiara stredová, potom všetky priemery prechádzajú stredom C.

2. Zostavíme rovnicu priamky prechádzajúcej dvoma bodmi K a C. Toto je požadovaný priemer.

2. spôsob.

1. Rovnicu pre priemer d napíšeme v tvare (7`).

2. Dosadením súradníc bodu K do tejto rovnice zistíme vzťah medzi súradnicami konjugátu vektora s priemerom d.

3. Tento vektor nastavíme s prihliadnutím na zistenú závislosť a zostavíme rovnicu pre priemer d.

V tomto probléme je jednoduchšie vypočítať druhý spôsob.

3. Napíšte rovnicu pre priemer rovnobežný s osou x.

4. Nájdite stred akordu odrezaný čiarou

na riadku x + 3y – 12 =0.

Návrh na rozhodnutie: Samozrejme, môžete nájsť priesečníky danej čiary a čiary a potom - stred výsledného segmentu. Túžba po tom zmizne, ak vezmeme napríklad priamku s rovnicou x + 3y - 2009 = 0.

IN moderné podmienky záujem o analýzu dát neustále a intenzívne rastie v úplne iných oblastiach, akými sú biológia, lingvistika, ekonómia a samozrejme IT. Základom tejto analýzy sú štatistické metódy a každý sebarešpektujúci špecialista na dolovanie údajov im musí rozumieť.

Žiaľ, skutočne kvalitná literatúra, ktorá by bola schopná poskytnúť matematicky presné dôkazy a zrozumiteľné intuitívne vysvetlenia, nie je príliš bežná. A tieto prednášky sú podľa mňa nezvyčajne dobré pre matematikov, ktorí rozumejú teórii pravdepodobnosti práve z tohto dôvodu. Vyučujú ich magistri na nemeckej univerzite Christian-Albrecht v programoch „Matematika“ a „Finančná matematika“. A pre tých, ktorých zaujíma, ako sa tento predmet vyučuje v zahraničí, som preložil tieto prednášky. Preklad mi trval niekoľko mesiacov, prednášky som preriedil ilustráciami, cvičeniami a poznámkami pod čiarou k niektorým teorémom. Podotýkam, že nie som profesionálny prekladateľ, ale len altruista a amatér v tejto oblasti, preto akceptujem akúkoľvek kritiku, ak bude konštruktívna.

Stručne povedané, prednášky sú o:


Podmienené očakávanie

Táto kapitola sa štatistikou priamo nezaoberá, je však ideálnym východiskom pre jej štúdium. Podmienené očakávanie je najlepšou voľbou na predpovedanie náhodného výsledku na základe informácií, ktoré už máte. A toto je tiež náhodné. Tu sa berú do úvahy jeho rôzne vlastnosti, ako je linearita, monotónnosť, monotónna konvergencia a iné.

Základy odhadu bodov

Ako vyhodnotiť distribučný parameter? Aké je na to kritérium? Aké metódy by sa na to mali použiť? Táto kapitola vám umožní odpovedať na všetky tieto otázky. Tu sú predstavené pojmy nezaujatý odhad a jednotne nezaujatý odhad s minimálnym rozptylom. Vysvetľuje, odkiaľ pochádza chí-kvadrát rozdelenie a Studentovo rozdelenie a prečo sú dôležité pri odhadovaní parametrov normálneho rozdelenia. Hovorí sa, čo sú Rao-Kramerova nerovnosť a Fisherove informácie. Zavedený je aj koncept exponenciálnej rodiny, ktorý mnohokrát uľahčuje získanie dobrého odhadu.

Bayesovský a minimaxový odhad parametrov

Tu je popísaný odlišný filozofický prístup k hodnoteniu. V tomto prípade sa parameter považuje za neznámy, pretože ide o realizáciu nejakej náhodnej premennej so známym (a priori) rozdelením. Pozorovaním výsledku experimentu vypočítame takzvané zadné rozdelenie parametra. Na základe toho môžeme získať Bayesovský odhad, kde kritériom je minimálna priemerná strata, alebo minimaxový odhad, ktorý minimalizuje maximálnu možnú stratu.

Dostatočnosť a úplnosť

Táto kapitola má vážny praktický význam. Dostatočná štatistika je funkciou vzorky, takže na odhad parametra stačí uložiť len výsledok tejto funkcie. Takýchto funkcií je veľa a medzi nimi sú aj takzvané minimálne dostatočné štatistiky. Napríklad na odhad mediánu normálneho rozdelenia stačí uložiť len jedno číslo - aritmetický priemer za celú vzorku. Funguje to aj pre iné distribúcie, ako je distribúcia Cauchy? Ako pomôže dostatok štatistík pri výbere odhadov? Tu nájdete odpovede na tieto otázky.

Asymptotické vlastnosti odhadov

Snáď najdôležitejšou a nevyhnutnou vlastnosťou odhadu je jeho konzistentnosť, teda tendencia k skutočnému parametru s nárastom veľkosti vzorky. Táto kapitola popisuje vlastnosti nám známych odhadov, získaných štatistickými metódami opísanými v predchádzajúcich kapitolách. Zavádzajú sa pojmy asymptotická nezaujatosť, asymptotická účinnosť a Kullback-Leiblerova vzdialenosť.

Základy testovania

Okrem otázky, ako vyhodnotiť nám neznámy parameter, musíme nejako skontrolovať, či spĺňa požadované vlastnosti. Robí sa napríklad experiment, v ktorom sa testuje nový liek. Ako zistíte, že je väčšia pravdepodobnosť, že sa s ním uzdravíte ako so staršími liekmi? Táto kapitola vysvetľuje, ako sa takéto testy vytvárajú. Dozviete sa, aký je jednotne najsilnejší test, Neyman-Pearsonov test, hladina významnosti, interval spoľahlivosti a tiež odkiaľ pochádza notoricky známy Gaussov test a t-test.

Asymptotické vlastnosti kritérií

Podobne ako odhady, aj kritériá musia spĺňať určité asymptotické vlastnosti. Niekedy môžu nastať situácie, keď nie je možné skonštruovať požadované kritérium, avšak pomocou známej centrálnej limitnej vety zostrojíme kritérium, ktoré asymptoticky smeruje k nevyhnutnému. Tu sa dozviete, čo je hladina asymptotickej významnosti, metóda pravdepodobnostného pomeru a ako sa zostavuje Bartlettov test a test nezávislosti chí-kvadrát.

Lineárny model

Túto kapitolu možno považovať za doplnenie, a to aplikáciu štatistiky v prípade lineárnej regresie. Pochopíte, aké známky sú dobré a za akých podmienok. Dozviete sa, odkiaľ sa vzala metóda najmenších štvorcov, ako zostaviť kritériá a prečo potrebujete F-distribúciu.

Asymptotické správanie (alebo asymptotické správanie) funkcie v blízkosti určitého bodu a (konečného alebo nekonečného) sa chápe ako povaha zmeny funkcie, keďže jej argument x smeruje k tomuto bodu. Toto správanie sa zvyčajne snažia znázorniť pomocou inej, jednoduchšej a preštudovanejšej funkcie, ktorá v okolí bodu a dostatočne presne opisuje zmenu pre nás zaujímavej funkcie alebo hodnotí jej správanie z jednej strany resp. ďalší. V súvislosti s tým vzniká problém porovnania charakteru zmeny dvoch funkcií v okolí bodu a, s čím súvisí aj zohľadnenie ich kvocientu. Obzvlášť zaujímavé sú prípady, keď sú obe funkcie buď nekonečne malé (in.m.) alebo nekonečne veľké (in.b.) pre x a a. 10.1. Porovnanie infinitezimálnych funkcií Hlavným účelom porovnania b.m. funkcie spočíva v porovnaní povahy ich priblíženia sa k nule pri x a, alebo miery ich sklonu k nule. Nech b.m. pre x a sú funkcie a(x) a P(x) nenulové v nejakom punktovanom okolí (a) bodu a, zatiaľ čo v bode a sú rovné nule alebo nedefinované. Definícia 10.1. Funkcie a(x) a 0(x) sa nazývajú b.m. rovnakého rádu pre a a napíšte og (a:) = v O (/? («)) (symbol O znie "Veľké O"), ak pre x a existuje nenulová konečná hranica podielu a ( x) / /? (i), t.j. je zrejmé, že potom je podľa (7.24) Zm € R \ (0) a zápis X ^ a0 [a (x)) legálny. Symbol O má tzv. vlastnosť tranzitivity, t.j. ak - skutočne, berúc do úvahy definíciu 10.1 a vlastnosť súčinu funkcií (pozri (7.23)), ktoré majú konečné (v tomto prípade nie rovné nule) limity, dostaneme ASYMPTOTICKÉ SPRÁVANIE FUNKCIE Porovnanie infinitezimálnych funkcií Definícia 10.2 Funkcia a(x), ktorú nazývajú b.m., má v porovnaní s (3 (x) (alebo relatívne k / 3 (x)) pre x a a píšte) symbol o sa číta ako malý, ak existuje limita vzťahu a a je rovná nule. V tomto prípade sa tiež o funkcii hovorí, že je bm menšieho rádu ako a(x) pre x a a slovo maličkosti sa zvyčajne vynecháva (ako v prípade vyššieho rádu v definícii 10.2.) To znamená, že ak lim (potom funkcia /)(x) je podľa definície 10.2 f.m. vyššieho rádu v porovnaní s a(x) pre x a a a(x) je b.m. nižšieho rádu ako /3(x) pre x a, pretože v tomto prípade lijTi (fi(x)/ot(x)) . Takže môžeme písať Podľa vety 7.3 o spojení medzi funkciou, jej limitou a b.m. funkcia z (10.3) vyplýva, že ot) je funkcia, b.m. pri. Preto a(x), t.j. hodnoty|a(h)| pre x blízko a, mnoho menej hodnôt\0(x)\. Inými slovami, funkcia a(x) má tendenciu k nule rýchlejšia funkcia/?(X). Veta 10.1. Produkt akéhokoľvek b.m. pre x a funkcie a(x) a P(x)), ktoré sú nenulové v nejakom punktovanom okolí bodu a, existujú b.m. funkciou vyššieho rádu v porovnaní s každým z faktorov. Skutočne, podľa definície 10,2 b.m. vyššieho rádu (berúc do úvahy definíciu 7.10 b.m. funkcie), rovnosti znamenajú platnosť tvrdenia vety. Rovnosti obsahujúce symboly O a o sa niekedy nazývajú asymptotické odhady. Definícia 10.3. Funkcie ot(x) a /3(x) sa nazývajú neporovnateľné b.m. pre x -¥ a, ak neexistuje ani konečná, ani nekonečná hranica ich pomeru, t.j. ak $ lim a(x)/0(x) (p £ je presne ako $ lim 0(x)/a(x)). Príklad 10.1. A. Funkcie a(x) = x a f(x) = sin2ar, na základe definície 10.1, sú b.m. rovnakého rádu pri x 0, keďže sa berie do úvahy (b. funkcia a (x) \u003d 1 - coss, podľa definície 10,2, - b. m. vyššieho rádu v porovnaní s 0 (x) \u003d x pri x 0, keďže s prihliadnutím na c Funkcia a(s) = \/x je bm nižšieho rádu v porovnaní s fl(x) = x pre x 0, keďže r Funkcie a(s) = x podľa definície 10,3 sú neporovnateľné bm pri x 0, keďže neexistuje žiadna hranica (ani konečná, ani nekonečná - pozri príklad 7.5). x a b.m. vyššieho rádu v porovnaní s xn~1) t.j. yapa \u003d ao (a: n "* 1), pretože lim (xL / xn" 1) \u003d V prípade potreby presnejšie porovnávacie charakteristiky správanie b.m. funkcií na x - a jeden z nich je vybraný ako druh štandardu a nazývaný hlavným. Samozrejmosťou je výber hlavného b.m. do určitej miery ľubovoľné (snažia sa zvoliť jednoduchšie: x pre x - * 0; x-1 pre x -41; 1 / x pre x -\u003e oo atď.). Od stupňov 0k(x) hlavná b.m. funkcie f)(x) s rôznymi exponentmi k > 0 (keď k ^ 0 0k(x) nie je f.m.) tvoria porovnávací spánok pre odhad zložitejšej f.m. funkcie a(z). Definícia 10.4. Funkcia a(z) sa nazýva b.m. k-tý rád malosti vzhľadom na (3(x) pre x a, a číslo k je rád malosti, ak funkcie a(z) a /3k(x) sú b.m. rovnakého rádu pre x a), t.j. ak sa aj v tomto prípade zvyčajne vynecháva slovo „malý.“ Poznámka: 1) poradie k jednej funkcie b.m. vzhľadom na druhú môže byť ľubovoľné kladné číslo; 2) ak poradie funkcie a(x) vzhľadom na / 3(x) sa rovná k, potom sa poradie funkcie P(x) vzhľadom na a(x) rovná 1/k, 3) nie je vždy možné uviesť pre bm určitý rad k funkcia a(x), aj keď je porovnateľná so všetkými mocninami /?*(x) Príklad 10.2.a Funkcia cosx podľa definície 10.4 je b.m rádu k = 2 vzhľadom na 0(x) = x pri x 0, keďže berieme do úvahy b. Uvažujme funkcie. Ukážeme, že pre ľubovoľnú Skutočne podľa ( 7.32). Funkcia a1/1 je teda porovnateľná s xk pre ľubovoľné k > 0 pre x -> 0, ale pre túto funkciu nie je možné uviesť poradie maličkosti vzhľadom na x. vzhľadom na druhú nie je vždy jednoduché. Môžeme odporučiť nasledujúci postup: 1) napíšte pod medzné znamienko pomer a(x). ) / 0k(x)\ 2) analyzovať zapísaný pomer a pokúsiť sa ho zjednodušiť, hodnota k), pri ktorej bude nenulová konečná hranica; 4) skontrolujte predpoklad výpočtom limitu. Príklad 10.3. Určme poradie b.m. funkcie tgx - sin x vzhľadom na x na x -» 0, t.j. nájdime číslo k > 0 také, aby sme mali ASYMPTOTICKÉ SPRÁVANIE funkcií. Porovnanie infinitezimálnych funkcií. V tomto štádiu, keď vieme, že pri x 0, podľa (7.35) a (7.36), (sinx)/x 1 a cosx -> 1, a berúc do úvahy (7.23) a (7.33), môžeme určiť túto podmienku ( 10.7) bude splnený pre k = 3. Priamy výpočet limity pre k = 3 totiž dáva hodnotu A = 1/2: Všimnite si, že pre k > 3 dostaneme nekonečnú limitu a pre , limita bude rovná nule.

480 rubľov. | 150 UAH | 7,5 $, MOUSEOFF, FGCOLOR, "#FFFFCC",BGCOLOR, "#393939");" onMouseOut="return nd();"> Diplomová práca - 480 rubľov, doprava 10 minút 24 hodín denne, sedem dní v týždni a sviatky

Kolodzei Alexander Vladimirovič Asymptotické vlastnosti kritérií dobrej zhody pre testovanie hypotéz vo výberovej schéme bez náhrady, založené na naplnení buniek vo všeobecnej alokačnej schéme: dizertačná práca ... kandidát fyzikálnych a matematických vied: 01.01.05 - Moskva, 2006 .- 110 b.: chorý. RSL OD, 61 07-1/496

Úvod

1 Entropia a informačná vzdialenosť 36

1.1 Základné definície a symboly 36

1.2 Entropia diskrétnych rozdelení s obmedzeným očakávaním 39

1.3 Logaritmická zovšeobecnená metrika na množine diskrétnych rozdelení 43

1.4 Kompaktnosť funkcií spočítateľnej množiny argumentov. 46

1.5 Spojitosť informačnej vzdialenosti Kullback-Leibler-Sanov 49

1.6 Závery 67

2 Veľká pravdepodobnosť odchýlok 68

2.1 Pravdepodobnosti veľkých odchýlok funkcií od počtu buniek s danou náplňou 68

2.1.1 Lokálna limitná veta 68

2.1.2 Integrálna limitná veta 70

2.1.3 Informačná vzdialenosť a pravdepodobnosti veľkých odchýlok oddeliteľných štatistík 75

2.2 Pravdepodobnosti veľkých odchýlok oddeliteľných štatistík, ktoré nespĺňajú Cramerovu podmienku 81

2.3 Závery 90

3 Asymptotické vlastnosti kritérií dobrej zhody 92

3.1 Kritériá prijatia pre schému výberu bez návratu. 92

3.2 Asymptotická relatívna účinnosť testov dobrej zhody 94

3.3 Kritériá založené na počte buniek vo všeobecných rozloženiach 95

3.4 Závery 98

Záver 99

Literatúra 103

Úvod do práce

Predmet výskumu a relevantnosť témy. V teórii štatistickej analýzy diskrétnych sekvencií zaujímajú špeciálne miesto testy dobrej zhody na testovanie prípadne komplexnej nulovej hypotézy, ktorá je taká, že pre náhodnú sekvenciu pQ)?=i

Хі Є Ім,і= 1,...,n, Ім = (o, i,..., M), pre ľubovoľné і = 1,..., n a pre ľubovoľné k Є їм pravdepodobnosť udalosť (Хі = k) nezávisí od r. To znamená, že postupnosť (Xi)f = 1 je v určitom zmysle stacionárna.

V počte aplikované úlohy za postupnosť (Х() =1 považujeme poradie farieb loptičiek pri výbere bez návratu do vyčerpania z urny obsahujúcej rik - 1 > 0 loptičiek farby k, k .,pd/ - 1) Nech urna obsahuje n - 1 guľôčka, m n-l= (n fc -l).

Označme r(k) _ r(fc) r(fc) postupnosť počtov guličiek farby k vo vzorke. Zvážte postupnosť h" = (^,...,)). M fc) =ri fc) , ^ = ^-^ = 2,...,^-1, _ (fc)

Postupnosť h^ je definovaná pomocou vzdialeností medzi miestami susedných guľôčok farby k tak, že *Ф = n.

Množina postupností h(fc) pre všetky k Є їm jednoznačne určuje postupnosť postupnosť farieb loptičiek je jednoznačne určená postupnosťou h() vzdialeností medzi miestami susedných loptičiek rovnakej pevnej farby. obsahujúce n - 1 guľôčok dvoch rôznych farieb obsahujú N - 1 guľôčky farby 0. Je možné vytvoriť vzájomnú zhodu medzi množinou M(N-l,n - N) a množinou 9 \ Nі m vektorov h( n, N) = (hi,..., /i#) s kladnými celými zložkami takými, že

Množina 9\n,m zodpovedá množine všetkých odlišných delení kladného celého čísla n do N usporiadaných sčítancov.

Po zadaní určitého rozdelenia pravdepodobnosti na množine vektorov 9H n g dostaneme zodpovedajúce rozdelenie pravdepodobnosti na množine Wl(N - l,n - N). Množina Y\n,s je podmnožinou množiny 2J n ,iv vektorov s nezápornými celočíselnými zložkami, ktoré spĺňajú (0,1). Ako rozdelenia pravdepodobnosti na množine vektorov JZ p d v dizertačnej práci rozdelenia tvaru

P(x, N) = (r t..., r N)) = P(& = rn, u = 1,..., N\ & = n), (0,2) kde 6 > , n - nezávislé nezáporné celočíselné náhodné premenné.

Distribúcie tvaru (0,2) v /24/ sa nazývali zovšeobecnené schémy umiestnenia n častíc do N buniek. Konkrétne, ak sú náhodné premenné h..., n v (0,2) rozdelené podľa Poissonových zákonov s parametrami Ai,...,Alg, potom vektor h(n,N) má polynomické rozdelenie. s pravdepodobnosťou výsledkov

Pu \u003d m--~t~\u003e ^ \u003d 1,---, ^-

Li + ... + l^

Ak sú náhodné premenné i> >&v v (0.2) rovnomerne rozdelené podľa geometrického zákona V(Zi = k)= P k - 1 (l-p),k=l,2,..., kde p je ľubovoľné v interval 0

Ako je uvedené v /14/,/38/, osobitné miesto pri testovaní hypotéz o distribúcii frekvenčných vektorov h(n, N) = (hi,..., h^) v zovšeobecnených schémach umiestnenia n častíc do N buniek je obsadené kritériami zostavenými na základe štatistiky formulára

Фк "%,%..;$, (0,4) kde /j/, v = 1,2,... a φ sú niektoré funkcie s reálnou hodnotou,

Mg \u003d E 1 (K \u003d g), g \u003d 0,1, .... 1 / \u003d 1

Množstvo //r v /27/ sa nazývalo počet buniek obsahujúcich presne r častíc.

Štatistiky tvaru (0,3) v /30/ sa nazývajú separovateľné (aditívne separovateľné) štatistiky. Ak funkcie /„ v (0.3) nezávisia od u, tak sa takáto štatistika volala v /31/ symetrickej separovateľnej štatistike.

Pre ľubovoľné r je štatistika fx r symetrická separovateľná štatistika. Z rovnosti

DM = DFg (0,5) z toho vyplýva, že trieda symetrickej separovateľnej štatistiky v h u sa zhoduje s triedou lineárnych funkcií v fi r . Trieda funkcií formulára (0,4) je navyše širšia ako trieda symetrickej separovateľnej štatistiky.

H 0 = (R0(n, L0) je postupnosť jednoduchých nulových hypotéz, že rozdelenie vektora h(n, N) je (0,2), kde náhodné premenné i,..., n a (0,2) sú identicky rozdelené a P(ti = k)=p k ,k = 0,l,2,..., parametre n, N sa menia v centrálnej oblasti.

Uvažujme nejaké РЄ (0,1) a postupnosť, všeobecne povedané, komplexných alternatív n = (H(n,N)) tak, že existuje n

P(Fm > OpAR)) >: 0-Zamietneme hypotézu Hq(ti,N), ak fm > a w m((3). Ak existuje limita jim ~1nP(0lg > a n, N (P)) = Sh ), kde pravdepodobnosť pre každé N sa vypočíta podľa hypotézy #o(n,iV), potom sa hodnota j (fi,lcl) volá v /38/ indexe kritéria φ v bode (/?,Н) . Posledný limit vo všeobecnosti nemusí existovať. Preto sa v dizertačnej práci okrem indexu kritéria uvažuje aj s hodnotou lim (_IlnP(tor > a N (J3))) =іф(Р,П), ktorú analogicky nazval autor tzv. dolný index kritéria f v bode (/3,Н) . Tu a nižšie lim adg, lim a# jV-yuo LG-yuo v tomto poradí znamená dolnú a hornú hranicu sekvencie (odr) ako N -> syu,

Ak existuje index kritéria, potom sa mu zhoduje dolný index kritéria. Dolný index kritéria vždy existuje. Ako väčšiu hodnotu index kritéria (nižší index kritéria), tým lepšie je štatistické kritérium v ​​uvažovanom zmysle. V /38/ problém konštrukcie kritérií dobrej zhody pre zovšeobecnené dispozície s najvyššia hodnota index kritéria v triede kritérií, ktoré odmietajú hypotézu Ho(n, N) pre kde m > 0 je nejaká pevné číslo, postupnosť konštánt napr. je vybraná na základe danej hodnoty mocniny kritéria s postupnosťou alternatív, ft je reálna funkcia m + 1 argumentov.

Kritériové indexy sú určené pravdepodobnosťou veľkých odchýlok. Ako je uvedené v /38/, hrubá (až logaritmická ekvivalencia) asymptotika pravdepodobností veľkých odchýlok separovateľnej štatistiky, keď je splnená Cramerova podmienka pre náhodnú premennú /(), je určená zodpovedajúcou informačnou vzdialenosťou Kullback-Leibler-Sanov. (náhodná premenná μ spĺňa Cramerovu podmienku , ak pre nejaké # > 0 je moment generujúca funkcia Me f7? konečná v intervale \t\

Otázka pravdepodobnosti veľkých odchýlok štatistiky od neohraničeného čísla fi r, ako aj ľubovoľných separovateľných štatistík, ktoré nespĺňajú Cramerovu podmienku, zostala otvorená. To neumožnilo definitívne vyriešiť problém konštrukcie kritérií na testovanie hypotéz vo všeobecných alokačných schémach s najvyššou mierou konvergencie k nule pre pravdepodobnosť chyby prvého druhu v prípade konvergujúcich alternatív v triede kritérií. na základe štatistiky formulára (0,4). Relevantnosť dizertačnej rešerše je daná potrebou doriešenia tohto problému.

Cieľom dizertačnej práce je skonštruovať kritériá dobrej zhody s najvyššou hodnotou indexu kritéria (nižší index kritéria) na testovanie hypotéz vo výberovej schéme bez návratu do triedy kritérií, ktoré odmietajú hypotézu W( n, N) pri 0(iv"iv"-""" o """)>CiV "(0" 7), kde φ je funkcia spočítateľného počtu argumentov a parametre n, N sa menia v centrálnom regiónu.

V súlade s účelom štúdie boli stanovené nasledovné úlohy: preskúmať vlastnosti entropie a informačnej vzdialenosti Kullback - Leibler - Sanov pre diskrétne rozdelenia s počítateľným počtom výsledkov; študovať pravdepodobnosti veľkých odchýlok štatistiky formulára (0,4); študovať pravdepodobnosti veľkých odchýlok symetrických separovateľných štatistík (0,3), ktoré nespĺňajú Cramerovu podmienku; - nájsť takú štatistiku, že kritérium zhody postavené na jeho základe pre testovanie hypotéz vo všeobecných alokačných schémach má najväčšiu hodnotu indexu v triede kritérií formulára (0,7).

Vedecká novinka: je daný koncept zovšeobecnenej metriky - funkcie, ktorá pripúšťa nekonečné hodnoty a spĺňa axiómy identity, symetrie a trojuholníkovej nerovnosti. Nájde sa zovšeobecnená metrika a naznačia sa množiny, na ktorých sú funkcie entropie a informačnej vzdialenosti dané na rodine diskrétnych rozdelení s spočítateľným počtom výsledkov v tejto metrike spojité; v zovšeobecnenej alokačnej schéme sa nachádza hrubá (až logaritmická ekvivalencia) asymptotika pre pravdepodobnosti veľkých odchýlok štatistiky tvaru (0,4), ktoré spĺňajú zodpovedajúcu formu Cramerovej podmienky; vo všeobecnej alokačnej schéme sa nachádza hrubá (až do logaritmickej ekvivalencie) asymptotika pre pravdepodobnosti veľkých odchýlok symetrických separovateľných štatistík, ktoré nespĺňajú Cramerovu podmienku; v triede kritérií formulára (0,7) sa zostrojí kritérium s najväčšou hodnotou indexu kritéria.

Vedecká a praktická hodnota. V príspevku je riešených množstvo otázok o správaní sa veľkých pravdepodobností odchýlok v zovšeobecnených alokačných schémach. Získané výsledky je možné použiť v vzdelávací proces v odboroch matematická štatistika a teória informácie, pri štúdiu štatistických postupov na analýzu diskrétnych postupností a boli použité v /3/, /21/ pri zdôvodňovaní bezpečnosti jednej triedy informačných systémov. Návrhy, ktoré treba obhajovať: zníženie problému kontroly použitím jedinej sekvencie farieb loptičiek, hypotéza, že táto sekvencia bola získaná ako výsledok voľby bez výmeny až do vyčerpania loptičiek z urny obsahujúcej loptičky dvoch farieb, a každý takýto výber má rovnakú pravdepodobnosť, na konštrukciu kritérií dobrej zhody na testovanie hypotéz v zodpovedajúcom zovšeobecnenom usporiadaní; kontinuita Kullback-Leibler-Sanovovej entropie a informačnej vzdialenosti funkcií na nekonečne-rozmernom simplexe so zavedenou logaritmickou zovšeobecnenou metrikou; veta o hrubej (až do logaritmickej ekvivalencie) asymptotike pravdepodobností veľkých odchýlok symetrickej separovateľnej štatistiky, ktorá nespĺňa Cramerovu podmienku vo zovšeobecnenej alokačnej schéme v siedmom exionenciálnom prípade; veta o hrubej (až do logaritmickej ekvivalencie) asymptotike pravdepodobnosti veľkých odchýlok pre štatistiku tvaru (0,4); - konštrukcia kritéria zhody pre testovanie hypotéz vo všeobecných alokačných schémach s najväčšou hodnotou indexu v triede kritérií formulára (0,7).

Schválenie práce. Výsledky boli prezentované na seminároch Katedry diskrétnej matematiky Matematického ústavu. V. A. Steklov RAS, odbor informačnej bezpečnosti ITMiVT nich. S. A. Lebedev RAS a na: piatom celoruskom sympóziu o aplikovanej a priemyselnej matematike. Jarné zasadnutie, Kislovodsk, 2. - 8. máj 2004; šiesta medzinárodná Petrozavodská konferencia "Pravdepodobnostné metódy v diskrétnej matematike" 10. - 16. júna 2004; druhý Medzinárodná konferencia"Informačné systémy a technológie (IST" 2004)", Minsk, 8. - 10. novembra 2004;

Medzinárodná konferencia "Moderné problémy a nové trendy v teórii pravdepodobnosti", Chernivtsi, Ukrajina, 19. - 26. júna 2005.

Hlavné výsledky práce boli použité vo výskumnej práci „Apologia“, realizovanej ITMiVT RAS. S. A. Lebedev v záujme Federálnej služby pre technickú a exportnú kontrolu Ruskej federácie a boli zaradené do správy o realizácii etapy výskumu /21/. Samostatné výsledky dizertačnej práce boli zahrnuté do výskumnej správy „Vývoj matematických problémov kryptografie“ Akadémie kryptografie Ruskej federácie za rok 2004 /22/.

Autor vyjadruje svoju hlbokú vďaku vedeckému poradcovi, doktorovi fyzikálnych a matematických vied Ronzhinovi A.F. a vedeckému konzultantovi, doktorovi fyzikálnych a matematických vied, staršiemu výskumníkovi Knyazevovi A.V. matematickým vied I. A. Kruglovovi za pozornosť venovanú dielu a množstvo cenných poznámky.

Štruktúra a obsah práce.

Prvá kapitola skúma vlastnosti entropie a informačnej vzdialenosti pre rozdelenia na množine nezáporných celých čísel.

V prvom odseku prvej kapitoly je uvedený zápis a sú uvedené potrebné definície. Používajú sa najmä nasledujúci zápis: x = (:ro,i, ---) - nekonečnerozmerný vektor s počítateľným počtom komponentov;

H(x) -Ex^oXvlnx,; trunc m (x) = (x 0, x 1,...,x t,0,0,...); SI* = (x, x u > 0, u = 0,1,..., E~ xn0,v = 0,1,...,E? =Qxv = 1); fi 7 \u003d (x Є O, L 0 vx v \u003d 7); %] = (хЄП, Ео»х a

16 mі = e o ** v \ &c = Ue>1 | 5 є Q 7) o

Je zrejmé, že množina Vt zodpovedá rodine rozdelení pravdepodobnosti na množine nezáporných celých čísel, P 7 - rodine rozdelení pravdepodobnosti na množine nezáporných celých čísel s matematickým očakávaním

Оє(у) - (х eO,x v

V druhom odseku prvej kapitoly dokážeme vetu o ohraničenosti entropie diskrétnych rozdelení s ohraničeným matematickým očakávaním.

Veta 1. O ohraničenosti entropie diskrétnych rozdelení s ohraničeným matematickým očakávaním. Pre akýkoľvek wbp 7

Ak x Є fi 7 zodpovedá geometrickému rozdeleniu s matematickou predikciou 7 ; to jest

7xn = (1-p)p\ v = 0,1,..., kde p = --,

1 + 7 potom platí rovnosť H(x) = F(1).

Tvrdenie vety možno považovať za výsledok formálnej aplikácie metódy podmienených Lagrangeových multiplikátorov v prípade nekonečného počtu premenných. Veta, že jediné rozdelenie na množine (k, k + 1, k + 2,...) s daným matematickým očakávaním a maximálnou entropiou je geometrické rozdelenie s daným matematickým očakávaním je uvedené (bez dôkazu) v /47 /. Autor však podal prísny dôkaz.

V treťom odseku prvej kapitoly je uvedená definícia zovšeobecnenej metriky – metriky, ktorá pripúšťa nekonečné hodnoty.

Pre x, y Є Гі je funkcia p(x, y) definovaná ako minimum є > 0 s vlastnosťou y ​​v e~ e

Ak také є neexistuje, potom sa predpokladá, že p(x, y) = oo.

Je dokázané, že funkcia p(x, y) je zovšeobecnenou metrikou na rodine rozdelení na množine nezáporných celých čísel, ako aj na celej množine Ci*. Namiesto e v definícii metriky p(x, y) môžete použiť akékoľvek iné kladné číslo okrem 1. Výsledné metriky sa budú líšiť o multiplikatívnu konštantu. Označme J(x, y) informačnú vzdialenosť

Tu a nižšie sa predpokladá, že 0 In 0 = 0,01n ^ = 0. Informačná vzdialenosť je definovaná pre také x, y, že x v - 0 pre všetky a také, že y v = 0. Ak táto podmienka nie je splnená, potom bude predpokladať J (S,y) = ko. Nechaj A C 1 $. Potom budeme označovať J(Ay)="mU(x,y).

Nech J(Jb,y) = 00.

V štvrtom odseku prvej kapitoly je uvedená definícia kompaktnosti funkcií definovaných na množine Π*. Kompaktnosť funkcie s spočítateľným počtom argumentov znamená, že s akýmkoľvek stupňom presnosti možno hodnotu funkcie aproximovať hodnotami tejto funkcie v bodoch, kde je iba konečný počet argumentov nenulový. Je dokázaná kompaktnosť funkcií entropie a informačnej vzdialenosti.

Za akúkoľvek 0

Ak je pre nejakú 0 0 funkcia \(x) = J(x, p) kompaktná na množine ^ 7 ] P 0 r (p).

V piatom odseku prvej kapitoly sa zaoberáme vlastnosťami informačnej vzdialenosti danej na nekonečne-rozmernom priestore. V porovnaní s konečnorozmerným prípadom sa kvalitatívne mení situácia s kontinuitou funkcie informačnej vzdialenosti. Ukazuje sa, že funkcia informačnej vzdialenosti nie je spojitá na množine Г2 v žiadnej z metrík pi(,y)= E|z„-i/„|, (

00 \ 2 p 2 (x, y) = sup (x^-ij^.

Je dokázaná platnosť nasledujúcich nerovníc pre funkcie entropie H(x) a informačnej vzdialenosti J(x,p):

1. Pre ľubovoľné x, x "Є fi \ H (x) - H (x") \

2. Ak pre nejaké x, p є P existuje є > 0 tak, že x є O є (p), potom pre ľubovoľné X i Є Q \J(x,p) - J(x",p)\

Z týchto nerovností, berúc do úvahy vetu 1, vyplýva, že funkcie entropie a informačnej vzdialenosti sú rovnomerne spojité na zodpovedajúcich podmnožinách fi v metrike p(x,y), a to:

Pre ľubovoľných 7 takých, že 0

Ak za nejakých 70,0

20 potom pre ľubovoľnú 0 0 je funkcia \p(x) = J(x t p) rovnomerne spojitá na množine П 7 ] П О є (р) v metrike р(х,у).

Definícia neextremality funkcie je uvedená. Podmienka neextremality znamená, že funkcia nemá lokálne extrémy, alebo funkcia nadobúda rovnaké hodnoty v lokálnych minimách (lokálnych maximách). Podmienka neextremality oslabuje požiadavku, že neexistujú žiadne lokálne extrémy. Napríklad funkcia sin x na množine reálnych čísel má lokálne extrémy, ale spĺňa podmienku neextrémnosti.

Nech pre nejaké 7 > 0 je plocha A daná podmienkou

А = (хЄЇ1 1 ,Ф(х) >а), (0,9) kde Ф(х) je funkcia skutočnej hodnoty, a je nejaká reálna konštanta, inf Ф(х)

A 3y vyvstala otázka, za akých podmienok „a f „ f s u_ „ parametrami n, N v centrálnej oblasti, ^ -> 7, pre všetky dostatočne veľké hodnoty z nich existujú také nezáporné celé čísla ko, k \, ..., k n, čo je ko + hi + ... + k n = N,

21 k\ + 2/... + nk n - N

Kq k \ k n . ^"iv"-"iv" 0 " 0 "-")>a -

Je dokázané, že na to stačí vyžadovať, aby funkcia φ bola neextrémna, kompaktná a spojitá v metrike p(x, y), a tiež, že aspoň pre jeden bod vyhovuje x (0,9), pre niektoré є > 0 existuje konečný moment stupňa 1 + є Ml + = і 1+є x a 0 pre ľubovoľné u = 0,1,....

V druhej kapitole študujeme hrubú (až logaritmickú ekvivalenciu) asymptotiku pravdepodobnosti veľkých odchýlok funkcií od D = (fio,..., n, 0,...) - počet buniek s daným vyplnenie centrálnej oblasti parametrov N,n . Hrubá asymptotika pravdepodobností veľkých odchýlok postačuje na štúdium indexov vhodnosti testov.

Nech sú náhodné premenné ^ v (0.2) identicky rozdelené a

Р(Сі = k)=р b k = 0,1,... > P(z) - generujúca funkcia náhodnej veličiny i - konverguje v kružnici s polomerom 1

22 Označme p(.) = (p(ad = o), Pn) = i),...).

Ak existuje riešenie z 1 rovnice

M(*) = 7, potom je jedinečný /38/. Všade nižšie budeme predpokladať, že Pjfc>0,fc = 0,l,....

V prvom odseku prvého odseku druhej kapitoly je asymptotika logaritmov pravdepodobnosti tvaru

Nasledujúca veta je dokázaná.

Veta 2. Hrubá lokálna veta o pravdepodobnosti veľkých odchýlok. Nech n, N - * w tak, že - -> 7> 0

Výrok vety vyplýva priamo zo vzorca pre spoločné rozdelenie /do, A*b / v /26/ a nasledujúceho odhadu: ak nezáporné celočíselné hodnoty fii,fi2,/ spĺňajú podmienku /І1 + 2 // 2 + ... + 71/ = 71, potom počet nenulových hodnôt medzi nimi je 0 (l/n). Toto je hrubý odhad, ktorý si netvrdí, že je nový. Počet nenulových r v zovšeobecnených layoutoch nepresahuje hodnotu maximálneho zaplnenia buniek, ktorá v centrálnej oblasti s pravdepodobnosťou klesajúcou k 1 nepresahuje hodnotu 0(\np) /25/,/27/ . Napriek tomu je výsledný odhad 0(y/n) spokojný s pravdepodobnosťou 1 a postačuje na získanie hrubej asymptotiky.

V druhom odseku prvého odseku druhej kapitoly nájdeme hodnotu limity, kde adz je postupnosť reálnych čísel konvergujúcich k nejakému a Є R, φ(x) je funkcia s reálnou hodnotou. Nasledujúca veta je dokázaná.

Veta 3. Hrubá integrálna veta o pravdepodobnosti veľkých odchýlok. Nech sú splnené podmienky vety 2, pre nejaké r > 0, (> 0 je reálna funkcia φ(x) kompaktná, rovnomerne spojitá v metrike p na množine

A = 0 rH (p(r 1))np n] a spĺňa podmienku neextremality na množine r2 7 . Ak pre nejakú konštantu a taká, že inf φ(x)

24 je vektor p a fi 7 P 0 r (p(z 7)) ; také že

Ф(pа) > a J(( (x) >а,хЄ П 7 ),р(2; 7)) = J(p a ,p(^y)), mo pre ľubovoľnú postupnosť a^ konvergujúcu k a, ^ -^\nP(φ(φ, ^,...)>a m) = Pr a,p(r,)). (0,11)

Pri dodatočných obmedzeniach funkcie φ(x) možno informačnú vzdialenosť J(pa, P(zy)) v (2.3) vypočítať presnejšie. Totiž, nasledujúca veta je pravdivá. Veta 4. Informačná vzdialenosť. Nechajte chvíľu 0

Či nejaké r > 0, C > 0 reálna funkcia φ(x) a jej parciálne derivácie prvého rádu sú kompaktné a rovnomerne spojité vo zovšeobecnenej metrike p(x, y) na množine

A = 0 r (p)PP bl] , existuje T > 0, R > 0 také, že pre všetky \t\ 0 p v v 1+ z u exp(i--φ(x))

0(p(gaL)) = a, / x X v \Z,t) T, u= oX LJ (Z,t)

Potom p(za, t a) Є ft, u J ((z Є L, 0 (x) = a), p) = J (p (za, t a), p) d _ 9 = 7111 + t a "-^ OFaL)) - V 2Wexp( a --0(p(r a, i a))). j/=0 CnEi/ ^_o CX(/

Ak je funkcia φ(x) lineárna funkcia a funkcia fix) je definovaná pomocou rovnosti (0,5), potom sa podmienka (0,12) stane Cramerovou podmienkou pre náhodnú premennú f(,(z)). Podmienka (0,13) je forma podmienky (0,10) a používa sa na preukázanie prítomnosti v doménach tvaru (x Є T2, φ(x) > a) aspoň jedného bodu z 0 (n, N) pre všetky dostatočne veľké n, N.

Nech v ()(n,iV) = (/i,...,/ijv) je frekvenčný vektor vo všeobecnej alokačnej schéme (0,2). V dôsledku vety 3 a 4 je formulovaná nasledujúca veta.

Veta 5. Hrubá integrálna veta o pravdepodobnosti veľkých odchýlok symetrickej separovateľnej štatistiky v zovšeobecnenej schéme prideľovania.

Nech n, N -> w tak, že jfr - 7» 0 0, R > 0 také, že pre všetky \t\ Potom pre ľubovoľnú postupnosť a# konvergujúcu k a, 1 i iv =

Túto vetu prvýkrát dokázal AF Ronzhin v /38/ pomocou metódy sedlového bodu.

V druhej časti druhej kapitoly študujeme pravdepodobnosti veľkých odchýlok separovateľnej štatistiky v zovšeobecnených usporiadaniach cxj^iax v prípade nesplnenia Cramerovej podmienky pre náhodnú premennú /((z)). Cramerova podmienka pre náhodnú premennú f(,(z)) nie je splnená, najmä ak (z) je Poissonova náhodná premenná a /(x) = x 2 . Všimnite si, že Cramerova podmienka pre samotnú oddeliteľnú štatistiku vo všeobecných schémach prideľovania je vždy splnená, pretože pre akékoľvek pevné n, N je číslo možné výsledky v týchto grafoch, samozrejme.

Ako je uvedené v /2/, ak Cramerova podmienka nie je splnená, potom nájsť asymptotiku pravdepodobnosti veľkých odchýlok súčtu identicky rozdelených náhodné premenné pre správnu zmenu rozloženia termínu sa vyžaduje splnenie dodatočných f podmienok. V príspevku (uvažuje sa prípad, ktorý zodpovedá splneniu podmienky (3) v /2/, teda sedemexponenciálny prípad. Nech P(i = k) > 0 pre všetky

28 k = 0,1,... a funkcia p(k) = -\nP(t = k), môže byť rozšírená na funkciu spojitého argumentu - pravidelne sa meniacu funkciu rádu p, 0 oo P(tx) , r v P(t)

Nech je funkcia f(x) pre dostatočne veľké hodnoty argumentu kladná, prísne rastúca, pravidelne sa meniaca funkcia rádu q > 1, na zvyšku reálnej osi

Potom s. V. /(i) má momenty ľubovoľného rádu a nespĺňa Cramerovu podmienku, ip(x) = o(x) ako x -> oo a platí nasledujúca veta: ^p nerastie monotónne, n, N --> oo tak, že jf - A, 0 b(z\), kde b(z) = M/(1(2)), existuje limit l(n,l)) > cN] = "(c ~ b( zx))l b""ї

Z vety 6 vyplýva, že ak Cramerova podmienka nie je splnená, limita (^ lim ~\nP(L N (h(n,N)) > cN) = 0, "" Dv

L/-too iV a to dokazuje platnosť hypotézy uvedenej v /39/. Hodnota indexu kritéria dobrej zhody vo všeobecných alokačných schémach -^ keď nie je splnená Cramerova podmienka, je teda vždy rovná nule. V tomto prípade sa v triede kritérií, keď je splnená Cramerova podmienka, skonštruujú kritériá s nenulovou hodnotou indexu. Z toho môžeme vyvodiť záver, že použitie kritérií, ktorých štatistiky nespĺňajú Cramerovu podmienku, napríklad chí-kvadrát test v polynómovej schéme, na zostavenie testov dobrej zhody na testovanie hypotéz s nepribližujúcimi sa alternatívami je asymptoticky neefektívne v tento zmysel. Podobný záver bol urobený v /54/ na základe výsledkov porovnania štatistiky chí-kvadrát a maximálneho pravdepodobnostného pomeru v polynómovej schéme.

V tretej kapitole riešime problém konštrukcie kritérií dobrej zhody s najvyššou hodnotou indexu kritéria (najväčšia hodnota spodného indexu kritéria) na testovanie hypotéz v zovšeobecnených usporiadaniach. Na základe výsledkov prvej a druhej kapitoly o vlastnostiach entropických funkcií, informačnej vzdialenosti a pravdepodobnosti veľkých odchýlok sa v tretej kapitole nájde funkcia tvaru (0,4) taká, že kritérium dobrej zhody postavený na jeho základe má najväčšiu hodnotu presne nižšieho indexu v triede posudzovaných kritérií. Nasledujúca veta je dokázaná. Veta 7. O existencii indexu. Nech sú splnené podmienky vety 3, 0 ,... je postupnosť alternatívnych rozdelení, 0^(/3, iV) je maximálny počet, pre ktorý podľa hypotézy Н Р (hľa, nerovnosť

P(φ(^^,...) > a φ (P, M)) > (3, existuje limita, existuje index kritéria f

3ff,K) = 3((φ(x) >a,xe 3D.P^)).

Súčasne sph(0,th)N NP(e(2 7) = fc)"

Záver načrtáva dosiahnuté výsledky v ich vzťahu k všeobecnému cieľu a konkrétnym úlohám stanoveným v dizertačnej práci, formuluje závery na základe výsledkov dizertačného výskumu, naznačuje vedeckú novosť, teoretickú a praktickú hodnotu práce, ako aj konkrétnu vedeckú problémy, ktoré identifikoval autor a ktorých riešenie sa zdá byť relevantné.

Stručný prehľad literatúry k výskumnej téme.

Dizertačná práca sa zaoberá problémom konštrukcie kritérií dobrej zhody v zovšeobecnených alokačných schémach s najväčšou hodnotou indexu kritéria v triede funkcií formy (0,4) s nepribližujúcimi sa alternatívami.

Všeobecné schémy prideľovania zaviedol VF Kolchin v /24/. Hodnoty fi r v polynómovej schéme sa nazývali počet buniek s r výstrelmi a boli podrobne študované v monografii V. F. Kolchin, B. A. Sevastyanov, V. P. Chistyakov /27/. Hodnoty \і r v zovšeobecnených usporiadaniach študoval VF Kolchin v /25/,/26/. Štatistiky vo forme (0,3) prvýkrát uvažoval Yu.I. Medvedev v /30/ a nazývali sa separovateľná (aditívne separovateľná) štatistika. Ak funkcie /„ v (0.3) nezávisia od u, takáto štatistika sa volala v /31/ symetrickej separovateľnej štatistike. Asymptotické správanie momentov separovateľnej štatistiky v zovšeobecnených alokačných schémach získal GI Ivchenko v /9/. Limitné vety pre všeobecnú schému prideľovania boli tiež uvažované v /23/. Prehľady výsledkov limitných viet a dobrej zhody v diskrétnych pravdepodobnostných schémach typu (0,2) poskytli V. A. Ivanov, G. I. Ivčenko, Yu. I. Medvedev v /8/ a G. I. Ivchenko, Yu. I. Medvedev, A. F. Ronzhin v /14/. Kritériá dobrej zhody pre zovšeobecnené rozloženia zvážil A.F. Ronzhin v /38/.

Porovnanie vlastností štatistických testov v týchto prácach bolo uskutočnené z hľadiska relatívnej asymptotickej účinnosti. Uvažovalo sa o prípade približujúcich sa (súvislých) hypotéz - efektívnosť v zmysle Pitmana a nekonvergujúcich hypotéz - efektívnosti v zmysle Bahadur, Hodges - Lehman a Chernov. Spojenie medzi rôzne druhy o relatívnej účinnosti štatistických kritérií sa hovorí napríklad v /49/. Ako vyplýva z výsledkov Yu.I. Medvedeva v /31/ o rozdelení rozložiteľnej štatistiky v polynomickej schéme, test založený na štatistike chí-kvadrát má pri konvergujúcich hypotézach najvyššiu asymptotickú silu v triede rozložiteľnej štatistiky na frekvencie výsledkov v polynómovej schéme. Tento výsledok zovšeobecnil A.F. Ronzhin pre schémy typu (0,2) v /38/. II Viktorova a VP Chistyakov v /4/ skonštruovali optimálne kritérium pre polynómovú schému v triede lineárnych funkcií fi r . A. F. Ronzhin v /38/ skonštruoval kritérium, ktoré v prípade sledu alternatív nepribližujúcich sa nulovej hypotéze minimalizuje logaritmickú mieru pravdepodobnosti chyby prvého druhu smerujúcu k nule v triede štatistiky tvaru (0,6). Porovnanie relatívnej výkonnosti chí-kvadrát štatistiky a maximálneho pravdepodobnostného pomeru pre konvergujúce a nekonvergujúce hypotézy bolo vykonané v /54/. V dizertačnej práci bol uvažovaný prípad nepribližujúcich sa hypotéz. Štúdium relatívnej štatistickej účinnosti kritérií pri nekonvergujúcich hypotézach vyžaduje štúdium pravdepodobnosti superveľkých odchýlok - rádovo 0 (y/n). Prvýkrát takýto problém pre polynomické rozdelenie s pevným počtom výsledkov riešil IN Sanov v /40/. Asymptotická optimálnosť kritérií dobrej zhody pre testovanie jednoduchých a zložitých hypotéz pre polynomické rozdelenie v prípade konečného počtu výsledkov s nepribližujúcimi sa alternatívami bola uvažovaná v /48/. Vlastnosti informačnej vzdialenosti predtým uvažovali Kullback, Leibler /29/,/53/ a I. II. Sanov /40/, ako aj Heffding /48/. V týchto článkoch sa kontinuita informačnej vzdialenosti zvažovala na konečne-rozmerných priestoroch v euklidovskej metrike. Autor uvažoval aj o postupnosti priestorov s rastúcim rozmerom, napríklad v diele Ju.V. Prochorova /37/ alebo v diele V. I. Bogačeva, A. V. Kolesnikova /1/. Hrubé (až logaritmickú ekvivalenciu) teorémy o pravdepodobnosti veľkých odchýlok separovateľnej štatistiky v zovšeobecnených alokačných schémach za Cramerovej podmienky získal AF Roizhin v /38/. A. N. Timashev v /42/,/43/ získal presné (až do ekvivalencie) viacrozmerné integrálne a lokálne limitné vety o pravdepodobnosti veľkých odchýlok vektora fir^n, N),..., fi rs (n,N) , kde s, гі,..., r s - pevné celé čísla,

Štatistickými problémami testovania hypotéz a odhadu parametrov vo výberovej schéme bez náhrady v trochu inej formulácii sa zaoberali G. I. Ivčenko, V. V. Levin, E. E. Timonina /10/, /15/, kde sa riešili úlohy odhadu pre konečnú populáciu, keď počet jeho prvkov je neznáma hodnota, bola dokázaná asymptotická normalita multivariačnej S-štatistiky z nezávislých vzoriek vo výberovej schéme bez náhrady. Problémom štúdia náhodných premenných spojených s opakovaniami v sekvenciách nezávislých pokusov sa zaoberali A. M. Zubkov, V. G. Michajlov, A. M. Shoitov v /6/, /7/, /32/, /33/, /34/. Analýza hlavných štatistických problémov odhadovania a testovania hypotéz v rámci všeobecný model Markov-Poja vykonali G. I. Ivčenko, Ju. I. Medvedev v /13/, ktorého pravdepodobnostný rozbor bol uvedený v /11/. Metóda špecifikácie nepravdepodobných mier na množine kombinatorických objektov, ktorá nie je redukovateľná na všeobecnú schému prideľovania (0,2), bola opísaná v GI Ivchenko, Yu.I. Medvedev /12/. Rad problémov v teórii pravdepodobnosti, na ktoré možno získať odpoveď ako výsledok výpočtov pomocou rekurzívnych vzorcov, naznačuje AM Zubkov v /5/.

Nerovnice pre entropiu diskrétnych rozdelení boli získané v /50/ (citované v abstrakte A. M. Zubkova v RZhMat). Ak (p n )Lo je rozdelenie pravdepodobnosti,

Pn = E Pk, k=n A = supp^Pn+i

I + (In -f-) (X Rp - P p + 1)

Рп= (x f 1)n+v n>Q. (0,15)

Všimnite si, že extrémne rozdelenie (0,15) je geometrické rozdelenie s očakávaním A a funkcia F(X) parametra (0,14) sa zhoduje s funkciou očakávania vo vete 1.

Entropia diskrétnych distribúcií s obmedzeným očakávaním

Ak existuje index kritéria, potom sa mu zhoduje dolný index kritéria. Dolný index kritéria vždy existuje. Čím väčšia je hodnota indexu kritéria (nižší index kritéria), tým lepšie je štatistické kritérium v ​​uvažovanom zmysle. V /38/ bol riešený problém konštrukcie kritérií dobrej zhody pre zovšeobecnené rozloženia s najvyššou hodnotou indexu kritéria v triede kritérií, ktoré odmietajú hypotézu Ho(n,N) pre kde m 0 je nejaká pevná. číslo, postupnosť konštánt napr. je vybraná na základe danej hodnoty mocnosť kritéria pre postupnosť alternatív, ft je reálna funkcia m + 1 argumentov.

Kritériové indexy sú určené pravdepodobnosťou veľkých odchýlok. Ako je uvedené v /38/, hrubá (až logaritmická ekvivalencia) asymptotika pravdepodobností veľkých odchýlok separovateľnej štatistiky, keď je splnená Cramerova podmienka pre náhodnú premennú /(), je určená zodpovedajúcou informačnou vzdialenosťou Kullback-Leibler-Sanov. (náhodná premenná μ spĺňa Cramerovu podmienku , ak pre nejaké # 0 je moment generujúca funkcia Mef7? konečná v intervale \t\ H /28/).

Otázka pravdepodobnosti veľkých odchýlok štatistiky od neohraničeného čísla jedľa, ako aj ľubovoľných separovateľných štatistík, ktoré nespĺňajú Cramerovu podmienku, zostala otvorená. To neumožnilo definitívne vyriešiť problém konštrukcie kritérií na testovanie hypotéz vo všeobecných alokačných schémach s najvyššou mierou konvergencie k nule pre pravdepodobnosť chyby prvého druhu v prípade konvergujúcich alternatív v triede kritérií. na základe štatistiky formulára (0,4). Relevantnosť dizertačnej rešerše je daná potrebou doriešenia tohto problému.

Cieľom dizertačnej práce je zostaviť kritériá dobrej zhody s najvyššou hodnotou indexu kritéria (nižší index kritéria) na testovanie hypotéz vo výberovej schéme bez opakovania v triede kritérií, ktoré odmietajú hypotézu W( n, N) pre kde φ je funkciou spočítateľného počtu argumentov a parametre n, N sa menia v centrálnej oblasti. V súlade s účelom štúdie boli stanovené nasledovné úlohy: - skúmať vlastnosti entropie a Kullbackovej - Leibler - Sanov informačnej vzdialenosti pre diskrétne rozdelenia s počítateľným počtom výsledkov; - skúmať pravdepodobnosti veľkých odchýlok štatistiky tvaru (0,4); - skúmať pravdepodobnosti veľkých odchýlok symetrických separovateľných štatistík (0,3), ktoré nespĺňajú Cramerovu podmienku; - nájsť takú štatistiku, že kritérium zhody postavené na jeho základe pre testovanie hypotéz vo všeobecných alokačných schémach má najväčšiu hodnotu indexu v triede kritérií formulára (0,7). Vedecká novinka: - je daný pojem zovšeobecnená metrika - funkcia, ktorá pripúšťa nekonečné hodnoty a spĺňa axiómy identity, symetrie a trojuholníkovej nerovnosti. Nájde sa zovšeobecnená metrika a naznačia sa množiny, na ktorých sú funkcie entropie a informačnej vzdialenosti dané na rodine diskrétnych rozdelení s spočítateľným počtom výsledkov v tejto metrike spojité; - vo všeobecnej alokačnej schéme sa nájde hrubá (až logaritmická ekvivalencia) asymptotika pre pravdepodobnosti veľkých odchýlok štatistiky tvaru (0,4), ktoré spĺňajú zodpovedajúci tvar Cramerovej podmienky; - vo všeobecnej alokačnej schéme sa nachádza hrubá (až logaritmická ekvivalencia) asymptotika pre pravdepodobnosti veľkých odchýlok symetrickej separovateľnej štatistiky, ktorá nespĺňa Cramerovu podmienku; - v triede kritérií formulára (0,7) je postavené kritérium s najväčšou hodnotou indexu kritéria. Vedecká a praktická hodnota. V príspevku je riešených množstvo otázok o správaní sa veľkých pravdepodobností odchýlok v zovšeobecnených alokačných schémach. Získané výsledky je možné využiť vo vzdelávacom procese v odboroch matematická štatistika a teória informácie, pri štúdiu štatistických postupov analýzy diskrétnych postupností a boli použité v /3/, /21/ pri zdôvodňovaní bezpečnosti jednej triedy. informačných systémov. Ustanovenia na obranu: - zníženie problému kontroly použitím jedinej sekvencie farieb loptičiek hypotézy, že táto sekvencia bola získaná ako výsledok voľby bez výmeny až do vyčerpania loptičiek z urny obsahujúcej dve loptičky farby, a každý takýto výber má rovnakú pravdepodobnosť, na konštrukciu zhody kritérií na testovanie hypotéz v zodpovedajúcom zovšeobecnenom usporiadaní; - spojitosť funkcií entropie a Kullback - Leibler - Sanov informačnej vzdialenosti na nekonečne rozmernom simplexe so zavedenou logaritmickou zovšeobecnenou metrikou; - teorém o hrubej (až logaritmickej ekvivalencii) asymptotike pravdepodobností veľkých odchýlok symetrickej separovateľnej štatistiky, ktorá nespĺňa Cramerovu podmienku vo všeobecnej alokačnej schéme v sedem exionenciálnom prípade;

Kontinuita informačnej vzdialenosti Kullback-Leibler-Sanov

Všeobecné schémy prideľovania zaviedol VF Kolchin v /24/. Hodnoty fir v polynómovej schéme sa nazývali počet buniek s r výstrelmi a boli podrobne študované v monografii V. F. Kolchin, B. A. Sevastyanov, V. P. Chistyakov /27/. Hodnoty \іr v zovšeobecnených usporiadaniach študoval VF Kolchin v /25/,/26/. Štatistiky vo forme (0,3) prvýkrát uvažoval Yu.I. Medvedev v /30/ a nazývali sa separovateľná (aditívne separovateľná) štatistika. Ak funkcie /„ v (0.3) nezávisia od u, takáto štatistika sa volala v /31/ symetrickej separovateľnej štatistike. Asymptotické správanie momentov separovateľnej štatistiky v zovšeobecnených alokačných schémach získal GI Ivchenko v /9/. Limitné vety pre všeobecnú schému prideľovania boli tiež uvažované v /23/. Prehľady výsledkov limitných viet a dobrej zhody v diskrétnych pravdepodobnostných schémach typu (0,2) poskytli V. A. Ivanov, G. I. Ivčenko, Yu. I. Medvedev v /8/ a G. I. Ivchenko, Yu. I. Medvedev, A. F. Ronzhin v /14/. Kritériá dobrej zhody pre zovšeobecnené rozloženia zvážil A.F. Ronzhin v /38/.

Porovnanie vlastností štatistických testov v týchto prácach bolo uskutočnené z hľadiska relatívnej asymptotickej účinnosti. Uvažovalo sa o prípade približujúcich sa (súvislých) hypotéz - efektívnosť v zmysle Pitmana a nekonvergujúcich hypotéz - efektívnosti v zmysle Bahadur, Hodges - Lehman a Chernov. Vzťah medzi rôznymi typmi relatívneho výkonu štatistických testov je diskutovaný napríklad v /49/. Ako vyplýva z výsledkov Yu.I. Medvedeva v /31/ o rozdelení separovateľných štatistík v polynomickej schéme, test založený na chí-kvadrát štatistike má pri konvergujúcich hypotézach najvyššiu asymptotickú silu v triede separovateľných štatistík na frekvencie výsledkov v polynómovej schéme. Tento výsledok zovšeobecnil A.F. Ronzhin pre schémy typu (0,2) v /38/. II Viktorova a VP Chistyakov v /4/ skonštruovali optimálne kritérium pre polynómovú schému v triede lineárnych funkcií jedle. A. F. Ronzhin v /38/ skonštruoval kritérium, ktoré v prípade sledu alternatív nepribližujúcich sa nulovej hypotéze minimalizuje logaritmickú mieru pravdepodobnosti chyby prvého druhu smerujúcu k nule v triede štatistiky tvaru (0,6). Porovnanie relatívnej výkonnosti chí-kvadrát štatistiky a maximálneho pravdepodobnostného pomeru pre konvergujúce a nekonvergujúce hypotézy bolo vykonané v /54/. V dizertačnej práci bol uvažovaný prípad nepribližujúcich sa hypotéz. Štúdium relatívnej štatistickej účinnosti kritérií pri nekonvergujúcich hypotézach vyžaduje štúdium pravdepodobnosti superveľkých odchýlok - rádovo 0 (y/n). Prvýkrát takýto problém pre polynomické rozdelenie s pevným počtom výsledkov riešil IN Sanov v /40/. Asymptotická optimálnosť kritérií dobrej zhody pre testovanie jednoduchých a zložitých hypotéz pre polynomické rozdelenie v prípade konečného počtu výsledkov s nepribližujúcimi sa alternatívami bola uvažovaná v /48/. Vlastnosti informačnej vzdialenosti predtým uvažovali Kullback, Leibler /29/,/53/ a I. II. Sanov /40/, ako aj Heffding /48/. V týchto článkoch sa kontinuita informačnej vzdialenosti zvažovala na konečne-rozmerných priestoroch v euklidovskej metrike. Autor uvažoval aj o postupnosti priestorov s rastúcim rozmerom, napríklad v diele Ju.V. Prochorova /37/ alebo v diele V. I. Bogačeva, A. V. Kolesnikova /1/. Hrubé (až do logaritmickej ekvivalencie) teorémy o pravdepodobnosti veľkých odchýlok oddeliteľnej štatistiky vo všeobecných schémach prideľovania za Cramerovej podmienky získal A. F. Roizhin v /38/. A. N. Timashev v /42/,/43/ získal presné (až do ekvivalencie) viacrozmerné integrálne a lokálne limitné vety o pravdepodobnosti veľkých odchýlok vektora.

Štúdium pravdepodobností veľkých odchýlok pri nesplnení Cramerovej podmienky pre prípad nezávislých náhodných veličín sa realizovalo v prácach A. V. Nagaeva /35/. Spôsob konjugovaných distribúcií popisuje Feller /45/.

Štatistickými problémami testovania hypotéz a odhadu parametrov vo výberovej schéme bez náhrady v trochu inej formulácii sa zaoberali G. I. Ivčenko, V. V. Levin, E. E. Timonina /10/, /15/, kde sa riešili úlohy odhadu pre konečnú populáciu, keď počet jeho prvkov je neznáma hodnota, bola dokázaná asymptotická normalita multivariačnej S-štatistiky z nezávislých vzoriek vo výberovej schéme bez náhrady. Problémom štúdia náhodných premenných spojených s opakovaniami v sekvenciách nezávislých pokusov sa zaoberali A. M. Zubkov, V. G. Mikhailov, A. M. Shoitov v /6/, /7/, /32/, /33/, /34/ . Analýzu hlavných štatistických problémov odhadu a testovania hypotéz v rámci všeobecného Markov-Poyovho modelu vykonali G. I. Ivčenko, Yu. I. Medvedev v /13/, ktorej pravdepodobnostnú analýzu podal /11. /. Metóda špecifikácie nepravdepodobných mier na množine kombinatorických objektov, ktorá nie je redukovateľná na všeobecnú schému prideľovania (0,2), bola opísaná v GI Ivchenko, Yu.I. Medvedev /12/. Rad problémov v teórii pravdepodobnosti, na ktoré možno získať odpoveď ako výsledok výpočtov pomocou rekurzívnych vzorcov, naznačuje AM Zubkov v /5/.

Informačná vzdialenosť a pravdepodobnosti veľkých odchýlok separovateľných štatistík

Keď Cramerova podmienka nie je splnená, veľké odchýlky oddeliteľných štatistík vo zovšeobecnenej alokačnej schéme v uvažovanom sedemexponenciálnom prípade sú určené pravdepodobnosťou odchýlky jedného nezávislého člena. Keď je Cramerova podmienka splnená, nie je to tak, ako je zdôraznené v /39/. Poznámka 10. Funkcia φ(x) je taká, že matematické očakávanie Ee (A) je konečné pri 0 t 1 a nekonečné pri t 1. Poznámka 11. Pre separovateľné štatistiky, ktoré nespĺňajú Cramerovu podmienku, limita (2.14) sa rovná 0, čo dokazuje platnosť dohadu vyjadreného v /39/. Poznámka 12. Pre chí-kvadrát štatistiku v polynómovej schéme pre n, ./V - co také, že - A, vyplýva priamo z vety, že Tento výsledok bol získaný priamo v /54/. V tejto kapitole, v centrálnom rozsahu parametrov zovšeobecnených schém distribúcie častíc v bunkách, hrubá (až do logaritmickej ekvivalencie) asymptotika pravdepodobnosti veľkých odchýlok aditívne separovateľnej štatistiky od bunkovej výplne a funkcií počtu buniek s daná náplň sa našla.

Ak je Cramerova podmienka splnená, potom hrubá asymptotika pravdepodobností veľkých odchýlok je určená hrubou asymptotikou pravdepodobností pádu do postupnosti bodov s racionálnymi súradnicami zbiehajúcimi sa v uvedenom zmysle do bodu, v ktorom je extrém zodpovedajúceho informačná vzdialenosť je dosiahnutá.

Uvažoval sa sedem exponenciálny prípad nesplnenia Cramerovej podmienky pre náhodné premenné f(i),..., f(x), kde b, x sú nezávislé náhodné premenné generujúce zovšeobecnenú rozdeľovaciu schému (0.2), f(k) je funkcia v definícii symetrickej aditívne separovateľnej štatistiky v (0.3). To znamená, že sa predpokladalo, že funkcie p(k) = - lnP(i = k) a f(k) možno rozšíriť na pravidelne sa meniace funkcie spojitého argumentu rádu p 0 a q 0 a p q . Ukázalo sa, že hlavný príspevok k hrubej asymptotike pravdepodobnosti veľkých odchýlok separovateľnej štatistiky v zovšeobecnených alokačných schémach má podobne aj hrubá asymptotika pravdepodobnosti pridelenia k zodpovedajúcej postupnosti bodov. Je zaujímavé poznamenať, že skoršia veta o pravdepodobnosti veľkých odchýlok pre oddeliteľnú štatistiku bola dokázaná pomocou metódy sedlového bodu, pričom hlavný príspevok k asymptotike vytvára jediný sedlový bod. Prípad zostal nepreskúmaný, keď, ak nie je splnená Cramerova podmienka, nie je splnená podmienka 2 kN.

Ak nie je splnená Cramerova podmienka, potom uvedená podmienka nemusí byť splnená iba v prípade p 1. Ako vyplýva priamo z logaritmu príslušného rozdelenia pravdepodobnosti, pre Poissonovo rozdelenie a geometrické rozdelenie p=1. Z výsledku asymptotiky pravdepodobností veľkých odchýlok, keď nie je splnená Cramerova podmienka, môžeme konštatovať, že kritériá, ktorých štatistiky nespĺňajú Cramerovu podmienku, majú výrazne nižšiu mieru konvergencie k nule pravdepodobnosti chýb 2. druhu pre pevnú pravdepodobnosť chyby prvého druhu a nepribližujúce sa alternatívy v porovnaní s kritériami, ktorých štatistiky spĺňajú Cramerovu podmienku. Nechajte urnu obsahujúcu N - 1 1 bielych un-JV 1 čiernych guľôčok vybrať bez výmeny, kým sa nevyčerpá. Dáme do súvisu polohy bielych guľôčok vo voľbe 1 i\ ... r -i n - 1 s postupnosťou vzdialeností hi,..., h medzi susednými bielymi guľami takto: Potom hv l,v =1, ... ,N,M EjLi i/ - n- Definujme rozdelenie pravdepodobnosti na množine vektorov h = (hi,..., λg) nastavením V(hv = rv,v = l,... ,N) kde i,... ,lg - nezávislé nezáporné celočíselné náhodné premenné (r.v.), teda uvažujme zovšeobecnenú schému prideľovania (0,2). Distribúcia vektora h závisí od n,N, ale tam, kde je to možné, budú príslušné indexy vynechané kvôli zjednodušeniu zápisu. Poznámka 14. Ak je každému z (]) spôsobov výberu loptičiek z urny priradená rovnaká pravdepodobnosť (\) mn pre ľubovoľné r i,..., rg tak, že rn 1,u = l,...,N , T,v=\ru = n, pravdepodobnosť, že vzdialenosti medzi susednými bielymi guličkami vo výbere nadobudnú tieto hodnoty

Kritériá založené na počte buniek vo všeobecných rozloženiach

Cieľom dizertačnej práce bolo skonštruovať kritériá vhodnosti pre testovanie hypotéz vo výberovej schéme bez návratu z urny s guľôčkami 2 farieb. Autor sa rozhodol preštudovať štatistiku na základe frekvencie vzdialeností medzi loptičkami rovnakej farby. V tejto formulácii sa problém zredukoval na problém testovania hypotéz vo vhodnom zovšeobecnenom rozložení.

V dizertačnej práci boli - skúmané vlastnosti entropie a informačnej vzdialenosti diskrétnych rozdelení s neobmedzeným počtom výsledkov s obmedzeným matematickým očakávaním; - bola získaná hrubá (až do logaritmickej ekvivalencie) asymptotika pravdepodobnosti veľkých odchýlok širokej triedy štatistík vo všeobecnej schéme prideľovania; - na základe získaných výsledkov sa zostrojí kriteriálna funkcia s najvyššou logaritmickou mierou konvergencie k nule pravdepodobnosti chyby prvého druhu pre pevnú pravdepodobnosť chyby druhého druhu a nepribližujúce sa alternatívy; - Bolo dokázané, že štatistiky, ktoré nespĺňajú Cramerovu podmienku, majú nižšiu mieru sklonu k nule pravdepodobnosti veľkých odchýlok v porovnaní so štatistikami, ktoré takúto podmienku spĺňajú. Vedecká novinka práce je nasledovná. - je daný pojem zovšeobecnená metrika - funkcia, ktorá pripúšťa nekonečné hodnoty a spĺňa axiómy identity, symetrie a trojuholníkovej nerovnosti. Nájde sa zovšeobecnená metrika a naznačia sa množiny, na ktorých sú funkcie entropie a informačnej vzdialenosti dané na rodine diskrétnych rozdelení s spočítateľným počtom výsledkov v tejto metrike spojité; - vo všeobecnej alokačnej schéme sa nájde hrubá (až logaritmická ekvivalencia) asymptotika pre pravdepodobnosti veľkých odchýlok štatistiky tvaru (0,4), ktoré spĺňajú zodpovedajúci tvar Cramerovej podmienky; - vo všeobecnej alokačnej schéme sa nachádza hrubá (až logaritmická ekvivalencia) asymptotika pre pravdepodobnosti veľkých odchýlok symetrických separovateľných štatistík, ktoré nespĺňajú Cramerovu podmienku; - v triede kritérií formulára (0,7) je postavené kritérium s najväčšou hodnotou indexu kritéria. V príspevku je riešených množstvo otázok o správaní sa veľkých pravdepodobností odchýlok v zovšeobecnených alokačných schémach. Získané výsledky je možné využiť vo výchovno-vzdelávacom procese v odboroch matematická štatistika a teória informácie, pri štúdiu štatistických postupov pri analýze diskrétnych postupností a boli použité v /3/, /21/ pri zdôvodňovaní bezpečnosti jednej triedy. informačných systémov. Niekoľko otázok však zostáva otvorených. Autor sa obmedzil na uvažovanie o centrálnej zóne zmien parametre n,N zovšeobecnené schémy na usporiadanie n častíc v /V bunkách. Ak nositeľom rozdelenia náhodných premenných generujúcich zovšeobecnenú alokačnú schému (0,2) nie je množina tvaru r, r 4-1, r + 2,..., potom pri preukázaní spojitosti informačnej dištančnej funkcie resp. pri štúdiu pravdepodobnosti veľkých odchýlok je potrebné vziať do úvahy aritmetickú štruktúru takéhoto nosiča, s ktorou sa autor v práci nerátal. Pre praktickú aplikáciu kritérií vybudovaných na základe navrhovanej funkcie s maximálnou hodnotou indexu je potrebné študovať jej rozdelenie tak pri nulovej hypotéze, ako aj pri alternatívach, vrátane konvergujúcich. Je tiež zaujímavé preniesť vyvinuté metódy a zovšeobecniť získané výsledky do iných pravdepodobnostných schém iných ako sú zovšeobecnené schémy prideľovania. Ak //1,/ 2,-.. sú frekvencie vzdialeností medzi číslami výsledku 0 v binomickej schéme s pravdepodobnosťou výsledkov рї 1 -POj, potom možno ukázať, že v tomto prípade sa dokázalo v /26 /, z toho vyplýva, že distribúcia (3.3) vo všeobecnosti nemôže byť reprezentovaná vo všeobecnom prípade ako spoločné rozdelenie hodnôt z v žiadnej zovšeobecnenej schéme umiestňovania častíc do buniek. Toto rozdelenie je špeciálnym prípadom rozdelenia na množine kombinatorických objektov zavedených v /12/. Preniesť výsledky dizertačnej práce pre zovšeobecnené nákresy do tohto prípadu, o ktorom sa hovorilo v /52/, sa javí ako naliehavá úloha.

Načítava...