ecosmak.ru

Comportamentul asimptotic al funcțiilor. compararea funcţiilor infinitezimale

După cum se notează în secțiunea anterioară, studiul algoritmilor clasici în multe cazuri poate fi realizat folosind metode asimptotice de statistică matematică, în special, folosind CLT și metodele de moștenire de convergență. Separarea statisticii matematice clasice de nevoile cercetării aplicate s-a manifestat, în special, prin faptul că monografiilor populare le lipsește aparatul matematic necesar, în special, pentru studiul statisticii cu două eșantioane. Concluzia este că trebuie să mergeți la limită nu cu un parametru, ci cu doi - volumele a două mostre. A trebuit să dezvolt o teorie adecvată - teoria moștenirii convergenței, expusă în monografia noastră.

Cu toate acestea, rezultatele unui astfel de studiu vor trebui aplicate cu dimensiuni finite ale eșantionului. Există o mulțime de probleme asociate cu o astfel de tranziție. Unele dintre ele au fost discutate în legătură cu studiul proprietăților statisticilor construite din eșantioane din distribuții specifice.

Cu toate acestea, atunci când se discută influența abaterilor de la ipotezele inițiale asupra proprietăților procedurilor statistice, apar probleme suplimentare. Ce abateri sunt considerate tipice? Ar trebui să se concentreze pe cele mai „dăunătoare” abateri care distorsionează în cea mai mare măsură proprietățile algoritmilor sau ar trebui să se concentreze pe abaterile „tipice”?

Cu prima abordare, obținem un rezultat garantat, dar „prețul” acestui rezultat poate fi inutil de mare. Ca exemplu, indicăm inegalitatea universală Berry-Esseen pentru eroarea din CLT. Subliniază pe bună dreptate A.A. Borovkov că „rata de convergență în problemele reale, de regulă, se dovedește a fi mai bună”.

În a doua abordare, se pune întrebarea care abateri sunt considerate „tipice”. Puteți încerca să răspundeți la această întrebare analizând matrice mari de date reale. Este destul de firesc ca răspunsurile diferitelor grupuri de cercetare să difere, după cum se vede, de exemplu, din rezultatele prezentate în articol.

Una dintre ideile false este utilizarea în analiza posibilelor abateri numai a oricărei familii parametrice specifice - distribuțiile Weibull-Gnedenko, familia cu trei parametri a distribuțiilor gamma etc. În 1927, acad. Academia de Științe a URSS S.N. Bernstein a discutat despre eroarea metodologică a reducerii tuturor distribuțiilor empirice la o familie Pearson cu patru parametri. Cu toate acestea, metodele parametrice de statistică sunt încă foarte populare, în special în rândul oamenilor de știință aplicați, iar vina pentru această concepție greșită revine în primul rând profesorilor de metode statistice (a se vedea mai jos, precum și articolul).

15. Alegerea unuia dintre multele criterii pentru a testa o anumită ipoteză

În multe cazuri, s-au dezvoltat multe metode pentru a rezolva o problemă practică specifică, iar un specialist în metode de cercetare matematică se confruntă cu problema: care ar trebui să fie oferită unei persoane aplicate pentru analiza unor date specifice?

Ca exemplu, luați în considerare problema verificării omogenității a două eșantioane independente. După cum știți, pentru soluția sa, puteți oferi o mulțime de criterii: Student, Cramer-Welch, Lord, chi-pătrat, Wilcoxon (Mann-Whitney), Van - der - Waerden, Savage, N.V. Smirnov, precum omega- pătrat (Lehmann -Rosenblatt), G.V. Martynova și alții. Pe care să o alegem?

Ideea de „vot” vine în mod firesc în minte: să testăm după mai multe criterii, apoi să decideți „cu majoritate de voturi”. Din punctul de vedere al teoriei statistice, o astfel de procedură duce pur și simplu la construirea unui alt criteriu, care a priori nu este mai bun decât precedentul, dar este mai greu de studiat. Pe de altă parte, dacă soluțiile coincid pentru toate criteriile statistice considerate bazate pe principii diferite, atunci, în conformitate cu conceptul de stabilitate, aceasta crește încrederea în soluția globală obținută.

Există o opinie larg răspândită, mai ales în rândul matematicienilor, falsă și dăunătoare despre necesitatea căutării unor metode, soluții optime etc. Cert este că optimitatea dispare de obicei atunci când există o abatere de la ipotezele inițiale. Astfel, media aritmetică ca estimare a așteptărilor matematice este optimă numai atunci când distribuția inițială este normală, în timp ce o estimare consistentă este întotdeauna, dacă există doar așteptarea matematică. Pe de altă parte, pentru orice metodă arbitrară de estimare sau testare a ipotezelor, se poate formula de obicei conceptul de optimitate în așa fel încât metoda luată în considerare să devină optimă - din acest punct de vedere special ales. Luați, de exemplu, mediana eșantionului ca o estimare a așteptărilor matematice. Este, desigur, optim, deși într-un sens diferit față de media aritmetică (optimă pentru o distribuție normală). Și anume, pentru distribuția Laplace, mediana eșantionului este estimarea de maximă probabilitate, și deci optimă (în sensul specificat în monografie).

Criteriile de omogenitate au fost analizate într-o monografie. Există mai multe abordări naturale pentru compararea criteriilor - bazate pe eficiența relativă asimptotică conform lui Bahadur, Hodges-Lehman, Pitman. Și s-a dovedit că fiecare criteriu este optim cu alternativa corespunzătoare sau o distribuție adecvată pe setul de alternative. În același timp, calculele matematice folosesc de obicei alternativa de schimbare, care este relativ rară în practica analizării datelor statistice reale (în legătură cu criteriul Wilcoxon, această alternativă a fost discutată și criticată de noi în ). Rezultatul este trist - tehnica matematică genială demonstrată în , nu ne permite să dăm recomandări pentru alegerea unui test de omogenitate atunci când analizăm date reale. Cu alte cuvinte, din punctul de vedere al lucrătorului aplicației, i.e. analiza datelor specifice, monografia este inutilă. Strălucită stăpânire a matematicii și mare diligență demonstrată de autorul acestei monografii, din păcate, nu au adus nimic la practică.

Desigur, fiecare statistician care lucrează practic într-un fel sau altul rezolvă singur problema alegerii unui criteriu statistic. Pe baza mai multor considerații metodologice, am optat pentru criteriul de tip omega-pătrat (Lehmann-Rosenblatt) care este consecvent față de orice alternativă. Există însă un sentiment de nemulțumire din cauza validității insuficiente a acestei alegeri.

Definiție. Se numește direcția definită de un vector diferit de zero direcție asimptotică relativ la a doua linie de ordin, dacă orice linia acestei direcții (adică paralelă cu vectorul) fie are cel mult un punct comun cu linia, fie este conținută în această linie.

? Câte puncte comune poate avea o linie de ordinul doi și o linie dreaptă de direcție asimptotică în raport cu această dreaptă?

În teoria generală a liniilor de ordinul doi se demonstrează că dacă

Apoi vectorul diferit de zero ( definește direcția asimptotică în raport cu linia

(criteriu general pentru direcția asimptotică).

Pentru linii de ordinul doi

dacă , atunci nu există direcții asimptotice,

dacă atunci există două direcții asimptotice,

dacă atunci există o singură direcţie asimptotică.

Următoarea lemă se dovedește a fi utilă ( criteriu pentru direcția asimptotică a unei linii de tip parabolic).

Lema . Fie o linie de tip parabolic.

Un vector diferit de zero are o direcție asimptotică

relativ . (5)

(Problemă. Demonstrați lema.)

Definiție. Linia dreaptă de direcție asimptotică se numește asimptotă linii de ordinul doi, dacă această linie fie nu se intersectează cu sau este conținută în ea.

Teorema . Dacă are o direcție asimptotică în raport cu , atunci asimptota paralelă cu vectorul este determinată de ecuație

Completam tabelul.

SARCINI.

1. Găsiți vectorii de direcție asimptotică pentru următoarele linii de ordinul doi:

4 - tip hiperbolic, două direcții asimptotice.

Să folosim criteriul direcției asimptotice:

Are o direcție asimptotică față de linia dată 4 .

Dacă =0, atunci =0, adică zero. Apoi Împărțiți prin Obține ecuație pătratică: , unde t = . Rezolvăm această ecuație pătratică și găsim două soluții: t = 4 și t = 1. Apoi direcțiile asimptotice ale dreptei .

(Pot fi luate în considerare două moduri, deoarece linia este de tip parabolic.)

2. Aflați dacă axele de coordonate au direcții asimptotice față de liniile de ordinul doi:

3. Scrieți ecuația generală a unei linii de ordinul doi pentru care

a) axa absciselor are o direcție asimptotică;

b) Ambele axe de coordonate au direcții asimptotice;

c) axele de coordonate au direcții asimptotice și O este centrul dreptei.

4. Scrieți ecuațiile asimptote pentru drepte:

a) ng w:val="EN-US"/>y=0"> ;

5. Demonstrați că dacă o dreaptă de ordinul doi are două asimptote neparalele, atunci punctul lor de intersecție este centrul acestei drepte.

Notă: Deoarece există două asimptote neparalele, există două direcții asimptotice, atunci , și, prin urmare, linia este centrală.

Scrieți ecuațiile asimptote în vedere generalași un sistem de găsire a centrului. Totul este evident.

6.(#920) Scrieți ecuația unei hiperbole care trece prin punctul A(0, -5) și având asimptotele x - 1 = 0 și 2x - y + 1 = 0.

indicaţie. Utilizați enunțul problemei anterioare.

Teme pentru acasă . , Nr. 915 (c, e, e), Nr. 916 (c, d, e), Nr. 920 (dacă nu ai avut timp);

Pătuțuri de copii;

Silaev, Timoșenko. Sarcini practice prin geometrie,

1 semestru P.67, întrebările 1-8, p.70, întrebările 1-3 (oral).

DIAMETRE DE LINIE DE COMANDA A DOUA.

DIAMETRE CURSATE.

Este dat un sistem de coordonate afin.

Definiție. diametru linia de ordinul doi, conjugată la un vector de direcție neasimptotică în raport cu , este mulțimea punctelor medii ale tuturor coardelor dreptei paralele cu vectorul .

La prelegere s-a dovedit că diametrul este o linie dreaptă și s-a obținut ecuația acestuia

Recomandări: Arătați (pe o elipsă) cum este construită (setați o direcție neasimptotică; trageți [două] linii drepte din această direcție care intersectează linia; găsiți punctele mijlocii ale coardelor tăiate; trageți o linie dreaptă prin punctele mijlocii - aceasta este diametrul).

Discuta:

1. De ce este luat în definirea diametrului un vector de direcție neasimptotică. Dacă nu pot răspunde, atunci cereți-le să construiască un diametru, de exemplu, pentru o parabolă.

2. Are vreo linie de ordinul doi cel puțin un diametru? De ce?

3. La prelegere s-a dovedit că diametrul este o linie dreaptă. Mijlocul cărui coardă este punctul M din figură?


4. Priviți parantezele din ecuația (7). Ce le amintesc?

Concluzie: 1) fiecare centru apartine fiecarui diametru;

2) dacă există o linie dreaptă de centre, atunci există un singur diametru.

5. Care este direcția diametrelor liniilor parabolice? (asimptotic)

Dovada (probabil într-o prelegere).

Fie diametrul d dat de ecuația (7`) să fie conjugat la un vector de direcție neasimptotică. Apoi vectorul său de direcție

(-(), ). Să arătăm că acest vector are o direcție asimptotică. Să folosim criteriul vectorului de direcție asimptotic pentru o linie parabolică (vezi (5)). Înlocuim și ne asigurăm (nu uitați că .

6. Câte diametre are o parabolă? Poziția lor relativă? Câte diametre au restul liniilor parabolice? De ce?

7. Cum se construiește diametrul total al unor perechi de linii de ordinul doi (vezi întrebările 30, 31 de mai jos).

8. Completam tabelul, asigurați-vă că faceți desene.

1. . Scrieți ecuația pentru mulțimea punctelor medii ale tuturor acordurilor paralele cu vectorul

2. Scrieți o ecuație pentru diametrul d care trece prin punctul K(1,-2) pentru linie.

Etape de rezolvare:

1-a cale.

1. Determinați tipul (pentru a ști cum se comportă diametrele acestei linii).

În acest caz, linia este centrală, apoi toate diametrele trec prin centrul C.

2. Compunem ecuația unei drepte care trece prin două puncte K și C. Acesta este diametrul dorit.

a 2-a cale.

1. Scriem ecuația pentru diametrul d sub forma (7`).

2. Înlocuind coordonatele punctului K în această ecuație, găsim relația dintre coordonatele vectorului conjugat cu diametrul d.

3. Setăm acest vector, ținând cont de dependența găsită și compunem ecuația pentru diametrul d.

În această problemă, este mai ușor de calculat în al doilea mod.

3. . Scrieți ecuația pentru diametrul paralel cu axa x.

4. Găsiți mijlocul coardei tăiat de linie

pe linia x + 3y – 12 =0.

Sugestie pentru o decizie: Desigur, puteți găsi punctele de intersecție ale dreptei și liniei date și apoi - mijlocul segmentului rezultat. Dorința de a face acest lucru dispare dacă luăm, de exemplu, o dreaptă cu ecuația x + 3y - 2009 = 0.

ÎN conditii moderne interesul pentru analiza datelor crește constant și intens în domenii complet diferite, cum ar fi biologie, lingvistică, economie și, desigur, IT. Baza acestei analize sunt metodele statistice și fiecare specialist în minerit de date care se respectă trebuie să le înțeleagă.

Din păcate, o literatură foarte bună, astfel încât să poată oferi atât dovezi riguroase din punct de vedere matematic, cât și explicații intuitive ușor de înțeles, nu este foarte comună. Și aceste prelegeri, în opinia mea, sunt neobișnuit de bune pentru matematicienii care înțeleg teoria probabilității tocmai din acest motiv. Aceștia sunt predați masteraților de la Universitatea Germană Christian-Albrecht în programele „Matematică” și „Matematică financiară”. Și pentru cei care sunt interesați de modul în care se predă această materie în străinătate, am tradus aceste prelegeri. Mi-a luat câteva luni să traduc, am diluat prelegerile cu ilustrații, exerciții și note de subsol la unele teoreme. Remarc că nu sunt un traducător profesionist, ci doar un altruist și amator în acest domeniu, așa că voi accepta orice critică dacă este constructivă.

Pe scurt, prelegerile sunt despre:


Așteptarea condiționată

Acest capitol nu se ocupă direct de statistică, însă este un punct de plecare ideal pentru studierea acesteia. Așteptarea condiționată este cea mai bună alegere pentru a prezice un rezultat aleatoriu pe baza informațiilor pe care le aveți deja. Și asta este, de asemenea, întâmplător. Aici sunt luate în considerare diferitele sale proprietăți, cum ar fi liniaritatea, monotonitatea, convergența monotonă și altele.

Bazele estimării punctelor

Cum se evaluează parametrul de distribuție? Care este criteriul pentru asta? Ce metode ar trebui folosite pentru asta? Acest capitol vă permite să răspundeți la toate aceste întrebări. Aici sunt introduse conceptele de estimator imparțial și de estimator uniform imparțial cu varianță minimă. Explică de unde provin distribuția chi-pătrat și distribuția Student și de ce sunt importante în estimarea parametrilor unei distribuții normale. Se spune care sunt inegalitatea lui Rao-Kramer și informațiile lui Fisher. Este introdus și conceptul de familie exponențială, ceea ce face de multe ori mai ușor obținerea unei estimări bune.

Estimarea parametrilor Bayesian și Minimax

O abordare filosofică diferită a evaluării este descrisă aici. În acest caz, parametrul este considerat necunoscut deoarece este o realizare a unei variabile aleatoare cu o distribuție cunoscută (a priori). Observând rezultatul experimentului, calculăm așa-numita distribuție posterioară a parametrului. Pe baza acesteia, putem obține o estimare bayesiană, unde criteriul este pierderea minimă în medie, sau o estimare minimax, care minimizează pierderea maximă posibilă.

Suficiență și completitudine

Acest capitol are o importanță practică serioasă. O statistică suficientă este o funcție a eșantionului, astfel încât este suficient să stocați doar rezultatul acestei funcții pentru a estima parametrul. Există multe astfel de funcții, iar printre ele se numără așa-numitele statistici minime suficiente. De exemplu, pentru a estima mediana unei distribuții normale, este suficient să stocați un singur număr - media aritmetică pentru întregul eșantion. Funcționează și pentru alte distribuții, cum ar fi distribuția Cauchy? Cum ajută statisticile suficiente în alegerea estimărilor? Aici puteți găsi răspunsuri la aceste întrebări.

Proprietățile asimptotice ale estimărilor

Poate cea mai importantă și necesară proprietate a unei estimări este consistența acesteia, adică tendința către parametrul adevărat cu creșterea dimensiunii eșantionului. Acest capitol descrie proprietățile estimărilor cunoscute nouă, obținute prin metodele statistice descrise în capitolele precedente. Sunt introduse conceptele de imparțialitate asimptotică, eficiență asimptotică și distanță Kullback-Leibler.

Bazele testării

Pe lângă întrebarea cum să evaluăm un parametru necunoscut pentru noi, trebuie să verificăm cumva dacă îndeplinește proprietățile cerute. De exemplu, se desfășoară un experiment în care este testat un nou medicament. De unde știi dacă ai mai multe șanse să te faci bine cu ea decât cu medicamentele mai vechi? Acest capitol explică modul în care sunt construite astfel de teste. Veți afla care este cel mai puternic test uniform, testul Neyman-Pearson, nivelul de semnificație, intervalul de încredere și, de asemenea, de unde provin testul Gaussian și testul t.

Proprietățile asimptotice ale criteriilor

La fel ca estimările, criteriile trebuie să satisfacă anumite proprietăți asimptotice. Uneori pot apărea situații când este imposibil să construim criteriul cerut, totuși, folosind binecunoscuta teoremă centrală a limitei, construim un criteriu care tinde asimptotic către cel necesar. Aici veți afla care este nivelul de semnificație asimptotică, metoda raportului de probabilitate și cum sunt construite testul Bartlett și testul de independență chi-pătrat.

Model liniar

Acest capitol poate fi considerat ca o completare, și anume, aplicarea statisticilor în cazul regresiei liniare. Veți înțelege ce note sunt bune și în ce condiții. Veți afla de unde a venit metoda celor mai mici pătrate, cum să construiți criterii și de ce aveți nevoie de o distribuție F.

Comportamentul asimptotic (sau comportamentul asimptotic) al unei funcții în vecinătatea unui anumit punct a (finit sau infinit) este înțeles ca natura modificării funcției, deoarece argumentul ei x tinde către acest punct. Ei încearcă de obicei să reprezinte acest comportament cu ajutorul unei alte funcții, mai simple și mai studiate, care, în vecinătatea punctului a, descrie cu suficientă acuratețe modificarea funcției care ne interesează sau evaluează comportamentul acesteia dintr-o parte sau o alta. În legătură cu aceasta, se pune problema comparării naturii modificării a două funcții în vecinătatea punctului a, care este legată de luarea în considerare a coeficientului lor. De un interes deosebit sunt cazurile în care ambele funcții sunt fie infinit de mici (in.m.) fie infinit de mari (in.b.) pentru x și a. 10.1. Compararea funcţiilor infinitezimale Scopul principal al comparaţiei b.m. funcțiile constă în compararea naturii abordării lor la zero la x a, sau a ratei tendinței lor spre zero. Lasă b.m. pentru x a funcțiile a(x) și P(x) sunt nenule într-o vecinătate perforată (a) a punctului a, în timp ce în punctul a sunt egale cu zero sau nedefinite. Definiția 10.1. Funcțiile a(x) și 0(x) se numesc b.m. de aceeași ordine pentru a și scrieți og (a:) = în O (/? («)) (simbolul O scrie „O mare”), dacă pentru x a există o limită finită diferită de zero a raportului a ( x) / /? ( i), adică este evident că atunci, conform (7.24), Zm € R \ (0), iar notația X ^ a0 [a (x)) este legală. Simbolul O are proprietatea tranzitivității, adică dacă - într-adevăr, ținând cont de Definiția 10.1 și de proprietatea produsului funcțiilor (vezi (7.23)), care au limite finite (în acest caz, nu egale cu zero), obținem COMPORTAMENTUL ASIMPTOTIC AL FUNCȚIILE. Comparația funcțiilor infinitezimale. Definiția 10.2. Funcția a(x) pe care o numesc b.m. de ordin mai mare al micșorării în comparație cu (3 (x) (sau relativ la / 3 (x)) pentru x a și scrieți) simbolul o se citește io mic dacă limita relației a există și este egală cu zero. În acest caz, se spune că și funcția este un bm de ordinul micșorului mai mic decât a(x) pentru x a, iar cuvântul de micime este de obicei omis (ca în cazul unui ordin superior în Definiția 10.2.) Aceasta înseamnă că dacă lim (atunci funcția /)(x) este, conform definiției 10.2, f.m. de ordin mai mare în comparație cu a(x) pentru x a și a(x) este b.m. de ordin mai mic decât /3(x) pentru x a, deoarece în acest caz lijTi (fi(x)/ot(x)) . Deci putem scrie Conform teoremei 7.3 despre legătura dintre o funcție, limita ei și b.m. functie din (10.3) rezulta ca ot) este o functie, b.m. la. Prin urmare a(x), adică valorile |a(h)| pentru x aproape de a, multe mai putine valori\0(x)\. Cu alte cuvinte, funcția a(x) tinde spre zero functie mai rapida/?(X). Teorema 10.1. Produsul oricărui b.m. pentru x a funcțiile a(x) și P(x)) care sunt nenule într-o vecinătate perforată a punctului a, există b.m. o funcţie de ordin superior în comparaţie cu fiecare dintre factori. Într-adevăr, conform definiției 10.2 b.m. de ordin superior (ținând cont de Definiția 7.10 din b.m. a funcției), egalitățile înseamnă validitatea aserției teoremei. Egalitățile care conțin simbolurile O și o sunt uneori numite estimări asimptotice. Definiția 10.3. Funcțiile ot(x) și /3(x) se numesc incomparabile b.m. pentru x -¥ a, dacă nu există nici o limită finită, nici infinită a raportului lor, i.e. dacă $ lim a(x)/0(x) (p £ este la fel ca $ lim 0(x)/a(x)). Exemplul 10.1. A. Funcțiile a(x) = x și f(x) = sin2ar, în virtutea Definiției 10.1, sunt b.m. de același ordin la x 0, deoarece ținând cont de (b. Funcția a (x) \u003d 1 - coss, prin definiție 10.2, - b. m. de ordin superior în comparație cu 0 (x) \u003d x la x 0, întrucât ținând cont de c. Funcția a(s) = \/x este un bm de ordin inferior față de fl(x) = x pentru x 0, deoarece r. Funcțiile a(s) = x conform definiției 10.3 sunt bm incomparabile la x 0, deoarece nu există limită (nici finită, nici infinită - vezi exemplul 7.5). x a b.m. de ordin superior în comparație cu xn~1) adică. yapa \u003d ao (a: n "* 1), deoarece lim (xL / xn" 1) \u003d Dacă este necesar, mai precis caracteristici comparative comportament b.m. funcțiile la x - și unul dintre ele este ales ca un fel de standard și l-a numit principal. Desigur, alegerea principalului b.m. într-o anumită măsură arbitrare (încearcă să aleagă mai simplu: x pentru x - * 0; x-1 pentru x -41; 1 / x pentru x -\u003e oo etc.). De la gradele 0k(x) principalul b.m. funcțiile f)(x) cu exponenți diferiți k > 0 (când k ^ 0 0k(x) nu este un f.m.) constituie o traversă de comparație pentru estimarea unui f.m mai complex. funcțiile a(z). Definiție 10.4. Funcția a(z) se numește b.m. k-al-lea ordin de micime în raport cu (3(x) pentru x a, iar numărul k este de ordinul de micime dacă funcțiile a(z) și /3k(x) sunt b.m. de același ordin pentru x a), adică. dacă Cuvântul „mic” este de obicei omis și în acest caz. Notă: 1) ordinea k a unei funcții b.m. față de alta poate fi orice număr pozitiv; 2) dacă ordinea funcției a(x) relativ la / 3(x) este egal cu k, atunci ordinea funcției P(x) față de a(x) este egală cu 1/k, 3) nu este întotdeauna posibil să se indice o anumită ordine a lui k pentru bm funcția a(x), chiar dacă este comparabilă cu toate puterile lui /?*(x) Exemplul 10.2.a. Funcția cosx, conform definiției 10.4, este b.m. de ordinul k = 2 față de 0(x) = x la x 0, deoarece luând în considerare b. Luați în considerare funcțiile.Vom arăta că pentru orice Într-adevăr, conform ( 7.32).Astfel, funcția a1/1 este comparabilă cu xk pentru orice k > 0 pentru x -> 0, dar nu se poate indica pentru această funcție ordinea micii față de x. față de celălalt nu este întotdeauna ușor.Putem recomanda următoarea procedură: 1) scrieți sub semnul limită raportul a(x ) / 0k(x)\ 2) analizați raportul scris și încercați să îl simplificați;valoarea lui k) la care va exista o limită finită diferită de zero; 4) verificați ipoteza prin calcularea limitei. Exemplul 10.3. Să determinăm ordinea b.m. funcţiile tgx - sin x faţă de x la x -» 0, adică. să găsim un număr k > 0 astfel încât să avem un COMPORTAMENT ASIMPTOTIC al funcțiilor. Comparația funcțiilor infinitezimale. În această etapă, știind că la x 0, conform (7.35) și (7.36), (sinx)/x 1 și cosx -> 1, și ținând cont de (7.23) și (7.33), putem determina acea condiție ( 10.7) se va îndeplini pentru k = 3. Într-adevăr, un calcul direct al limitei pentru k = 3 dă valoarea A = 1/2: Rețineți că pentru k > 3 obținem o limită infinită, iar pentru , limita va fi egal cu zero.

480 de ruble. | 150 UAH | 7,5 USD ", MOUSEOFF, FGCOLOR, "#FFFFCC",BGCOLOR, "#393939");" onMouseOut="return nd();"> Teză - 480 de ruble, transport 10 minute 24 de ore pe zi, șapte zile pe săptămână și de sărbători

Kolodzei Alexandru Vladimirovici Proprietățile asimptotice ale criteriilor de bunătate de potrivire pentru testarea ipotezelor într-o schemă de selecție fără înlocuire, bazată pe umplerea celulelor într-o schemă de alocare generalizată: disertație ... candidat la științe fizice și matematice: 01.01.05.- Moscova, 2006 .- 110 p.: ill. RSL OD, 61 07-1/496

Introducere

1 Entropia și distanța informațională 36

1.1 Definiții și simboluri de bază 36

1.2 Entropia distribuțiilor discrete cu așteptări limitate 39

1.3 Metrica logaritmică generalizată pe o mulțime de distribuții discrete 43

1.4 Compactitatea funcțiilor unui set numărabil de argumente. 46

1.5 Continuitatea distanței informaționale Kullback-Leibler-Sanov 49

1.6 Concluzii 67

2 Probabilități mari de abatere 68

2.1 Probabilități de abateri mari ale funcțiilor de la numărul de celule cu o umplere dată 68

2.1.1 Teorema limitei locale 68

2.1.2 Teorema limitei integrale 70

2.1.3 Distanța informațiilor și probabilitățile de abatere mare ale statisticilor separabile 75

2.2 Probabilități mari de abatere ale statisticilor separabile care nu satisfac condiția Cramer 81

2.3 Concluzii 90

3 Proprietățile asimptotice ale testelor de bunăstare a potrivirii 92

3.1 Criterii de acceptare pentru schema de selecție fără returnare. 92

3.2 Eficiența relativă asimptotică a testelor de bunătate a potrivirii 94

3.3 Criterii bazate pe numărul de celule din machetele generalizate 95

3.4 Concluzii 98

Concluzia 99

Literatura 103

Introducere în muncă

Obiectul cercetării și relevanța temei. În teoria analizei statistice a secvențelor discrete, un loc special îl ocupă testele de bunătate pentru testarea ipotezei nule posibil complexe, care este aceea pentru o secvență aleatorie pQ)?=i astfel încât

Хі Є Ім,і= 1,...,n, Ім = (o, i,..., M), pentru orice і = 1,..., n, iar pentru orice k Є їм probabilitatea evenimentul (Хі = k) nu depinde de r. Aceasta înseamnă că șirul (Xi)f = 1 este într-un anumit sens staționar.

Într-un număr sarcini aplicate ca o secvență (Х() =1 luăm în considerare șirul de culori de bile atunci când alegem fără a reveni la epuizare din urna care conține rik - 1 > 0 bile de culoare k, k .,pd/ - 1) Fie urna să conțină n - 1 bile, m n-l= (n fc -l).

Notați cu r(k) _ r(fc) r(fc) succesiunea numerelor de bile de culoare k din eșantion. Luați în considerare șirul h" = (^,...,)). M fc) =ri fc) , ^ = ^-^ = 2,...,^-1, _ (fc)

Secvența h^ este definită prin intermediul distanțelor dintre locurile bilelor adiacente de culoare k în așa fel încât *Ф = n.

Setul de secvențe h(fc) pentru toate k Є їm determină în mod unic succesiunea succesiunea de culori a bilelor este determinată în mod unic de succesiunea h() a distanțelor dintre locurile bile învecinate de aceeași culoare fixă. Fie o urnă care conțin n - 1 bile de două culori diferite conțin N - 1 bile de culoare 0. Se poate stabili o corespondență unu-la-unu între mulțimea M(N-l,n - N) și o mulțime de 9 \ Nі m vectori h( n, N) = (hi,..., /i#) cu componente întregi pozitive astfel încât

Mulțimea 9\n,m corespunde mulțimii tuturor partițiilor distincte ale unui întreg pozitiv n în N sume ordonate.

După ce am dat o distribuție de probabilitate pe mulțimea de vectori 9H n g, obținem distribuția de probabilitate corespunzătoare pe mulțimea Wl(N - l,n - N). Mulțimea Y\n,s este o submulțime a mulțimii 2J n ,iv de vectori cu componente întregi nenegative care satisfac (0.1). Ca distribuții de probabilitate pe mulțimea vectorilor JZ p d în lucrarea de disertație, distribuții de formă

P(x, N) = (r t..., r N)) = P(& = rn, u = 1,..., N\ & = n), (0.2) unde 6 > , n - independent variabile aleatoare întregi nenegative.

Distribuțiile de forma (0,2) în /24/ au fost numite scheme generalizate pentru plasarea n particule în N celule. În special, dacă variabilele aleatoare h..., n în (0.2) sunt distribuite conform legilor Poisson cu parametrii Ai,...,Alg, respectiv, atunci vectorul h(n,N) are o distribuție polinomială cu probabilitățile de rezultate

Pu \u003d m--~t~\u003e ^ \u003d 1,---, ^-

Li + ... + l^

Dacă variabilele aleatoare i> >&v din (0.2) sunt distribuite egal conform legii geometrice V(Zi = k)= P k - 1 (l-p),k=l,2,..., unde p este oricare în intervalul 0

După cum sa menționat în /14/,/38/, un loc special în testarea ipotezelor despre distribuția vectorilor de frecvență h(n, N) = (hi,..., h^) în schemele generalizate pentru plasarea n particule în N celule este ocupat de criterii construite pe baza statisticilor formei

Фк "%,%..;$, (0.4) unde /j/, v = 1,2,... și φ sunt câteva funcții cu valoare reală,

Mg \u003d E 1 (K \u003d g), g \u003d 0,1, .... 1 / \u003d 1

Cantitățile //r din /27/ au fost numite numărul de celule care conțineau exact r particule.

Statisticile de forma (0,3) în /30/ se numesc statistici separabile (separabile aditiv). Dacă funcțiile /„ din (0.3) nu depind de u, atunci astfel de statistici au fost numite în /31/ statistici separabile simetrice.

Pentru orice r, statistica fx r este o statistică simetrică separabilă. Din egalitate

DM = DFg (0,5) rezultă că clasa statisticilor separabile simetrice din h u coincide cu clasa funcțiilor liniare din fi r . Mai mult, clasa funcțiilor de forma (0.4) este mai largă decât clasa statisticilor separabile simetrice.

H 0 = (R0(n, L0) este o succesiune de ipoteze nule simple că distribuția vectorului h(n, N) este (0,2), unde variabilele aleatoare i,..., n și (0,2) sunt distribuiți identic și P(ti = k)=p k ,k = 0,l,2,..., parametrii n, N se modifică în regiunea centrală.

Luați în considerare unele РЄ (0,1) și o succesiune de alternative complexe, în general vorbind, n = (H(n,N)) astfel încât să existe un n

P(Fm > OpAR)) >: 0-Vom respinge ipoteza Hq(ti,N) dacă fm > a w m((3). Dacă există o limită jim ~1nP(0lg > a n, N (P)) = Sh ), unde probabilitatea pentru fiecare N este calculată sub ipoteza #o(n,iV), atunci valoarea j (fi,lcl) se numește în /38/ indicele de criteriu φ în punctul (/?,Н) . Ultima limită poate, în general, să nu existe. Așadar, în lucrarea de disertație, pe lângă indicele de criterii, se ia în considerare valoarea lim (_IlnP(tor > a N (J3))) =іф(Р,П), care, prin analogie, a fost numită de autorul lucrarea de disertație indicele inferior al criteriului f la punctul (/3,Н) . Aici și mai jos, lim adg, lim a# jV-yuo LG-yuo înseamnă, respectiv, limitele inferioare și superioare ale secvenței (odr) ca N -> syu,

Dacă există un index de criteriu, atunci indicele criteriului se potrivește cu acesta. Indicele criteriului există întotdeauna. Cum mai multă valoare indice de criteriu (indice de criteriu mai mic), cu atât este mai bun criteriul statistic în sensul considerat. În /38/ problema construirii criteriilor de bunăstare a potrivirii pentru layout-uri generalizate cu cea mai mare valoare indice de criteriu din clasa criteriilor care resping ipoteza Ho(n, N) pentru unde m > 0 este ceva număr fix, secvența de constante de ex. este selectată pe baza valorii date a puterii criteriului cu o secvență de alternative, ft este o funcție reală a m + 1 argumente.

Indicii criterii sunt determinați de probabilitățile de abateri mari. După cum sa arătat în /38/, asimptoticele brute (până la echivalența logaritmică) ale probabilităților de abateri mari ale statisticilor separabile atunci când condiția Cramer pentru variabila aleatoare /() este îndeplinită este determinată de informațiile corespunzătoare Kullback-Leibler-Sanov distanta (variabila aleatoare μ satisface conditia Cramer, daca pentru ceva # > 0 functia generatoare de moment Me f7? este finita in intervalul \t\

Problema probabilităților abaterilor mari ale statisticilor de la un număr nemărginit fi r , precum și a statisticilor separabile arbitrare care nu satisfac condiția Cramer, a rămas deschisă. Acest lucru nu a permis rezolvarea definitivă a problemei construirii criteriilor de testare a ipotezelor în scheme de alocare generalizate cu cea mai mare rată de convergență la zero pentru probabilitatea unei erori de primul fel în cazul alternativelor convergente din clasa criteriilor. pe baza statisticilor de forma (0,4). Relevanța cercetării disertației este determinată de necesitatea completării soluției acestei probleme.

Scopul lucrării de disertație este de a construi criterii de bunătate de potrivire cu cea mai mare valoare a indicelui criteriului (indicele inferior al criteriului) pentru testarea ipotezelor în schema de selecție fără a reveni în clasa criteriilor care resping ipoteza W( n, N) la 0(iv"iv"-""" o """)>CiV "(0" 7) unde φ este o funcție a unui număr numărabil de argumente, iar parametrii n, N se modifică în regiune.

În conformitate cu scopul studiului, au fost stabilite următoarele sarcini: să investigheze proprietățile entropiei și distanța informațională Kullback - Leibler - Sanov pentru distribuții discrete cu un număr numărabil de rezultate; studiați probabilitățile de abateri mari ale statisticilor de forma (0,4); studiați probabilitățile de abateri mari ale statisticilor separabile simetrice (0,3) care nu satisfac condiția Cramer; - găsiți o astfel de statistică încât criteriul acordului construit pe baza sa pentru testarea ipotezelor în scheme de alocare generalizată să aibă cea mai mare valoare a indicelui din clasa criteriilor de forma (0,7).

Noutate științifică: este dat conceptul de metrică generalizată - o funcție care admite valori infinite și satisface axiomele identității, simetriei și inegalității triunghiulare. Se găsește o metrică generalizată și se indică seturi pe care funcțiile de entropie și distanță de informații, date pe o familie de distribuții discrete cu un număr numărabil de rezultate, sunt continue în această metrică; în schema de alocare generalizată, se găsește o asimptotică grosieră (până la echivalență logaritmică) pentru probabilitățile de abateri mari ale statisticilor de forma (0,4) care satisfac forma corespunzătoare a condiției lui Cramer; în schema de alocare generalizată, se găsește o asimptotică grosieră (până la echivalență logaritmică) pentru probabilitățile de abateri mari ale statisticilor separabile simetrice care nu satisfac condiția Cramer; în clasa criteriilor de forma (0,7) se construiește un criteriu cu cea mai mare valoare a indicelui criteriului.

Valoare științifică și practică. În lucrare, sunt rezolvate o serie de întrebări despre comportamentul probabilităților mari de abatere în schemele de alocare generalizate. Rezultatele obţinute pot fi utilizate în proces educațional la specialitățile de statistică matematică și teoria informației, în studiul procedeelor ​​statistice de analiză a secvențelor discrete și au fost utilizate în /3/, /21/ la justificarea securității unei clase de sisteme informaționale. Propuneri de apărat: reducerea problemei verificării, folosind o singură secvență de culori de bile, ipoteza că această secvență a fost obținută ca urmare a unei alegeri fără înlocuire până la epuizarea bilelor din urna care conține bile de două culori, și fiecare astfel de alegere are aceeași probabilitate, la construirea criteriilor de bunătate pentru a testa ipotezele în structura generalizată corespunzătoare; continuitatea entropiei Kullback-Leibler-Sanov și a funcțiilor de distanță informațională pe un simplex infinit-dimensional cu metrica generalizată logaritmică introdusă; o teoremă asupra asimptoticii brute (până la echivalența logaritmică) a probabilităților de abateri mari ale statisticilor separabile simetrice care nu satisfac condiția Cramer în schema de alocare generalizată în cazul șapte exionențial; o teoremă asupra asimptoticii brute (până la echivalența logaritmică) a probabilităților de abateri mari pentru statisticile de forma (0,4); - construirea unui criteriu de acord pentru testarea ipotezelor în scheme de alocare generalizate cu cea mai mare valoare a indicelui din clasa criteriilor de forma (0,7).

Aprobarea lucrării. Rezultatele au fost raportate la seminariile Departamentului de Matematică Discreta a Institutului de Matematică. V. A. Steklov RAS, Departamentul de Securitate Informațională ITMiVT le. S. A. Lebedev RAS și la: cel de-al cincilea Simpozion rusesc de matematică aplicată și industrială. Sesiunea de primăvară, Kislovodsk, 2 - 8 mai 2004; a șasea conferință internațională de la Petrozavodsk „Metode probabilistice în matematică discretă” 10 - 16 iunie 2004; al doilea Conferinta Internationala„Sisteme și tehnologii informaționale (IST” 2004)”, Minsk, 8 - 10 noiembrie 2004;

Conferința internațională „Modern Problems and new Trends in Probability Theory”, Cernăuți, Ucraina, 19 - 26 iunie 2005.

Principalele rezultate ale lucrării au fost utilizate în lucrarea de cercetare „Apologia”, realizată de ITMiVT RAS. S. A. Lebedev în interesul Serviciului Federal de Control Tehnic și Export al Federației Ruse și au fost incluse în raportul privind implementarea etapei de cercetare /21/. Rezultate separate ale disertației au fost incluse în raportul de cercetare „Dezvoltarea problemelor matematice ale criptografiei” al Academiei de Criptografie a Federației Ruse pentru 2004 /22/.

Autorul își exprimă profunda recunoștință consilierului științific, doctor în științe fizice și matematice Ronzhin A.F. și consultant științific, doctor în științe fizice și matematice, cercetător principal Knyazev A.V. Științe matematice I. A. Kruglov pentru atenția acordată lucrării și o serie de valoroase remarci.

Structura și conținutul lucrării.

Primul capitol investighează proprietățile entropiei și ale distanței informaționale pentru distribuțiile pe mulțimea numerelor întregi nenegative.

În primul paragraf al primului capitol se introduce notația și se dau definițiile necesare. În special, sunt folosite urmatoarea notatie: x = (:ro,i, ---) - un vector de dimensiuni infinite cu un număr numărabil de componente;

H(x) - -Ex^oXvlnx,; trunc m (x) = (x 0 ,x 1 ,...,x t,0,0,...); SI* = (x, x u > 0, u = 0,1,..., E~ o xn 0,v = 0,l,...,E? =Q x v = 1); fi 7 \u003d (x Є O, L 0 vx v \u003d 7); %] = (хЄП, Ео»х și

16 mі = e o ** v \ &c = Ue>1 | 5 є Q 7) o

Este clar că mulțimea Vt corespunde familiei distribuțiilor de probabilitate pe mulțimea numerelor întregi nenegative, P 7 - familiei distribuțiilor de probabilitate pe mulțimea numerelor întregi nenegative cu așteptare matematică

Оє(у) - (х eO,x v

În al doilea paragraf al primului capitol, demonstrăm o teoremă privind mărginirea entropiei distribuțiilor discrete cu așteptări matematice mărginite.

Teorema 1. Despre mărginirea entropiei distribuțiilor discrete cu așteptare matematică mărginită. Pentru orice wbp 7

Dacă x Є fi 7 corespunde unei distribuţii geometrice cu predicţie matematică 7 ; acesta este

7xn = (1-p)p\ v = 0,1,..., unde p = --,

1 + 7 atunci egalitatea H(x) = F(1) este valabilă.

Afirmația teoremei poate fi privită ca rezultatul unei aplicări formale a metodei multiplicatorilor condiționali Lagrange în cazul unui număr infinit de variabile. Teorema că singura distribuție pe mulțime (k, k + 1, k + 2,...) cu o așteptare matematică dată și entropie maximă este o distribuție geometrică cu o așteptare matematică dată este dată (fără demonstrație) în /47 /. Autorul a dat însă o dovadă riguroasă.

În al treilea paragraf al primului capitol este dată o definiție a unei metrici generalizate - o metrică care admite valori infinite.

Pentru x, y Є Гі, funcția p(x, y) este definită ca minim є > 0 cu proprietatea y v e~ e

Dacă nu există un astfel de є, atunci se presupune că p(x, y) = oo.

Se dovedește că funcția p(x, y) este o metrică generalizată asupra familiei de distribuții pe mulțimea numerelor întregi nenegative, precum și pe întreaga mulțime Ci*. În loc de e în definiția metricii p(x, y), puteți utiliza orice alt număr pozitiv, altul decât 1. Valorile rezultate vor diferi printr-o constantă multiplicativă. Notați cu J(x, y) distanța informațională

Aici și mai jos se presupune că 0 In 0 = 0,01n ^ = 0. Distanța informațională este definită pentru astfel de x, y, că x v - 0 pentru toate și astfel încât y v = 0. Dacă această condiție nu este îndeplinită, atunci vom va presupune J (S,y) = co. Fie A C $1. Apoi vom nota J(Ay)="mU(x,y).

Fie J(Jb,y) = 00.

În al patrulea paragraf al primului capitol este dată o definiție pentru compactitatea funcțiilor definite pe mulțimea Π*. Compactitatea unei funcții cu un număr numărabil de argumente înseamnă că, cu orice grad de precizie, valoarea funcției poate fi aproximată cu valorile acestei funcții în punctele în care doar un număr finit de argumente este diferit de zero. Se dovedește compactitatea funcțiilor de entropie și distanță informațională.

Pentru orice 0

Dacă, pentru oarecare 0 0, funcţia \(x) = J(x, p) este compactă pe mulţimea ^ 7 ] P 0 r (p).

În al cincilea paragraf al primului capitol sunt luate în considerare proprietățile distanței informaționale date pe un spațiu infinit-dimensional. Față de cazul finit-dimensional, situația cu continuitatea funcției de distanță informațională se modifică calitativ. Se arată că funcția distanță informațională nu este continuă pe mulțimea Г2 în niciuna dintre metricile pi(,y)= E|z„-i/„|, (

00 \ 2 p 2 (x, y) = sup (x^-ij^.

Se demonstrează validitatea următoarelor inegalități pentru funcțiile de entropie H(x) și distanța informațională J(x,p):

1. Pentru orice x, x "Є fi \ H (x) - H (x") \

2. Dacă pentru unele x, p є P există є > 0 astfel încât x є O є (p), atunci pentru orice X i Є Q \J(x,p) - J(x",p)\

Din aceste inegalități, ținând cont de Teorema 1, rezultă că funcțiile de entropie și distanță de informație sunt uniform continue pe submulțimile corespunzătoare fi din metrica p(x,y), și anume,

Pentru orice 7 astfel încât 0

Dacă pentru vreo 70, 0

20 atunci pentru orice 0 0 funcția \p(x) = J(x t p) este uniform continuă pe mulțimea П 7 ] П О є (р) în metrica р(х,у).

Este dată definiția non-extremității unei funcții. Condiția de non-extremalitate înseamnă că funcția nu are extreme locale, sau funcția ia aceleași valori în minime locale (maxime locale). Condiția de non-extremalitate slăbește cerința că nu există extreme locale. De exemplu, funcția sin x pe mulțimea numerelor reale are extreme locale, dar satisface condiția de non-extremalitate.

Fie pentru vreo 7 > 0, aria A este dată de condiția

А = (хЄЇ1 1 ,Ф(х) >а), (0.9) unde Ф(х) este o funcție cu valoare reală, a este o constantă reală, inf Ф(х)

Și 3y, a apărut întrebarea, în ce condiții „a f „ f cu u_ „ parametrii n, N în regiunea centrală, ^ -> 7, pentru toate valorile suficient de mari ale acestora există astfel de numere întregi nenegative ko, k \, ..., k n, care este ko + hi + ... + k n = N,

21 k\ + 2/... + nk n - N

Kq k \ k n . ^"iv"-"iv" 0 " 0 "-")>a -

Se dovedește că pentru aceasta este suficient să se ceară ca funcția φ să fie neextremă, compactă și continuă în metrica p(x, y), și, de asemenea, că pentru cel puțin un punct x satisface (0,9), pentru unele є > 0 există un moment finit de gradul 1 + є Ml + = і 1+є x și 0 pentru orice u = 0,1,....

În al doilea capitol, studiem asimptoticele aproximative (până la echivalența logaritmică) ale probabilității abaterilor mari ale funcțiilor de la D = (fio,..., n, 0,...) - numărul de celule cu un anumit completarea regiunii centrale a parametrilor N,n . Asimptotica aproximativă a probabilităților de abateri mari este suficientă pentru a studia indicii testelor de bunătate de potrivire.

Fie variabilele aleatoare ^ din (0.2) să fie distribuite identic și

Р(Сі = k)=р b k = 0,1,... > P(z) - funcția generatoare a variabilei aleatoare i - converge într-un cerc cu raza 1

22 Se notează p(.) = (p(ad = o), Pn) = i),...).

Dacă există o soluţie z 1 a ecuaţiei

M(*) = 7, atunci este unic /38/. Peste tot mai jos vom presupune că Pjfc>0,fc = 0,l,....

În primul paragraf al primului paragraf al celui de-al doilea capitol, există o asimptotică a logaritmilor probabilităților formei

Se demonstrează următoarea teoremă.

Teorema 2. O teoremă locală aproximativă asupra probabilităților de abateri mari. Fie n, N - * w astfel încât - -> 7> 0

Enunțul teoremei rezultă direct din formula pentru distribuția comună /to, A*b / în /26/ și următoarea estimare: dacă valorile întregi nenegative fii,fi2,/ satisfac condiția /І1 + 2 // 2 + ... + 71/ = 71, atunci numărul de valori diferite de zero dintre ele este 0(l/n). Aceasta este o estimare aproximativă care nu pretinde a fi nouă. Numărul de r diferit de zero în machetele generalizate nu depășește valoarea maximă de umplere a celulelor, care în regiunea centrală cu o probabilitate care tinde spre 1 nu depășește valoarea 0(\np) /25/,/27/ . Cu toate acestea, estimarea rezultată 0(y/n) este satisfăcută cu probabilitatea 1 și este suficientă pentru a obține o asimptotică brută.

În al doilea paragraf al primului paragraf al celui de-al doilea capitol, valoarea limitei se găsește unde adz este o succesiune de numere reale convergente către unele a Є R, φ(x) este o funcție cu valoare reală. Se demonstrează următoarea teoremă.

Teorema 3. O teoremă integrală brută asupra probabilităților abaterilor mari. Fie îndeplinite condițiile teoremei 2, pentru unele r > 0, (> 0 funcția reală φ(x) este compactă, uniform continuă în metricul p pe mulțime

A = 0 rH (p(r 1))np n] şi satisface condiţia de neextremalitate pe mulţimea r2 7 . Dacă pentru o constantă a astfel încât inf φ(x)

24 există un vector p a fi 7 P 0 r (p(z 7)) ; astfel încât

Ф(pа) > a J(( (x) >а,хЄ П 7 ),р(2; 7)) = J(p a ,p(^y)), mo pentru orice succesiune a^ convergentă către a, ^ -^\nP(φ(φ, ^,...)>a m) = Pr a,p(r,)). (0,11)

Sub restricții suplimentare privind funcția φ(x), distanța informațională J(pa, P(zy)) din (2.3) poate fi calculată mai precis. Și anume, următoarea teoremă este adevărată. Teorema 4. Distanța informațională. Lasă pentru vreo 0

Dacă unele r > 0, C > 0 funcția reală φ(x) și derivatele sale parțiale de ordinul întâi sunt compacte și uniform continue în metrica generalizată p(x, y) pe mulțime

A = 0 r (p)PP bl] , există T > 0, R > 0 astfel încât pentru toate \t\ 0 p v v 1+ z u exp(i--φ(x))

0(p(gaL)) = a, / x X v \Z,t) T, u= oX LJ (Z,t)

Atunci p(z a, t a) Є ft, u J ((z Є L, 0 (x) = a), p) = J (p (z a , t a), p) d _ 9 = 7111 + t a "-^ OFaL)) - În 2Wexp( a --0(p(r a, i a))). j/=0 CnEi/ ^_o CX(/

Dacă funcția φ(x) este o funcție liniară și funcția fix) este definită folosind egalitatea (0.5), atunci condiția (0.12) devine condiția Cramer pentru variabila aleatoare f(,(z)). Condiția (0.13) este o formă a condiției (0.10) și este utilizată pentru a demonstra prezența în domenii a formei (x Є T2, φ(x) > a) a cel puțin un punct din 0(n, N) pentru toate suficient de mare n, N.

Fie v ()(n,iV) = (/i,...,/ijv) vectorul de frecvență în schema de alocare generalizată (0.2). Ca o consecință a teoremelor 3 și 4, se formulează următoarea teoremă.

Teorema 5. O teoremă integrală aproximativă privind probabilitățile abaterilor mari ale statisticilor separabile simetrice într-o schemă de alocare generalizată.

Fie n, N -> w astfel încât jfr - 7» 0 0, R > 0 astfel încât pentru toate \t\ Atunci pentru orice succesiune a# convergentă către a, 1 i iv =

Această teoremă a fost demonstrată pentru prima dată de AF Ronzhin în /38/ folosind metoda punctului de șa.

În a doua secțiune a celui de-al doilea capitol, studiem probabilitățile de abateri mari ale statisticilor separabile în aranjamente cxj^iax generalizate în cazul neîndeplinirii condiției Cramer pentru variabila aleatoare /((z)). Condiția lui Cramer pentru variabila aleatoare f(,(z)) nu este îndeplinită, în special, dacă (z) este o variabilă aleatoare Poisson și /(x) = x 2 . Rețineți că condiția lui Cramer pentru statisticile separabile în sine în schemele de alocare generalizate este întotdeauna îndeplinită, deoarece pentru orice n fix, N numărul rezultate posibileîn aceste diagrame, desigur.

După cum sa menționat în /2/, dacă condiția Cramer nu este satisfăcută, atunci pentru a găsi asimptoticele probabilităților de abateri mari ale sumelor distribuite identic. variabile aleatoare este necesară îndeplinirea unor condiţii suplimentare f pentru o modificare corectă a repartizării termenului. În lucrare (se consideră cazul care corespunde îndeplinirii condiției (3) în /2/, adică cazul șapte exponențial. Fie P(i = k) > 0 pentru toate

28 k = 0,1,... iar funcția p(k) = -\nP(t = k), poate fi extinsă la o funcție de argument continuu - o funcție care variază în mod regulat de ordinul p, 0 oo P(tx) , r v P(t )

Fie funcția f(x) pentru valori suficient de mari ale argumentului o funcție pozitivă, strict crescătoare, variabilă în mod regulat, de ordinul q > 1, pe restul axei reale

Apoi s. V. /(i) are momente de orice ordine și nu satisface condiția lui Cramer, ip(x) = o(x) ca x -> oo, iar următoarea teoremă este valabilă. ^p nu crește monoton, n, N --> oo astfel încât jf - A, 0 b(z\), unde b(z) = M/(1(2)), există o limită l(n,l)) > cN] = „(c ~ b( zx))l b""ї

Din teorema 6 rezultă că, dacă condiția Cramer nu este îndeplinită, limita (^ lim ~\nP(L N (h(n,N)) > cN) = 0, "" Dv

L/-too iV și asta dovedește validitatea ipotezei enunțate în /39/. Astfel, valoarea indicelui criteriului de bunăstare a potrivirii în schemele de alocare generalizate -^ când condiția lui Cramer nu este îndeplinită, este întotdeauna egală cu zero. În acest caz, în clasa criteriilor, când condiția Cramer este îndeplinită, se construiesc criterii cu o valoare a indicelui diferită de zero. Din aceasta putem concluziona că folosirea unor criterii ale căror statistici nu satisfac condiția Cramer, de exemplu, testul chi-pătrat într-o schemă polinomială, pentru a construi teste de bunăstare a potrivirii pentru testarea ipotezelor cu alternative care nu se apropie este asimptotic ineficientă în acest sens. O concluzie similară a fost făcută în /54/ pe baza rezultatelor comparării statisticilor chi-pătrat și a raportului de probabilitate maximă într-o schemă polinomială.

În al treilea capitol, rezolvăm problema construirii criteriilor de bunătate de potrivire cu cea mai mare valoare a indicelui criteriului (cea mai mare valoare a indicelui inferior al criteriului) pentru testarea ipotezelor în planuri generalizate. Pe baza rezultatelor din primul și al doilea capitol privind proprietățile funcțiilor de entropie, distanța informațională și probabilitățile de abateri mari, în capitolul al treilea, se găsește o funcție de forma (0,4) astfel încât criteriul de bunătate a potrivirii construit pe baza sa are cea mai mare valoare a indicelui exact inferior din clasa criteriilor luate în considerare. Se demonstrează următoarea teoremă. Teorema 7. Despre existența unui indice. Fie îndeplinite condițiile teoremei 3, 0 ,... este o succesiune de distribuții alternative, 0^(/3, iV) este numărul maxim pentru care inegalitatea

P(φ(^^,...) > a φ (P, M)) > (3, există o limită există un indice al criteriului f

3ff,K) = 3((φ(x) >a,xe 3D.P^)).

În același timp, sph(0,th)N NP(e(2 7) = fc)"

Concluzia evidențiază rezultatele obținute în relația lor cu scopul general și sarcinile specifice stabilite în disertație, formulează concluzii pe baza rezultatelor cercetării disertației, indică noutatea științifică, valoarea teoretică și practică a lucrării, precum și specificul științific. probleme care au fost identificate de autor și a căror soluție pare relevantă.

O scurtă trecere în revistă a literaturii pe tema de cercetare.

Lucrarea de disertație are în vedere problema construirii criteriilor de bunătate a potrivirii în schemele de alocare generalizate cu cea mai mare valoare a indicelui criteriului din clasa funcțiilor de forma (0,4) cu alternative neapropiate.

Schemele de alocare generalizate au fost introduse de VF Kolchin în /24/. Valorile fi r din schema polinomială au fost numite numărul de celule cu r shot-uri și au fost studiate în detaliu în monografie de V. F. Kolchin, B. A. Sevastyanov, V. P. Chistyakov /27/. Valorile \і r în machetele generalizate au fost studiate de VF Kolchin în /25/,/26/. Statisticile de forma (0,3) au fost luate în considerare pentru prima dată de Yu. I. Medvedev în /30/ și au fost numite statistici separabile (separabile în mod aditiv). Dacă funcțiile /„ din (0.3) nu depind de u, astfel de statistici au fost numite în /31/ statistici separabile simetrice. Comportamentul asimptotic al momentelor statisticilor separabile în schemele de alocare generalizate a fost obținut de GI Ivchenko în /9/. Teoremele limită pentru o schemă de alocare generalizată au fost, de asemenea, luate în considerare în /23/. Recenzii ale rezultatelor teoremelor limită și bunătatea potrivirii în scheme probabilistice discrete de tip (0,2) au fost date de V. A. Ivanov, G. I. Ivchenko, Yu. I. Medvedev în /8/ și G. I. Ivchenko, Yu. I. Medvedev, A.F. Ronzhin în /14/. Criteriile de compatibilitate pentru amenajările generalizate au fost luate în considerare de A.F. Ronzhin în /38/.

Compararea proprietăților testelor statistice din aceste lucrări a fost efectuată din punct de vedere al eficienței relative asimptotice. Au fost luate în considerare cazul ipotezelor de apropiere (contiguale) - eficiență în sensul lui Pitman și ipotezele neconvergente - eficiență în sensul lui Bahadur, Hodges - Lehman și Chernov. Legătura între tipuri variate eficacitatea relativă a criteriilor statistice este discutată, de exemplu, în /49/. După cum reiese din rezultatele lui Yu. I. Medvedev în /31/ privind distribuția statisticilor descompuse într-o schemă polinomială, testul bazat pe statistica chi-pătrat are cea mai mare putere asimptotică la ipotezele convergente din clasa statisticilor descompuse pe frecvențele rezultatelor într-o schemă polinomială. Acest rezultat a fost generalizat de A.F. Ronzhin pentru scheme de tip (0,2) în /38/. II Viktorova și VP Chistyakov în /4/ au construit un criteriu optim pentru o schemă polinomială din clasa funcțiilor liniare ale fi r . A. F. Ronzhin în /38/ a construit un criteriu care, în cazul unei secvențe de alternative care nu se apropie de ipoteza nulă, minimizează rata logaritmică a probabilității unei erori de primul fel care tinde spre zero în clasa statisticilor de forma (0,6). O comparație a performanței relative a statisticii chi-pătrat și a raportului de probabilitate maximă pentru ipotezele convergente și neconvergente a fost făcută în /54/. În lucrarea de disertație a fost luat în considerare cazul ipotezelor neapropiate. Studiul eficienței statistice relative a criteriilor în ipoteze neconvergente necesită studiul probabilităților de abateri super mari - de ordinul 0(y/n). Pentru prima dată o astfel de problemă pentru o distribuție polinomială cu un număr fix de rezultate a fost rezolvată de IN Sanov în /40/. Optimitatea asimptotică a criteriilor de bunătate a potrivirii pentru testarea ipotezelor simple și complexe pentru o distribuție polinomială în cazul unui număr finit de rezultate cu alternative neapropiate a fost luată în considerare în /48/. Proprietățile distanței informaționale au fost considerate anterior de Kullback, Leibler /29/,/53/ și I. II. Sanov /40/, precum și Heffding /48/. În aceste lucrări, continuitatea distanței informaționale a fost luată în considerare pe spații cu dimensiuni finite în metrica euclidiană. Autorul a luat în considerare și o succesiune de spații cu dimensiune crescătoare, de exemplu, în lucrarea lui Yu. V. Prokhorov /37/ sau în opera lui V. I. Bogachev, A. V. Kolesnikov /1/. Teoreme brute (până la echivalența logaritmică) privind probabilitățile de abateri mari ale statisticilor separabile în schemele de alocare generalizate în condiția lui Cramer au fost obținute de AF Roizhin în /38/. A. N. Timashev în /42/,/43/ a obținut integrale multidimensionale exacte (până la echivalență) și teoreme limită locale asupra probabilităților de abateri mari ale vectorului fir^n, N),..., fi rs (n,N) , unde s, гі,..., r s - numere întregi fixe,

Problemele statistice de testare a ipotezelor și de estimare a parametrilor într-o schemă de selecție fără înlocuire într-o formulare ușor diferită au fost luate în considerare de G. I. Ivchenko, V. V. Levin, E. E. Timonina /10/, /15/, unde problemele de estimare au fost rezolvate pentru o populație finită, când numărul elementelor sale este o valoare necunoscută, s-a dovedit normalitatea asimptotică a statisticilor S multivariate din eșantioane independente într-o schemă de selecție fără înlocuire. Problema studierii variabilelor aleatoare asociate cu repetițiile în secvențele de studii independente a fost studiată de A. M. Zubkov, V. G. Mikhailov, A. M. Shoitov în /6/, /7/, /32/, /33/, / 34/. Analiza principalelor probleme statistice de estimare și testare a ipotezelor în cadru model general Markov-Poya a fost realizat de G. I. Ivchenko, Yu. I. Medvedev în /13/, a cărui analiză probabilistică a fost dată în /11/. O metodă pentru specificarea măsurilor neechiprobabile pe un set de obiecte combinatorii care nu este reductibilă la o schemă de alocare generalizată (0,2) a fost descrisă în GI Ivchenko, Yu. I. Medvedev /12/. O serie de probleme din teoria probabilității, în care răspunsul poate fi obținut ca rezultat al calculelor folosind formule recursive, este indicat de AM Zubkov în /5/.

Inegalitățile pentru entropia distribuțiilor discrete au fost obținute în /50/ (citat în rezumatul lui A. M. Zubkov în RZhMat). Dacă (p n )Lo este o distribuție de probabilitate,

Pn = E Pk, k=n A = supp^Pn+i

I + (In -f-) (X Rp - P p + 1)

Рп= (x f 1)n+v n>Q. (0,15)

Rețineți că distribuția extremă (0.15) este o distribuție geometrică cu așteptarea A, iar funcția F(X) a parametrului (0.14) coincide cu funcția așteptării din teorema 1.

Entropia distribuțiilor discrete cu așteptări limitate

Dacă există un index de criteriu, atunci indicele criteriului se potrivește cu acesta. Indicele criteriului există întotdeauna. Cu cât este mai mare valoarea indicelui de criteriu (indicele mai mic al criteriului), cu atât este mai bun criteriul statistic în sensul considerat. În /38/, problema construirii criteriilor de bunăstare a potrivirii pentru layout-urile generalizate cu cea mai mare valoare a indicelui criteriului din clasa criteriilor care resping ipoteza Ho(n,N) a fost rezolvată pentru unde m 0 este ceva fix. număr, secvența de constante de ex. este selectată pe baza valorii date puterea criteriului pentru o secvență de alternative, ft este o funcție reală a m + 1 argumente.

Indicii criterii sunt determinați de probabilitățile de abateri mari. După cum se arată în /38/, asimptoticele brute (până la echivalența logaritmică) ale probabilităților de abateri mari ale statisticilor separabile atunci când condiția Cramer pentru variabila aleatoare /() este îndeplinită este determinată de distanța de informații corespunzătoare Kullback-Leibler-Sanov. (variabila aleatoare μ satisface condiția Cramer, dacă pentru ceva # 0 funcția generatoare de moment Mef7? este finită în intervalul \t\ H /28/).

Problema probabilităților abaterilor mari ale statisticilor de la un număr nemărginit de brad, precum și a statisticilor separabile arbitrare care nu satisfac condiția Cramer, a rămas deschisă. Acest lucru nu a permis rezolvarea definitivă a problemei construirii criteriilor de testare a ipotezelor în scheme de alocare generalizate cu cea mai mare rată de convergență la zero pentru probabilitatea unei erori de primul fel în cazul alternativelor convergente din clasa criteriilor. pe baza statisticilor de forma (0,4). Relevanța cercetării disertației este determinată de necesitatea completării soluției acestei probleme.

Scopul lucrării de disertație este de a construi criterii de bunătate de potrivire cu cea mai mare valoare a indicelui criteriului (indicele inferior al criteriului) pentru testarea ipotezelor din schema de selecție fără recurență în clasa criteriilor care resping ipoteza W( n, N) pentru unde φ este o funcție a unui număr numărabil de argumente, iar parametrii n, N se modifică în regiunea centrală. În conformitate cu scopul studiului, au fost stabilite următoarele sarcini: - să investigheze proprietățile entropiei și distanța informațională Kullback - Leibler - Sanov pentru distribuții discrete cu un număr numărabil de rezultate; - investigați probabilitățile de abateri mari ale statisticilor de forma (0,4); - investigați probabilitățile de abateri mari ale statisticilor separabile simetrice (0,3) care nu satisfac condiția Cramer; - găsiți o astfel de statistică încât criteriul acordului construit pe baza sa pentru testarea ipotezelor în scheme de alocare generalizată să aibă cea mai mare valoare a indicelui din clasa criteriilor de forma (0,7). Noutate științifică: - este dat conceptul de metrică generalizată - o funcție care admite valori infinite și satisface axiomele identității, simetriei și inegalității triunghiulare. Se găsește o metrică generalizată și se indică seturi pe care funcțiile de entropie și distanță de informații, date pe o familie de distribuții discrete cu un număr numărabil de rezultate, sunt continue în această metrică; - în schema de alocare generalizată se găsește o asimptotică grosieră (până la echivalență logaritmică) pentru probabilitățile de abateri mari ale statisticilor de forma (0,4) care satisfac forma corespunzătoare a condiției Cramer; - în schema de alocare generalizată se găsește o asimptotică grosieră (până la echivalență logaritmică) pentru probabilitățile de abateri mari ale statisticilor separabile simetrice care nu satisfac condiția Cramer; - în clasa de criterii de forma (0,7) se construiește un criteriu cu cea mai mare valoare a indicelui de criteriu. Valoare științifică și practică. În lucrare, sunt rezolvate o serie de întrebări despre comportamentul probabilităților mari de abatere în schemele de alocare generalizate. Rezultatele obținute pot fi utilizate în procesul de învățământ la specialitățile de statistică matematică și teoria informației, în studiul procedurilor statistice de analiză a secvențelor discrete și au fost utilizate în /3/, /21/ la justificarea securității unei clase. a sistemelor informatice. Dispozitii invocate in aparare: - reducerea problemei verificarii, folosind o singura secventa de culori de bile, a ipotezei ca aceasta secventa a fost obtinuta ca urmare a unei alegeri fara inlocuire pana la epuizarea bilelor dintr-o urna care contine bile de cate doua. culorile, iar fiecare astfel de alegere are aceeași probabilitate, la construirea criteriilor de acord pentru a testa ipoteze în aspectul generalizat corespunzător; - continuitatea funcțiilor de entropie și distanța informațională Kullback - Leibler - Sanov pe un simplex infinit-dimensional cu metrica generalizată logaritmică introdusă; - o teoremă asupra asimptoticii brute (până la echivalența logaritmică) a probabilităților de abateri mari ale statisticilor separabile simetrice care nu satisfac condiția Cramer în schema de alocare generalizată în cazul șapte exionențial;

Continuitatea distanței informaționale Kullback-Leibler-Sanov

Schemele de alocare generalizate au fost introduse de VF Kolchin în /24/. Valorile din schema polinomială au fost numite numărul de celule cu r shot-uri și au fost studiate în detaliu în monografia de V. F. Kolchin, B. A. Sevastyanov, V. P. Chistyakov /27/. Valorile \іr în machetele generalizate au fost studiate de VF Kolchin în /25/,/26/. Statisticile de forma (0,3) au fost luate în considerare pentru prima dată de Yu. I. Medvedev în /30/ și au fost numite statistici separabile (separabile în mod aditiv). Dacă funcțiile /„ din (0.3) nu depind de u, astfel de statistici au fost numite în /31/ statistici separabile simetrice. Comportamentul asimptotic al momentelor statisticilor separabile în schemele de alocare generalizate a fost obținut de GI Ivchenko în /9/. Teoremele limită pentru o schemă de alocare generalizată au fost, de asemenea, luate în considerare în /23/. Recenzii ale rezultatelor teoremelor limită și bunătatea potrivirii în scheme probabilistice discrete de tip (0,2) au fost date de V. A. Ivanov, G. I. Ivchenko, Yu. I. Medvedev în /8/ și G. I. Ivchenko, Yu. I. Medvedev, A.F. Ronzhin în /14/. Criteriile de compatibilitate pentru amenajările generalizate au fost luate în considerare de A.F. Ronzhin în /38/.

Compararea proprietăților testelor statistice din aceste lucrări a fost efectuată din punct de vedere al eficienței relative asimptotice. Au fost luate în considerare cazul ipotezelor de apropiere (contiguale) - eficiență în sensul lui Pitman și ipotezele neconvergente - eficiență în sensul lui Bahadur, Hodges - Lehman și Chernov. Relația dintre diferitele tipuri de performanță relativă a testelor statistice este discutată, de exemplu, în /49/. După cum reiese din rezultatele lui Yu. I. Medvedev în /31/ privind distribuția statisticilor separabile într-o schemă polinomială, testul bazat pe statistica chi-pătrat are cea mai mare putere asimptotică la ipotezele convergente din clasa statisticilor separabile pe frecvențele rezultatelor într-o schemă polinomială. Acest rezultat a fost generalizat de A.F. Ronzhin pentru scheme de tip (0,2) în /38/. II Viktorova și VP Chistyakov în /4/ au construit un criteriu optim pentru o schemă polinomială din clasa funcțiilor liniare ale bradului. A. F. Ronzhin în /38/ a construit un criteriu care, în cazul unei secvențe de alternative care nu se apropie de ipoteza nulă, minimizează rata logaritmică a probabilității unei erori de primul fel care tinde spre zero în clasa statisticilor de forma (0,6). O comparație a performanței relative a statisticii chi-pătrat și a raportului de probabilitate maximă pentru ipotezele convergente și neconvergente a fost făcută în /54/. În lucrarea de disertație a fost luat în considerare cazul ipotezelor neapropiate. Studiul eficienței statistice relative a criteriilor în ipoteze neconvergente necesită studiul probabilităților de abateri super mari - de ordinul 0(y/n). Pentru prima dată o astfel de problemă pentru o distribuție polinomială cu un număr fix de rezultate a fost rezolvată de IN Sanov în /40/. Optimitatea asimptotică a criteriilor de bunătate a potrivirii pentru testarea ipotezelor simple și complexe pentru o distribuție polinomială în cazul unui număr finit de rezultate cu alternative neapropiate a fost luată în considerare în /48/. Proprietățile distanței informaționale au fost considerate anterior de Kullback, Leibler /29/,/53/ și I. II. Sanov /40/, precum și Heffding /48/. În aceste lucrări, continuitatea distanței informaționale a fost luată în considerare pe spații cu dimensiuni finite în metrica euclidiană. Autorul a luat în considerare și o succesiune de spații cu dimensiune crescătoare, de exemplu, în lucrarea lui Yu. V. Prokhorov /37/ sau în opera lui V. I. Bogachev, A. V. Kolesnikov /1/. Teoreme brute (până la echivalența logaritmică) privind probabilitățile de abateri mari ale statisticilor separabile în schemele de alocare generalizate în condiția Cramer au fost obținute de A. F. Roizhin în /38/. A. N. Timashev în /42/,/43/ a obținut integrale multidimensionale exacte (până la echivalență) și teoreme limită locale privind probabilitățile abaterilor mari ale unui vector

Studiul probabilităților de abateri mari atunci când condiția lui Cramer nu este îndeplinită pentru cazul variabilelor aleatoare independente a fost efectuat în lucrările lui A. V. Nagaev /35/. Metoda distribuțiilor conjugate este descrisă de Feller /45/.

Problemele statistice de testare a ipotezelor și de estimare a parametrilor într-o schemă de selecție fără înlocuire într-o formulare ușor diferită au fost luate în considerare de G. I. Ivchenko, V. V. Levin, E. E. Timonina /10/, /15/, unde problemele de estimare au fost rezolvate pentru o populație finită, când numărul elementelor sale este o valoare necunoscută, s-a dovedit normalitatea asimptotică a statisticilor S multivariate din eșantioane independente într-o schemă de selecție fără înlocuire. Problema studierii variabilelor aleatoare asociate cu repetițiile în secvențele de studii independente a fost studiată de A. M. Zubkov, V. G. Mikhailov, A. M. Shoitov în /6/, /7/, /32/, /33/, /34/. Analiza principalelor probleme statistice de estimare și testare a ipotezelor în cadrul modelului general Markov-Poya a fost efectuată de G. I. Ivchenko, Yu. I. Medvedev în /13/, a cărui analiză probabilistică a fost dată în /11 /. O metodă pentru specificarea măsurilor neechiprobabile pe un set de obiecte combinatorii care nu este reductibilă la o schemă de alocare generalizată (0,2) a fost descrisă în GI Ivchenko, Yu. I. Medvedev /12/. O serie de probleme din teoria probabilității, în care răspunsul poate fi obținut ca rezultat al calculelor folosind formule recursive, este indicat de AM Zubkov în /5/.

Distanța informațiilor și probabilitățile de abateri mari ale statisticilor separabile

Când condiția lui Cramer nu este satisfăcută, abaterile mari ale statisticilor separabile în schema de alocare generalizată în cazul șapte exponențial considerat sunt determinate de probabilitatea de abatere a unui termen independent. Când condiția lui Cramer este satisfăcută, acest lucru, așa cum este subliniat în /39/, nu este cazul. Observația 10. Funcția φ(x) este astfel încât așteptarea matematică Ee (A) este finită la 0 t 1 și infinită la t 1. Observația 11. Pentru statisticile separabile care nu îndeplinesc condiția Cramer, limita (2.14) este egal cu 0, ceea ce demonstrează validitatea presupunerii exprimate în /39/. Observația 12. Pentru statistica chi-pătrat din schema polinomială pentru n, ./V - co astfel încât - A, rezultă direct din teoremă că Acest rezultat a fost obținut direct în /54/. În acest capitol, în gama centrală a parametrilor schemelor generalizate de distribuție a particulelor peste celule, asimptotice brute (până la echivalența logaritmică) a probabilităților de abateri mari ale statisticilor separabile aditiv de la umplerea celulelor și funcțiile numărului de celule cu o au fost găsite umplutură dată.

Dacă condiția lui Cramer este satisfăcută, atunci asimptotica aproximativă a probabilităților de abateri mari este determinată de asimptoticele aproximative ale probabilităților de cădere într-o succesiune de puncte cu coordonate raționale convergente în sensul de mai sus către punctul în care extremul corespondentului. este atinsă distanța de informații.

A fost considerat cazul șapte exponențial de neîndeplinire a condiției Cramer pentru variabilele aleatoare f(i),..., f(x), unde b, x sunt variabile aleatoare independente care generează schema de partiționare generalizată (0.2), f(k) este o funcție în definiția unei statistici simetrice separabile aditiv în (0.3). Adică, s-a presupus că funcțiile p(k) = - lnP(i = k) și f(k) pot fi extinse la funcții care variază în mod regulat ale unui argument continuu de ordinul p 0 și, respectiv, q 0 și p q . S-a dovedit că principala contribuție la asimptoticele brute a probabilităților de abateri mari ale statisticilor separabile în schemele de alocare generalizate este în mod similar făcută de asimptoticele brute ale probabilității de alocare la secvența corespunzătoare de puncte. Este interesant de observat că mai devreme teorema privind probabilitățile de abateri mari pentru statisticile separabile a fost demonstrată folosind metoda punctului de șa, contribuția principală la asimptotice fiind făcută de un singur punct de șa. Cazul a rămas neexplorat atunci când, dacă condiția Cramer nu este satisfăcută, condiția 2-kN nu este satisfăcută.

Dacă condiția lui Cramer nu este satisfăcută, atunci condiția indicată poate să nu fie îndeplinită numai în cazul lui p 1. După cum rezultă direct din logaritmul distribuției de probabilitate corespunzătoare, pentru distribuția Poisson și distribuția geometrică p=1. Din rezultatul privind asimptoticele probabilităților de abateri mari atunci când condiția Cramer nu este îndeplinită, putem concluziona că criteriile ale căror statistici nu satisfac condiția Cramer au o rată de convergență semnificativ mai mică la zero a probabilităților de erori ale celei de-a doua. fel pentru o probabilitate fixă ​​de eroare de primul fel și alternative neapropiate în comparație cu criteriile ale căror statistici satisfac condiția Cramer. Lasă o urnă care conține N - 1 1 bile albe un-JV 1 negre să fie aleasă fără înlocuire până se epuizează. Să relaționăm pozițiile bilelor albe din alegerea 1 i\ ... r -i n - 1 cu succesiunea distanțelor hi,..., h dintre bile albe adiacente astfel: Atunci hv l,v =1, ... ,N,M EjLi i/ - n- Să definim o distribuție de probabilitate pe mulțimea vectorilor h = (hi,..., λg) prin stabilirea V(hv = rv,v = l,... ,N) unde i,... ,lg - variabile aleatoare întregi nenegative independente (r.v.), adică se consideră schema de alocare generalizată (0,2). Distribuția vectorului h depinde de n,N, dar indicii corespunzători, acolo unde este posibil, vor fi omiși pentru ușurința notării. Observația 14. Dacă fiecăreia dintre modurile (]) de a alege bile dintr-o urnă i se atribuie aceeași probabilitate (\) mn pentru orice r i,..., rg astfel încât rn 1,u = l,...,N , T,v=\ru = n, probabilitatea ca distanțele dintre bilele albe adiacente din alegere să ia aceste valori

Criterii bazate pe numărul de celule din machetele generalizate

Scopul lucrării de disertație a fost de a construi criterii de bunătate pentru testarea ipotezelor într-o schemă de selecție fără a se întoarce dintr-o urna care conține bile de 2 culori. Autorul a decis să studieze statisticile pe baza frecvenței distanțelor dintre bile de aceeași culoare. În această formulare, problema a fost redusă la problema testării ipotezelor într-un aspect generalizat adecvat.

În lucrarea de disertație au fost - investigate proprietățile entropiei și ale distanței informaționale ale distribuțiilor discrete cu un număr nelimitat de rezultate cu o așteptare matematică limitată; - s-a obținut o asimptotică brută (până la echivalență logaritmică) a probabilităților de abateri mari ale unei clase largi de statistici într-o schemă de alocare generalizată; - pe baza rezultatelor obținute se construiește o funcție de criteriu cu cea mai mare rată logaritmică de convergență la zero a probabilității unei erori de primul fel pentru o probabilitate fixă ​​a unei erori de al doilea fel și alternative neapropiate; - S-a demonstrat că statisticile care nu satisfac condiția Cramer au o rată mai mică de tendință la zero a probabilităților de abateri mari comparativ cu statisticile care satisfac o astfel de condiție. Noutatea științifică a lucrării este următoarea. - este dat conceptul de metrică generalizată - o funcție care admite valori infinite și satisface axiomele identității, simetriei și inegalității triunghiulare. Se găsește o metrică generalizată și se indică seturi pe care funcțiile de entropie și distanță de informații, date pe o familie de distribuții discrete cu un număr numărabil de rezultate, sunt continue în această metrică; - în schema de alocare generalizată se găsește o asimptotică grosieră (până la echivalență logaritmică) pentru probabilitățile de abateri mari ale statisticilor de forma (0,4) care satisfac forma corespunzătoare a condiției Cramer; - în schema de alocare generalizată se găsește o asimptotică grosieră (până la echivalență logaritmică) pentru probabilitățile de abateri mari ale statisticilor separabile simetrice care nu satisfac condiția Cramer; - în clasa de criterii de forma (0,7) se construiește un criteriu cu cea mai mare valoare a indicelui de criteriu. În lucrare, sunt rezolvate o serie de întrebări despre comportamentul probabilităților mari de abatere în schemele de alocare generalizate. Rezultatele obținute pot fi utilizate în procesul de învățământ la specialitățile de statistică matematică și teoria informației, în studiul procedurilor statistice de analiză a secvențelor discrete și au fost utilizate în /3/, /21/ la justificarea securității unei clase. a sistemelor informatice. Cu toate acestea, o serie de întrebări rămân deschise. Autorul s-a limitat la a lua în considerare zona centrală de schimbare parametrii n,N scheme generalizate de aranjare a n particule în celule /V. Dacă purtătorul distribuției variabilelor aleatoare generatoare de schema de alocare generalizată (0.2) nu este o mulțime de forma r, r 4-1, r + 2,..., atunci când se demonstrează continuitatea funcției distanță informațională și studiind probabilitățile de abateri mari, este necesar să se ia în considerare structura aritmetică a unui astfel de purtător, care nu a fost luată în considerare în lucrarea autorului. Pentru aplicarea practică a criteriilor construite pe baza funcției propuse cu valoarea maximă a indicelui, se solicită studierea distribuției acestuia atât sub ipoteza nulă, cât și sub alternative, inclusiv convergente. De asemenea, este de interes transferul metodelor dezvoltate și generalizarea rezultatelor obținute către alte scheme probabilistice, altele decât schemele de alocare generalizate. Dacă //1,/ 2,-.. sunt frecvențele distanțelor dintre numerele rezultatului 0 din schema binomială cu probabilitățile rezultatelor рї 1 -POj, atunci se poate demonstra că în acest caz s-a dovedit în /26 /, rezultă că distribuția (3.3), în general, nu poate fi reprezentată în cazul general ca o distribuție comună a valorilor lui z în nicio schemă generalizată de plasare a particulelor în celule. Această distribuție este un caz special de distribuții pe mulțimea de obiecte combinatorii introduse în /12/. Pare a fi o sarcină urgentă transferarea rezultatelor lucrării de disertație pentru machete generalizate în acest caz, despre care a fost discutat în /52/.

Se încarcă...