ecosmak.ru

Asimptotinė funkcijų elgsena. be galo mažų funkcijų palyginimas

Kaip pažymėta ankstesnis skyrius, klasikinių algoritmų tyrimas daugeliu atvejų gali būti atliekamas naudojant asimptotinius matematinės statistikos metodus, ypač naudojant CLT ir konvergencijos paveldėjimo metodus. Klasikinės matematinės statistikos atskyrimas nuo taikomųjų tyrimų poreikių ypač pasireiškė tuo, kad populiariosiose monografijose trūksta matematinės aparato, reikalingo ypač dviejų imčių statistikai tirti. Esmė ta, kad iki ribos reikia pereiti ne pagal vieną parametrą, o per du – dviejų mėginių tūrius. Turėjau sukurti atitinkamą teoriją – konvergencijos paveldėjimo teoriją, išdėstytą mūsų monografijoje.

Tačiau tokio tyrimo rezultatai turės būti taikomi su baigtiniais imčių dydžiais. Su tokiu perėjimu susijusi daugybė problemų. Kai kurie iš jų buvo aptarti tiriant statistikos, sudarytos iš konkrečių skirstinių imčių, savybių.

Tačiau aptariant nukrypimų nuo pradinių prielaidų įtaką statistinių procedūrų savybėms, iškyla papildomų problemų. Kokie nukrypimai laikomi tipiniais? Ar reikėtų sutelkti dėmesį į „kenksmingiausius“ nukrypimus, kurie labiausiai iškreipia algoritmų savybes, ar į „tipinius“ nukrypimus?

Pirmuoju priėjimu gauname garantuotą rezultatą, tačiau šio rezultato „kaina“ gali būti be reikalo didelė. Kaip pavyzdį nurodome universalią Berry-Esseen nelygybę dėl CLT klaidos. Visiškai teisingai pabrėžia A.A. Borovkovui, kad „tikrųjų problemų konvergencijos greitis, kaip taisyklė, yra geresnis“.

Taikant antrąjį metodą, kyla klausimas, kurie nukrypimai laikomi „tipiniais“. Galite pabandyti atsakyti į šį klausimą analizuodami didelius realių duomenų masyvus. Visiškai natūralu, kad skirtingų tyrimo grupių atsakymai skirsis, kaip matyti, pavyzdžiui, nuo straipsnyje pateiktų rezultatų.

Viena iš klaidingų idėjų yra tik bet kurios konkrečios parametrinės šeimos galimų nukrypimų panaudojimas – Weibull-Gnedenko skirstiniai, trijų parametrų gama skirstinių šeima ir kt. Dar 1927 m. akad. SSRS mokslų akademija S.N. Bernsteinas aptarė metodologinę klaidą redukuojant visus empirinius skirstinius į keturių parametrų Pearsono šeimą. Tačiau parametriniai statistikos metodai vis dar yra labai populiarūs, ypač tarp taikomųjų mokslininkų, ir dėl šios klaidingos nuomonės kalti pirmiausia statistinių metodų mokytojai (žr. toliau, taip pat straipsnį).

15. Vieno iš daugelio kriterijų pasirinkimas konkrečiai hipotezei patikrinti

Konkrečiai praktinei problemai spręsti dažnai yra sukurta daug metodų, o matematinių tyrimo metodų specialistas susiduria su problema: kurį reikėtų pasiūlyti taikomąjam asmeniui analizuoti konkrečius duomenis?

Kaip pavyzdį apsvarstykite dviejų nepriklausomų mėginių homogeniškumo patikrinimo problemą. Kaip žinote, jo sprendimui galite pasiūlyti daugybę kriterijų: Studentas, Cramer-Welch, Lord, chi-square, Wilcoxon (Mann-Whitney), Van der - Waerden, Savage, N.V. Smirnov, pvz., Omega- aikštė (Lehmann -Rosenblatt), G.V. Martynova ir kt.. Kurį pasirinkti?

Natūraliai kyla mintis „balsuoti“: išbandyti pagal daugelį kriterijų, o tada nuspręsti „balsų dauguma“. Statistinės teorijos požiūriu, tokia procedūra tiesiog veda prie kito kriterijaus, kuris a priori nėra geresnis už ankstesnius, bet yra sunkiau tiriamas, konstravimo. Kita vertus, jei sprendiniai yra vienodi visiems nagrinėjamiems statistiniams kriterijams, pagrįstiems skirtingais principais, tai pagal stabilumo sampratą padidina pasitikėjimą visu gautu sprendimu.

Yra paplitusi, ypač tarp matematikų, klaidinga ir žalinga nuomonė apie būtinybę ieškoti optimalių metodų, sprendimų ir pan. Faktas yra tas, kad optimalumas paprastai išnyksta, kai nukrypstama nuo pradinių prielaidų. Taigi, aritmetinis vidurkis, kaip matematinės lūkesčio įvertis, yra optimalus tik tada, kai pradinis skirstinys yra normalus, o nuoseklus įvertinimas yra visada, jei tik egzistuoja matematinis lūkestis. Kita vertus, bet kokiam savavališkam hipotezių įvertinimo ar tikrinimo metodui dažniausiai galima suformuluoti optimalumo sąvoką taip, kad nagrinėjamas metodas taptų optimalus – šiuo specialiai pasirinktu požiūriu. Paimkite, pavyzdžiui, imties medianą kaip matematinių lūkesčių įvertinimą. Žinoma, jis yra optimalus, nors ir kitokia prasme nei aritmetinis vidurkis (optimalus normaliajam pasiskirstymui). Būtent Laplaso skirstiniui imties mediana yra maksimalios tikimybės įvertis, taigi ir optimalus (monografijoje nurodyta prasme).

Monografijoje buvo analizuojami homogeniškumo kriterijai. Yra keli natūralūs kriterijų palyginimo būdai – pagrįsti asimptotiniu santykiniu efektyvumu pagal Bahadur, Hodges-Lehman, Pitman. Ir paaiškėjo, kad kiekvienas kriterijus yra optimalus su atitinkama alternatyva arba tinkamu pasiskirstymu ant alternatyvų aibės. Tuo pačiu metu matematiniams skaičiavimams dažniausiai naudojama poslinkio alternatyva, kuri realių statistinių duomenų analizės praktikoje yra gana reta (susijusias su Wilcoxon kriterijumi, ši alternatyva buvo mūsų aptarta ir kritikuojama m.). Rezultatas liūdnas – puiki matematinė technika, parodyta , neleidžia mums pateikti rekomendacijų, kaip pasirinkti homogeniškumo testą analizuojant tikrus duomenis. Kitaip tariant, aplikacijos darbuotojo požiūriu, t.y. konkrečių duomenų analizė, monografija yra nenaudinga. Deja, šios monografijos autoriaus parodytas puikus matematikos meistriškumas ir didelis kruopštumas, deja, nieko neįnešė į praktiką.

Žinoma, kiekvienas praktiškai dirbantis statistikas vienaip ar kitaip išsprendžia statistinio kriterijaus pasirinkimo problemą. Remdamiesi daugeliu metodologinių sumetimų, pasirinkome omega kvadrato tipo kriterijų (Lehmann-Rosenblatt), kuris atitinka bet kokią alternatyvą. Tačiau kyla nepasitenkinimo jausmas dėl nepakankamo šio pasirinkimo pagrįstumo.

Apibrėžimas. Nulinio vektoriaus apibrėžta kryptis vadinama asimptotinė kryptis palyginti su antrosios eilės eilute, jei bet koks šios krypties linija (ty lygiagreti vektoriui ) turi ne daugiau kaip vieną bendrą tašką su linija arba yra šioje linijoje.

? Kiek bendrų taškų gali turėti antros eilės linija ir tiesė? asimptotinė kryptis apie šią eilutę?

Bendrojoje antros eilės eilučių teorijoje įrodyta, kad jeigu

Tada nulinis vektorius ( apibrėžia asimptotinę kryptį linijos atžvilgiu

(bendrasis asimptotinės krypties kriterijus).

Antros eilės eilėms

jei , tai asimptotinių krypčių nėra,

jei yra dvi asimptotinės kryptys,

jei tada yra tik viena asimptotinė kryptis.

Ši lema pasirodė esanti naudinga ( parabolinio tipo linijos asimptotinės krypties kriterijus).

Lemma . Leisti būti parabolinio tipo linija.

Ne nulinis vektorius turi asimptotinę kryptį

palyginti . (5)

(Problema. Įrodykite lemą.)

Apibrėžimas. Asimptotinės krypties tiesioji linija vadinama asimptotas antros eilės linijos, jei ši linija nesikerta su joje arba yra joje.

Teorema . Jei turi asimptotinę kryptį , tai asimptotė, lygiagreti vektoriui, nustatoma pagal lygtį

Pildome lentelę.

UŽDUOTYS.

1. Raskite šių antros eilės eilučių asimptotinius krypties vektorius:

4 - hiperbolinis tipas, dvi asimptotinės kryptys.

Naudokime asimptotinės krypties kriterijų:

Turi asimptotinę kryptį nurodytos 4 linijos atžvilgiu.

Jei =0, tada =0, ​​tai yra nulis. Tada padalinkite iš gaukite kvadratinė lygtis: , kur t = . Išsprendžiame šią kvadratinę lygtį ir randame du sprendinius: t = 4 ir t = 1. Tada tiesės asimptotinės kryptys .

(Galima apsvarstyti du būdus, nes linija yra parabolinio tipo.)

2. Išsiaiškinkite, ar koordinačių ašys turi asimptotines kryptis, palyginti su antrosios eilės eilėmis:

3. Parašykite bendrąją antros eilės eilutės, kuriai

a) abscisių ašis turi asimptotinę kryptį;

b) Abi koordinačių ašys turi asimptotines kryptis;

c) koordinačių ašys turi asimptotines kryptis, o O yra tiesės centras.

4. Parašykite eilučių asimptotes lygtis:

a) ng w:val="EN-US"/>y=0"> ;

5. Įrodykite, kad jei antros eilės tiesė turi dvi nelygiagrečias asimptotes, tai jų susikirtimo taškas yra šios tiesės centras.

Pastaba: Kadangi yra dvi nelygiagrečios asimptotės, yra dvi asimptotinės kryptys, tada , ir todėl linija yra centrinė.

Užrašykite asimptočių lygtis bendras vaizdas ir centro radimo sistema. Viskas akivaizdu.

6.(№920) Parašykite lygtį hiperbolės, einančios per tašką A(0, -5) ir turinčios asimptotes x - 1 = 0 ir 2x - y + 1 = 0.

indikacija. Naudokite ankstesnės problemos teiginį.

Namų darbai . , Nr. 915 (c, e, e), Nr. 916 (c, d, e), Nr. 920 (jei neturėjote laiko);

Lopšiai;

Silajevas, Timošenko. Praktinės užduotys pagal geometriją,

1 semestras P.67, klausimai 1-8, p.70, klausimai 1-3 (žodinis).

ANTROS UŽSAKYMO LINIJAS SKERSMENS.

SUJUNGTI SKERSMENYS.

Pateikta afininė koordinačių sistema.

Apibrėžimas. skersmens antrosios eilės linija, konjuguota su ne asimptotinės krypties vektoriumi , yra visų vektoriui lygiagrečių linijos stygų vidurio taškų rinkinys.

Paskaitoje buvo įrodyta, kad skersmuo yra tiesė ir gauta jos lygtis

Rekomendacijos: Parodykite (elipsėje), kaip ji sukonstruota (nustatykite neasimptotinę kryptį; nubrėžkite [dvi] šios krypties tiesias linijas, kertančias liniją; suraskite nupjautų stygų vidurio taškus; nubrėžkite tiesią per vidurio taškus - tai yra skersmuo).

Aptarkite:

1. Kodėl skersmens apibrėžime imamas neasimptotinės krypties vektorius. Jei jie negali atsakyti, paprašykite jų sukurti skersmenį, pavyzdžiui, parabolei.

2. Ar kuri nors antros eilės eilutė turi bent vieną skersmenį? Kodėl?

3. Paskaitoje buvo įrodyta, kad skersmuo yra tiesi linija. Kurios stygos vidurys yra paveikslo taškas M?


4. Pažvelkite į (7) lygties skliaustus. Ką jie primena?

Išvada: 1) kiekvienas centras priklauso kiekvienam skersmeniui;

2) jei yra tiesi centrų linija, tada yra vienas skersmuo.

5. Kokia parabolinių linijų skersmenų kryptis? (asimptotinis)

Įrodymas (tikriausiai paskaitoje).

Tegul skersmuo d, gautas pagal lygtį (7`), yra konjuguotas su neasimptotinės krypties vektoriumi. Tada jo krypties vektorius

(-(), ). Parodykime, kad šis vektorius turi asimptotinę kryptį. Naudokime parabolinės tiesės asimptotinės krypties vektoriaus kriterijų (žr. (5)). Mes pakeičiame ir įsitikiname (nepamirškite, kad .

6. Kiek skersmenų turi parabolė? Jų santykinė padėtis? Kiek skersmenų turi likusios parabolinės linijos? Kodėl?

7. Kaip sudaryti bendrą kai kurių antros eilės eilučių porų skersmenį (žr. 30, 31 klausimus žemiau).

8. Pildome lentelę, būtinai padarome brėžinius.

1. . Parašykite visų lygiagrečių vektoriui stygų vidurio taškų aibės lygtį

2. Parašykite skersmens d, einančio per tiesės tašką K(1,-2), lygtį.

Sprendimo žingsniai:

1-as būdas.

1. Nustatykite tipą (kad žinotumėte, kaip elgiasi šios linijos skersmenys).

Šiuo atveju linija yra centrinė, tada visi skersmenys eina per centrą C.

2. Sudarome tiesės, einančios per du taškus K ir C, lygtį. Tai yra norimas skersmuo.

2-as būdas.

1. Skersmens d lygtį įrašome į formą (7`).

2. Į šią lygtį pakeitę taško K koordinates, randame ryšį tarp vektoriaus konjuguoto su skersmeniu d koordinačių.

3. Atsižvelgdami į rastą priklausomybę, nustatome šį vektorių ir sudarome skersmens d lygtį.

Šioje užduotyje lengviau apskaičiuoti antruoju būdu.

3. . Parašykite skersmens lygtį lygiagrečiai x ašiai.

4. Raskite linijos nupjautą stygos vidurį

tiesėje x + 3y – 12 =0.

Pasiūlymas priimti sprendimą: Žinoma, galite rasti nurodytos linijos ir tiesės susikirtimo taškus, o tada - gautos atkarpos vidurį. Noras tai padaryti išnyksta, jei paimsime, pavyzdžiui, tiesę su lygtimi x + 3y – 2009 = 0.

IN šiuolaikinėmis sąlygomis susidomėjimas duomenų analize nuolat ir intensyviai auga visiškai skirtingose ​​srityse, tokiose kaip biologija, lingvistika, ekonomika ir, žinoma, IT. Šios analizės pagrindas – statistiniai metodai, kuriuos turi suprasti kiekvienas save gerbiantis duomenų gavybos specialistas.

Deja, tikrai geros literatūros, kuri galėtų pateikti ir matematiškai griežtus įrodymus, ir suprantamus intuityvius paaiškinimus, nėra labai įprasta. Ir šios paskaitos, mano nuomone, yra neįprastai geros matematikams, kurie tikimybių teoriją supranta būtent dėl ​​šios priežasties. Jos dėstomos Vokietijos krikščionių-Albrechto universiteto magistrams programose „Matematika“ ir „Finansinė matematika“. O tiems, kurie domisi, kaip šis dalykas dėstomas užsienyje, išverčiau šias paskaitas. Versti užtrukau kelis mėnesius, paskaitas praskiedžiau iliustracijomis, pratimais ir kai kurių teoremų išnašomis. Pažymiu, kad nesu profesionalus vertėjas, o tiesiog altruistas ir mėgėjas šioje srityje, todėl priimsiu bet kokią kritiką, jei ji konstruktyvi.

Trumpai tariant, paskaitos yra apie:


Sąlyginis lūkestis

Šis skyrius nėra tiesiogiai susijęs su statistika, tačiau tai yra idealus atskaitos taškas jai tirti. Sąlyginis lūkestis yra geriausias pasirinkimas nuspėti atsitiktinį rezultatą remiantis jau turima informacija. Ir tai taip pat atsitiktinai. Čia atsižvelgiama į įvairias jo savybes, tokias kaip tiesiškumas, monotoniškumas, monotoniškumas ir kt.

Taškų įvertinimo pagrindai

Kaip įvertinti paskirstymo parametrą? Koks yra to kriterijus? Kokie metodai turėtų būti naudojami tam? Šis skyrius leidžia atsakyti į visus šiuos klausimus. Čia pristatomos nešališko įverčio ir vienodai nešališko įverčio su minimalia dispersija sąvokos. Paaiškina, iš kur atsiranda chi kvadrato skirstinys ir Stjudento skirstinys ir kodėl jie svarbūs vertinant normaliojo skirstinio parametrus. Pasakojama, kokia yra Rao-Kramerio nelygybė ir Fišerio informacija. Taip pat įvedama eksponentinės šeimos sąvoka, todėl daug kartų lengviau gauti gerą įvertinimą.

Bajeso ir minimalaus parametro įvertinimas

Čia aprašomas kitoks filosofinis požiūris į vertinimą. Šiuo atveju parametras laikomas nežinomu, nes tai yra kažkokio atsitiktinio dydžio realizacija su žinomu (a priori) pasiskirstymu. Stebėdami eksperimento rezultatą, apskaičiuojame vadinamąjį užpakalinį parametro skirstinį. Remdamiesi tuo, galime gauti Bajeso įvertį, kur kriterijus yra vidutinis minimalus nuostolis, arba minimalią įvertį, kuris sumažina didžiausią galimą nuostolį.

Pakankamumas ir išsamumas

Šis skyrius turi didelę praktinę reikšmę. Pakankama statistika yra imties funkcija, todėl norint įvertinti parametrą pakanka išsaugoti tik šios funkcijos rezultatą. Tokių funkcijų yra daug, tarp jų yra ir vadinamoji minimali pakankama statistika. Pavyzdžiui, norint įvertinti normalaus skirstinio medianą, pakanka įrašyti tik vieną skaičių – visos imties aritmetinį vidurkį. Ar tai tinka ir kitiems platinimams, pvz., Cauchy paskirstymui? Kaip pakankamai statistikos padeda pasirinkti įvertinimus? Čia galite rasti atsakymus į šiuos klausimus.

Asimptotinės įverčių savybės

Bene svarbiausia ir būtiniausia įvertinimo savybė yra jo nuoseklumas, tai yra, polinkis į tikrąjį parametrą didėjant imties dydžiui. Šiame skyriuje aprašomos mums žinomų įverčių, gautų ankstesniuose skyriuose aprašytais statistiniais metodais, savybės. Pristatomos asimptotinio nešališkumo, asimptotinio efektyvumo ir Kullback-Leibler atstumo sąvokos.

Testavimo pagrindai

Be klausimo, kaip įvertinti mums nežinomą parametrą, turime kažkaip patikrinti, ar jis atitinka reikiamas savybes. Pavyzdžiui, atliekamas eksperimentas, kurio metu bandomas naujas vaistas. Kaip žinoti, ar su juo labiau pasveiksite, o ne su senesniais vaistais? Šiame skyriuje paaiškinama, kaip sukurti tokie testai. Sužinosite, kas yra vienodai galingiausias testas, Neymano-Pearson testas, reikšmingumo lygis, pasikliautinasis intervalas, taip pat iš kur atsiranda liūdnai pagarsėjęs Gauso testas ir t testas.

Asimptotinės kriterijų savybės

Kaip ir vertinimai, kriterijai turi atitikti tam tikras asimptotines savybes. Kartais gali susiklostyti situacijos, kai neįmanoma sukonstruoti reikiamo kriterijaus, tačiau pasitelkę gerai žinomą centrinę ribinę teoremą sukonstruojame kriterijų, kuris asimptotiškai linksta į būtinąjį. Čia sužinosite, kas yra asimptotinės reikšmės lygis, tikimybės santykio metodas ir kaip sudaromas Bartlett testas ir chi kvadrato nepriklausomybės testas.

Linijinis modelis

Šį skyrių galima laikyti papildymu, būtent statistikos taikymu tiesinės regresijos atveju. Suprasite, kokie pažymiai yra geri ir kokiomis sąlygomis. Sužinosite, iš kur atsirado mažiausiųjų kvadratų metodas, kaip sudaryti kriterijus ir kodėl jums reikia F skirstinio.

Asimptotinis funkcijos elgesys (arba asimptotinis elgesys) tam tikro taško a (baigtinio ar begalinio) apylinkėse suprantamas kaip funkcijos pokyčio pobūdis, nes jos argumentas x yra linkęs į šį tašką. Paprastai tokį elgesį jie bando pavaizduoti pasitelkdami kitą, paprastesnę ir labiau ištirtą funkciją, kuri taško a kaimynystėje pakankamai tiksliai nusako mus dominančios funkcijos pasikeitimą arba įvertina jos elgesį iš vienos pusės arba kitas. Ryšium su tuo iškyla problema lyginant dviejų funkcijų pokyčio pobūdį taško a kaimynystėje, o tai susiję su jų koeficiento svarstymu. Ypač įdomūs yra atvejai, kai abi funkcijos yra arba be galo mažos (in.m.) arba be galo didelės (in.b.) x ir a. 10.1. Be galo mažų funkcijų palyginimas Pagrindinis b.m palyginimo tikslas. Funkcijos yra lyginant jų artėjimo prie nulio pobūdį x a arba jų linkėjimo į nulį greitį. Tegul b.m. x a funkcijos a(x) ir P(x) yra nelygios nuliui tam tikroje taško a pertrauktoje kaimynystėje (a), o taške a jos yra lygios nuliui arba neapibrėžtos. Apibrėžimas 10.1. Funkcijos a(x) ir 0(x) vadinamos b.m. tos pačios eilės a ir parašykite og (a:) = į O (/? («)) (simbolis O skaito "Didysis O"), jei x a yra ne nulinė baigtinė santykio a ( x) / /? ( i), t.y. Akivaizdu, kad tada pagal (7.24) Zm € R \ (0), o žymėjimas X ^ a0 [a (x)) yra teisėtas. Simbolis O turi tranzityvumo savybė, t.y. jei – iš tiesų, atsižvelgiant į 10.1 apibrėžimą ir funkcijų sandaugos savybę (žr. (7.23)), kurios turi baigtines (šiuo atveju nelygias nuliui) ribas, gauname ASIMPTOTINĘ ELGESĮ FUNKCIJOS. Be galo mažų funkcijų palyginimas. Apibrėžimas 10.2. Funkcija a(x), kurią jie vadina b.m., yra didesnės mažumo laipsnio, palyginti su (3 (x) (arba santykinai su / 3 (x)) x a ir rašant) ( simbolis o yra skaitomas kaip io mažas, jei santykio a riba yra lygi nuliui. Šiuo atveju taip pat sakoma, kad funkcija bm yra mažesnės eilės mažumo nei a(x), jei x a, ir žodis mažumo paprastai praleidžiama (kaip ir aukštesnės eilės atveju 10.2 apibrėžime.) Tai reiškia, kad jei lim (tada funkcija f)(x) pagal 10.2 apibrėžimą yra f.m. didesnis laipsnis, palyginti su a(x), kai x a ir a(x), yra b.m. mažesnės eilės nei /3(x) x a, nes šiuo atveju lijTi (fi(x)/ot(x)) . Taigi pagal 7.3 teoremą galime parašyti apie funkcijos, jos ribos ir b.m ryšį. funkcija iš (10.3) iš to seka, kad ot) yra funkcija, b.m. adresu. Taigi a(x), t.y. reikšmės |a(h)| x artimas a, daug mažiau vertybių\0(x)\. Kitaip tariant, funkcija a(x) yra lygi nuliui greitesnė funkcija/?(X). 10.1 teorema. Produktas bet kurio b.m. x a funkcijoms a(x) ir P(x)), kurios nėra nulinės tam tikroje pradūrtoje taško a kaimynystėje, yra b.m. aukštesnės eilės funkcija, palyginti su kiekvienu iš veiksnių. Iš tiesų, pagal apibrėžimą 10.2 b.m. aukštesnės eilės (atsižvelgiant į funkcijos b.m. 7.10 apibrėžimą), lygybės reiškia teoremos teiginio pagrįstumą. Lygybės, kuriose yra simboliai O ir o, kartais vadinamos asimptotiniais įverčiais. Apibrėžimas 10.3. Funkcijos ot(x) ir /3(x) vadinamos nepalyginamomis b.m. už x -¥ a, jeigu nėra nei baigtinės, nei begalinės jų santykio ribos, t.y. jei $ lim a(x)/0(x) (p £ lygiai taip pat kaip $ lim 0(x)/a(x)). 10.1 pavyzdys. A. Funkcijos a(x) = x ir f(x) = sin2ar, remiantis 10.1 apibrėžimu, yra b.m. tos pačios eilės x 0, nes atsižvelgiant į (b. Funkcija a (x) \u003d 1 - coss, pagal apibrėžimą 10.2, - b. m. didesnės eilės, palyginti su 0 (x) \u003d x ties x 0, nes atsižvelgiant į c. Funkcija a(s) = \/x yra mažesnės eilės bm, palyginti su fl(x) = x, kai x 0, nes r. Funkcijos a(s) = x pagal apibrėžimą 10.3 yra nepalyginami bm ties x 0, nes nėra ribos (nei baigtinės, nei begalinės – žr. 7.5 pavyzdį).x a b.m. aukštesnės eilės lyginant su xn~1) t.y. yapa \u003d ao (a: n "* 1), nes lim (xL / xn" 1) \u003d Jei reikia, tiksliau lyginamąsias charakteristikas elgesys b.m. funkcijos ties x – ir vienas iš jų pasirinktas kaip tam tikras standartas ir vadinamas pagrindiniu. Žinoma, pasirenkant pagrindinį b.m. tam tikru mastu savavališkas (jie bando pasirinkti paprastesnius: x x - * 0; x-1 x -41; 1 / x x -\u003e oo ir tt). Nuo 0k(x) laipsnių pagrindinis b.m. funkcijos f)(x) su skirtingais eksponentais k > 0 (kai k ^ 0 0k(x) nėra f.m.) sudaro palyginimo pabėgį sudėtingesniam f.m. funkcijos a(z). Apibrėžimas 10.4. Funkcija a(z) vadinama b.m. k-oji mažumo tvarka (3(x), kai x a, o skaičius k yra mažumo tvarka, jei funkcijos a(z) ir /3k(x) yra b.m tos pačios eilės x a), t.y. jei Žodis „mažas" šiuo atveju taip pat paprastai praleidžiamas. Pastaba: 1) vienos b.m. funkcijos eilė k, palyginti su kita, gali būti bet koks teigiamas skaičius; 2) jei funkcijos a(x) tvarka, susijusi su / 3(x) yra lygus k, tada funkcijos P(x) tvarka a(x) atžvilgiu yra lygi 1/k, 3) ne visada galima nurodyti tam tikrą k eilę bm funkcija a(x), net jei ji palyginama su visais /?*(x) laipsniais. 10.2.a pavyzdys. Funkcija cosx pagal 10.4 apibrėžimą yra b.m eilės k = 2 0(x) atžvilgiu = x ties x 0, nes atsižvelgiant į b. Apsvarstykite funkcijas. Parodysime, kad bet kokiam Iš tiesų, pagal ( 7.32). Taigi funkcija a1/1 yra palyginama su xk, kai k > 0 x -> 0, tačiau šiai funkcijai negalima nurodyti mažumo eilės x atžvilgiu. kitos atžvilgiu ne visada paprasta. Galime rekomenduoti tokią procedūrą: 1) parašykite santykį a(x) / 0k( x)\ po ribiniu ženklu 2) išanalizuokite užrašytą santykį ir pabandykite jį supaprastinti; 3) remdamiesi žinomu p rezultatus, pateikti prielaidą apie galimą k) reikšmę, kuriai esant bus nulinė baigtinė riba; 4) patikrinkite prielaidą apskaičiuodami ribą. 10.3 pavyzdys. Nustatykime b.m eiliškumą. funkcijos tgx - sin x x atžvilgiu x -» 0, t.y. raskime skaičių k > 0, kad turėtume ASIMPTOTINĮ funkcijų ELGESĮ. Be galo mažų funkcijų palyginimas. Šiame etape, žinodami, kad esant x 0, pagal (7.35) ir (7.36), (sinx)/x 1 ir cosx -> 1, ir atsižvelgdami į (7.23) ir (7.33), galime nustatyti tą sąlygą ( 10.7) bus įvykdyta, kai k = 3. Iš tiesų, tiesioginis k = 3 ribos apskaičiavimas suteikia reikšmę A = 1/2: Atkreipkite dėmesį, kad k > 3 gauname begalinę ribą, o ribą lygus nuliui.

480 rub. | 150 UAH | 7,5 USD ", MOUSEOFF, FGCOLOR, "#FFFFCC", BGCOLOR, "#393939");" onMouseOut="return nd();"> Baigiamasis darbas - 480 rub., siuntimas 10 minučių 24 valandas per parą, septynias dienas per savaitę ir švenčių dienomis

Kolodzejus Aleksandras Vladimirovičius Tinkamumo kriterijų asimptotinės savybės tikrinant hipotezes atrankos schemoje be pakeitimo, remiantis ląstelių užpildymu apibendrinta paskirstymo schema: disertacija ... fizinių ir matematikos mokslų kandidatas: 01.01.05.- Maskva, 2006 m. .- 110 p.: iliustr. RSL OD, 61 07-1/496

Įvadas

1 Entropija ir informacijos atstumas 36

1.1 Pagrindiniai apibrėžimai ir simboliai 36

1.2 Diskrečiųjų skirstinių su ribotais lūkesčiais entropija 39

1.3 Logaritminė apibendrinta diskrečiųjų skirstinių aibės metrika 43

1.4 Skaičiuojamo argumentų rinkinio funkcijų kompaktiškumas. 46

1.5 Kullback-Leibler-Sanov informacijos atstumo tęstinumas 49

1.6 Išvados 67

2 Didelės nukrypimo tikimybės 68

2.1 Tikimybės, kad funkcijos nukryps nuo ląstelių skaičiaus su duotu užpildymu 68

2.1.1 Vietinės ribos teorema 68

2.1.2 Integralinės ribos teorema 70

2.1.3 Atskiriamos statistikos informacijos atstumas ir didelių nukrypimų tikimybės 75

2.2 Atskiriamos statistikos didelių nukrypimų tikimybės, kurios neatitinka Cramerio sąlygos 81

2.3 Išvados 90

3 Asimptotinės tinkamumo testų savybės 92

3.1 Negrąžinimo atrankos schemos priėmimo kriterijai. 92

3.2 Asimptotinis santykinis tinkamumo testų efektyvumas 94

3.3 Kriterijai, pagrįsti langelių skaičiumi apibendrintame išdėstyme 95

3.4 Išvados 98

99 išvada

Literatūra 103

Įvadas į darbą

Tyrimo objektas ir temos aktualumas. Diskrečių sekų statistinės analizės teorijoje ypatingą vietą užima tinkamumo testai, skirti patikrinti galimai sudėtingą nulinę hipotezę, ty atsitiktinės sekos pQ)?=i tokią, kad

Хі Є Ім,і= 1,...,n, Ім = (o, i,..., M), bet kuriam і = 1,..., n ir bet kuriam k Є їм tikimybė įvykis (Хі = k) nepriklauso nuo r Tai reiškia, kad seka (Xi)f = 1 tam tikra prasme yra stacionari.

Skaičiuje taikomas užduotis kaip seka (Х() =1 renkantis negrįžtant išsekimo iš urnos, kurioje yra rik - 1 > 0 k, k .,pd/ - 1 spalvos kamuoliukų, laikome rutuliukų spalvų seką) Tegul urnoje yra n - 1 rutuliukas, m n-l= (n fc -l).

Pažymėkite r(k) _ r(fc) r(fc) pavyzdyje esančių k spalvos rutuliukų skaičių seką. Apsvarstykite seką h" = (^,...,)). M fc) =ri fc) , ^ = ^-^ = 2,...,^-1, _ (fc)

Seka h^ apibrėžiama atstumais tarp gretimų k spalvos rutuliukų vietų taip, kad *Ф = n.

Visų k Є їm sekų aibė h(fc) vienareikšmiškai lemia seką rutuliukų spalvų seką vienareikšmiškai lemia atstumų tarp gretimų tos pačios fiksuotos spalvos rutuliukų seka h().Tegul urna n - 1 dviejų skirtingų spalvų rutuliukai turi N - 1 rutuliukų spalvos n, N) = (hi,..., /i#) su teigiamais sveikųjų skaičių komponentais, kad

Aibė 9\n,m atitinka visų skirtingų teigiamo sveikojo skaičiaus n skaidinių aibę į N eilės suvestinių.

Pateikę tam tikrą tikimybių skirstinį vektorių aibėje 9H n g, gauname atitinkamą tikimybių skirstinį aibėje Wl(N - l,n - N). Aibė Y\n,s yra aibės 2J n ,iv vektorių su neneigiamais sveikųjų skaičių komponentais, atitinkančiais (0,1), poaibis. Kaip tikimybių skirstiniai vektorių aibėje JZ p d disertaciniame darbe, formos skirstiniai

P(x, N) = (r t..., r N)) = P(& = rn, u = 1,..., N\ & = n), (0,2) kur 6 > , n – nepriklausomas neneigiami sveikieji atsitiktiniai dydžiai.

Formos (0,2) skirstiniai /24/ buvo vadinami apibendrintomis schemomis, skirtomis n dalelių patalpinimui į N ląsteles. Visų pirma, jei atsitiktiniai dydžiai h..., n in (0.2) yra paskirstyti pagal Puasono dėsnius atitinkamai su parametrais Ai,...,Alg, tai vektorius h(n,N) turi polinominį skirstinį. su rezultatų tikimybe

Pu \u003d m--~t~\u003e ^ \u003d 1,---, ^-

Li + ... + l^

Jei atsitiktiniai dydžiai i> >&v (0.2) yra vienodai pasiskirstę pagal geometrinį dėsnį V(Zi = k)= P k - 1 (l-p),k=l,2,..., kur p yra bet kuris iš intervalas 0

Kaip pažymėta /14/,/38/, ypatinga vieta tikrinant hipotezes apie dažnio vektorių pasiskirstymą h(n, N) = (hi,..., h^) apibendrintose schemose, skirtose n dalelių patalpinimui į N ląsteles užima kriterijai, sukurti remiantis formos statistika

Фк "%,%..;$, (0.4) kur /j/, v = 1,2,... ir φ yra kai kurios realios vertės funkcijos,

Mg \u003d E 1 (K \u003d g), g = 0,1, .... 1 / \u003d 1

Dydžiai //r /27/ buvo vadinami ląstelių, kuriose yra tiksliai r dalelių, skaičiumi.

Formos (0,3) statistika /30/ vadinama atskiriama (adityviai atskiriama) statistika. Jei funkcijos /„ in (0.3) nepriklauso nuo u, tai tokia statistika buvo vadinama /31/ simetriška atskiriama statistika.

Bet kurio r statistika fx r yra simetriška atskiriama statistika. Iš lygybės

DM = DFg (0,5), tai reiškia, kad simetrinės atskiriamos statistikos klasė h u sutampa su tiesinių funkcijų klase fi r . Be to, formos (0,4) funkcijų klasė yra platesnė nei simetrinės atskiriamos statistikos klasė.

H 0 = (R0(n, L0) yra paprastų nulinių hipotezių seka, kad vektoriaus h(n, N) skirstinys yra (0,2), kur atsitiktiniai dydžiai i,..., n ir (0,2) yra vienodai pasiskirstę ir P(ti = k)=p k ,k = 0,l,2,..., parametrai n, N kinta centrinėje srityje.

Apsvarstykite kai kuriuos РЄ (0,1) ir, paprastai tariant, sudėtingų alternatyvų n = (H(n,N)) seką, kad būtų n

P(Fm > OpAR)) >: 0-Mes atmesime hipotezę Hq(ti,N), jei fm > a w m((3). Jei yra riba jim ~1nP(0lg > a n, N (P)) = Sh ), kur kiekvieno N tikimybė apskaičiuojama pagal hipotezę #o(n,iV), tada reikšmė j (fi,lcl) vadinama /38/ kriterijaus indeksu φ taške (/?,Н) . Paprastai kalbant, paskutinės ribos gali ir nebūti. Todėl disertaciniame darbe, be kriterijaus indekso, nagrinėjama reikšmė lim (_IlnP(tor > a N (J3))) =іф(Р,П), kurią pagal analogiją pavadino autorius baigiamasis darbas kriterijaus f apatinis indeksas taške (/3,Н) . Čia ir toliau lim adg, lim a# jV-yuo LG-yuo reiškia atitinkamai apatinę ir viršutinę sekos ribas (odr) kaip N -> syu,

Jei kriterijaus indeksas yra, tada kriterijaus indeksas jį atitinka. Kriterijaus indeksas visada egzistuoja. Kaip daugiau vertės kriterijų indeksas (mažesnis kriterijų indeksas), tuo geresnis statistinis kriterijus nagrinėjama prasme. /38/ apibendrintų maketų tinkamumo kriterijų konstravimo problema su didžiausia vertė kriterijų indeksas kriterijų klasėje, kuri atmeta hipotezę Ho(n, N), kur m > 0 yra tam tikras fiksuotas numeris, konstantų seka pvz. parenkama pagal nurodytą kriterijaus laipsnio reikšmę su alternatyvų seka, ft yra realioji m + 1 argumentų funkcija.

Kriteriniai indeksai nustatomi pagal didelių nukrypimų tikimybes. Kaip parodyta /38/, apytikslė (iki logaritminio ekvivalento) didelių atskiriamos statistikos nukrypimų tikimybių asimptotika, kai tenkinama atsitiktinio kintamojo /() Cramerio sąlyga, nustatoma pagal atitinkamą Kullback-Leibler-Sanovo informacijos atstumą. (atsitiktinis dydis μ tenkina Cramerio sąlygą , jei kai kuriems # > 0 momentą generuojanti funkcija Me f7? intervale \t\ yra baigtinė

Klausimas dėl didelių statistikos nukrypimų nuo neriboto skaičiaus fi r tikimybių, taip pat dėl ​​savavališkos atskiriamos statistikos, kuri neatitinka Cramerio sąlygos, liko atviras. Tai neleido galutinai išspręsti hipotezių tikrinimo kriterijų sukūrimo apibendrintose paskirstymo schemose su didžiausiu konvergencijos lygiu iki nulio pirmosios rūšies klaidos tikimybės konverguojančių alternatyvų kriterijų klasėje atveju. remiantis (0,4) formos statistika. Disertacijos tyrimo aktualumą lemia poreikis užbaigti šios problemos sprendimą.

Disertacinio darbo tikslas – sukonstruoti tinkamumo kriterijus, turinčius aukščiausią kriterijaus indekso reikšmę (žemesnį kriterijaus indeksą), skirtus hipotezėms tikrinti atrankos schemoje, negrįžtant į hipotezę atmetančių kriterijų klasę W( n, N) esant 0(iv"iv"-""" o """)>CiV "(0" 7), kur φ yra skaičiuojamo argumentų skaičiaus funkcija, o parametrai n, N keičiasi centrinėje regione.

Atsižvelgiant į tyrimo tikslą, buvo iškelti šie uždaviniai: ištirti Kullback – Leibler – Sanov entropijos ir informacinio atstumo savybes diskretiesiems skirstiniams su skaičiuojamu išeičių skaičiumi; tirti formos statistikos didelių nukrypimų tikimybes (0,4); ištirti simetrinės atskiriamos statistikos didelių nuokrypių (0,3) tikimybes, kurios netenkina Cramerio sąlygos; - rasti tokią statistiką, kad jos pagrindu sukurtas susitarimo kriterijus hipotezėms tikrinti apibendrintose paskirstymo schemose turi didžiausią indekso reikšmę formos kriterijų klasėje (0,7).

Mokslinė naujovė: pateikiama apibendrintos metrikos samprata - funkcija, kuri leidžia turėti begalines reikšmes ir tenkina tapatybės, simetrijos ir trikampio nelygybės aksiomas. Surandama apibendrinta metrika ir nurodomos aibės, kuriose entropijos ir informacijos atstumo funkcijos, pateiktos diskrečiųjų skirstinių šeimoje su skaičiuojamu rezultatų skaičiumi, yra tolydžios šioje metrikoje; apibendrintoje paskirstymo schemoje randama grubi (iki logaritminio ekvivalentiškumo) asimptotika formų (0,4) statistikos didelių nukrypimų, tenkinančių atitinkamą Kramerio sąlygos formą, tikimybių; apibendrintoje paskirstymo schemoje apytikslė (iki logaritminio ekvivalentiškumo) asimptotika randama simetrinės atskiriamos statistikos didelių nukrypimų tikimybių, netenkinančių Cramerio sąlygos; formos (0,7) kriterijų klasėje sukonstruotas kriterijus, turintis didžiausią kriterijaus indekso reikšmę.

Mokslinė ir praktinė vertė. Straipsnyje išspręsta nemažai klausimų apie didelių nukrypimų tikimybių elgesį apibendrintose paskirstymo schemose. Gauti rezultatai gali būti naudojami ugdymo procesas matematinės statistikos ir informacijos teorijos specialybėse, tiriant statistines diskrečiųjų sekų analizės procedūras ir buvo naudojami /3/, /21/ pagrindžiant vienos klasės informacinių sistemų saugumą. Gintini pasiūlymai: tikrinimo problemos sumažinimas, naudojant vieną rutuliukų spalvų seką, hipotezė, kad ši seka buvo gauta pasirinkus be pakeitimo iki kamuolių išnaudojimo iš urnos, kurioje yra dviejų spalvų kamuoliukai, ir kiekvienas toks pasirinkimas turi tokią pačią tikimybę, kad bus sudaryti tinkamumo kriterijai, siekiant patikrinti hipotezes atitinkamame apibendrintame išdėstyme; Kullback-Leibler-Sanovo entropijos ir informacijos atstumo funkcijų tęstinumas begalinėje vienpusėje su įvestąja logaritmine apibendrinta metrika; teorema apie grubią (iki logaritminio ekvivalento) simetrinės atskiriamos statistikos didelių nukrypimų, neatitinkančių Kramerio sąlygos, tikimybių asimptotikos apibendrintoje paskirstymo schemoje septyniais egzistenciniais atvejais; teorema apie grubią (iki logaritminio ekvivalento) didelių nuokrypių tikimybių asimptotiką (0,4) formos statistikai; - susitarimo kriterijaus konstravimas hipotezėms tikrinti apibendrintose paskirstymo schemose, turinčiose didžiausią indekso reikšmę formos kriterijų klasėje (0,7).

Darbo aprobavimas. Apie rezultatus pranešta Matematikos instituto Diskrečiosios matematikos katedros seminaruose. V. A. Steklov RAS, Informacijos saugumo departamentas ITMiVT juos. S. A. Lebedevas RAS ir penktajame visos Rusijos taikomosios ir pramoninės matematikos simpoziume. Pavasario sesija, Kislovodskas, 2004 m. gegužės 2–8 d.; šeštoji tarptautinė Petrozavodsko konferencija "Tikimybiniai metodai diskrečiojoje matematikoje" 2004 m. birželio 10-16 d.; antra Tarptautinė konferencija„Informacinės sistemos ir technologijos (IST“ 2004), Minskas, 2004 m. lapkričio 8–10 d.;

Tarptautinė konferencija "Šiuolaikinės problemos ir naujos tikimybių teorijos tendencijos", Černivciai, Ukraina, 2005 m. birželio 19 - 26 d.

Pagrindiniai darbo rezultatai buvo panaudoti tiriamajame darbe „Apologia“, kurį atliko ITMiVT RAS. S. A. Lebedevas Rusijos Federacijos federalinės techninės ir eksporto kontrolės tarnybos interesais, ir buvo įtraukti į tyrimo etapo įgyvendinimo ataskaitą /21/. Atskiri disertacijos rezultatai buvo įtraukti į Rusijos Federacijos Kriptografijos akademijos 2004 metų tyrimo ataskaitą „Kryptografijos matematinių problemų plėtra“ /22/.

Autorius labai dėkoja moksliniam patarėjui, fizinių ir matematikos mokslų daktarui Ronžinui A. F. ir moksliniam konsultantui, fizinių ir matematikos mokslų daktarui, vyresniajam mokslo darbuotojui Knyazevui A. V. matematikos mokslų I. A. Kruglovui už dėmesį darbui ir daugybę vertingų dalykų. pastabas.

Darbo struktūra ir turinys.

Pirmame skyriuje nagrinėjamos entropijos ir informacijos atstumo savybės skirstiniams neneigiamų sveikųjų skaičių aibėje.

Pirmo skyriaus pirmoje pastraipoje supažindinama su žymėjimu ir pateikiami būtini apibrėžimai. Visų pirma, jie naudojami sekantį užrašą: x = (:ro,i, ---) - begalinis vektorius su skaičiuojamu komponentų skaičiumi;

H(x) - -Ex^oXvlnx,; trunc m (x) = (x 0 ,x 1 ,...,x t,0,0,...); SI* = (x, x u > 0, u = 0,1,..., E~ o xn 0,v = 0,l,...,E? =Q x v = 1); fi 7 \u003d (x Є O, L 0 vx v \u003d 7); %] = (хЄП, Ео»х ir

16 mі = e o ** v \ &c = Ue>1 | 5 × Q 7) o

Akivaizdu, kad aibė Vt atitinka neneigiamų sveikųjų skaičių aibės tikimybių skirstinių šeimą, P 7 - tikimybių skirstinių šeimą neneigiamų sveikųjų skaičių aibėje su matematiniais lūkesčiais.

Оє(у) - (х eO,x v

Pirmo skyriaus antroje pastraipoje įrodome teoremą apie diskrečiųjų skirstinių entropijos ribojimą su ribota matematine tikėtina.

1 teorema. Apie diskrečiųjų skirstinių entropijos ribą su ribota matematine tikėtimi. Bet kokiam wbp 7

Jei x Є fi 7 atitinka geometrinį skirstinį su matematine prognoze 7 ; tai yra

7xn = (1-p)p\ v = 0,1,..., kur p = --,

1 + 7 tada galioja lygybė H(x) = F(1).

Teoremos tvirtinimas gali būti vertinamas kaip formalaus sąlyginių Lagranžo daugiklių metodo taikymo rezultatas begalinio kintamųjų skaičiaus atveju. Teorema, kad vienintelis aibės skirstinys (k, k + 1, k + 2,...) su tam tikra matematine lūkesčiu ir maksimalia entropija yra geometrinis skirstinys su tam tikra matematine lūkesčiu, pateikta (be įrodymo) /47. /. Tačiau autorius pateikė griežtą įrodymą.

Trečioje pirmojo skyriaus pastraipoje pateikiamas apibendrintos metrikos apibrėžimas – metrika, leidžianti begalines reikšmes.

Jei x, y Є Гі, funkcija p(x, y) apibrėžiama kaip mažiausia є > 0 su savybe y v e~ e

Jei tokio є nėra, tai daroma prielaida, kad p(x, y) = oo.

Įrodyta, kad funkcija p(x, y) yra apibendrinta metrika neneigiamų sveikųjų skaičių aibėje, taip pat visoje aibėje Ci*. Vietoj e metrikos p(x, y) apibrėžime galite naudoti bet kurį kitą teigiamą skaičių, išskyrus 1. Gauta metrika skirsis dauginamąja konstanta. Informacinį atstumą pažymėkite J(x, y).

Čia ir toliau daroma prielaida, kad 0 In 0 = 0,01n ^ = 0. Informacinis atstumas yra apibrėžtas tokiam x, y, kad x v - 0 visiems ir toks, kad y v = 0. Jei ši sąlyga netenkinama, tada mes darys prielaidą, kad J (S,y) = co. Tegul A C $ 1. Tada pažymėsime J(Ay)="mU(x,y).

Tegul J(Jb,y) = 00.

Pirmo skyriaus ketvirtoje pastraipoje pateikiamas aibėje Π* apibrėžtų funkcijų kompaktiškumas. Funkcijos su skaičiuojamu argumentų skaičiumi kompaktiškumas reiškia, kad bet kokiu tikslumo laipsniu funkcijos reikšmė gali būti aproksimuota pagal šios funkcijos reikšmes taškuose, kuriuose tik baigtinis argumentų skaičius yra nulis. Įrodytas entropijos ir informacijos atstumo funkcijų kompaktiškumas.

Už bet kokį 0

Jei kai kuriems 0 0 funkcija \(x) = J(x, p) yra kompaktiška aibėje ^ 7 ] P 0 r (p).

Penktoje pirmojo skyriaus pastraipoje nagrinėjamos informacijos atstumo, pateikto begalinėje erdvėje, savybės. Palyginti su baigtinių matmenų atveju, situacija su informacijos atstumo funkcijos tęstinumu keičiasi kokybiškai. Parodyta, kad informacijos atstumo funkcija nėra tolydi aibėje Г2 nė vienoje iš metrikų pi(,y)= E|z„-i/„|, (

00 \ 2 p 2 (x, y) = sup (x^-ij^.

Įrodytas šių nelygybių pagrįstumas entropijos H(x) ir informacijos atstumo J(x,p) funkcijoms:

1. Bet kuriam x, x "Є fi \ H (x) - H (x") \

2. Jei kurio nors x, p є P yra є > 0, kad x є O є (p), tai bet kuriam X i Є Q \J(x,p) - J(x,p)\

Iš šių nelygybių, atsižvelgiant į 1 teoremą, išplaukia, kad entropijos ir informacijos atstumo funkcijos yra tolygiai tolydžios atitinkamuose poaibiuose fi p(x,y) metrikoje, būtent,

Bet kokiems 7 tokiems, kad 0

Jei už kokius 70, 0

20, tada bet kuriam 0 0 funkcija \p(x) = J(x t p) yra tolygiai tolydi aibėje П 7 ] П О є (р) metrikoje р(х,у).

Pateikiamas funkcijos neekstremalumo apibrėžimas. Neekstremalumo sąlyga reiškia, kad funkcija neturi vietinių ekstremalių arba funkcija turi tas pačias reikšmes vietiniuose minimumuose (vietiniuose maksimumuose). Neekstremalumo būklė susilpnina reikalavimą, kad nebūtų vietinių ekstremalių. Pavyzdžiui, funkcija sin x realiųjų skaičių aibėje turi lokalų ekstremalumą, bet tenkina neekstremalumo sąlygą.

Tegul kai 7 > 0, plotas A pateikiamas pagal sąlygą

А = (хЄЇ1 1 ,Ф(х) >а), (0.9) čia Ф(х) yra tikrosios vertės funkcija, a yra tikroji konstanta, inf Ф(х)

Ir 3y iškilo klausimas, kokiomis sąlygomis „a f „ f su u_ „ parametrais n, N centrinėje srityje, ^ -> 7, visoms pakankamai didelėms jų reikšmėms yra tokie neneigiami sveikieji skaičiai ko, k \, ..., k n, kuris yra ko + hi + ... + k n = N,

21 k\ + 2/... + nk n - N

Kq k \ k n . ^"iv"-"iv" 0 " 0 "-")>a -

Įrodyta, kad tam pakanka reikalauti, kad funkcija φ būtų neekstremalioji, kompaktiška ir tolydi metrikoje p(x, y), taip pat kad bent vieną tašką x tenkintų (0,9), kai kuriems є > 0 egzistuoja baigtinis 1 laipsnio momentas + є Ml + = і 1+є x ir 0 bet kuriam u = 0,1,....

Antrame skyriuje nagrinėjame grubią (iki logaritminio ekvivalento) didelių funkcijų nukrypimų nuo D = (fio,..., n, 0,...) - langelių su duotuoju skaičiumi - asimptotiką. užpildant centrinę parametrų sritį N,n . Apytikslės didelių nuokrypių tikimybių asimptotikos pakanka, kad būtų galima ištirti tinkamumo testų gerumo indeksus.

Tegul atsitiktiniai dydžiai ^ in (0.2) pasiskirsto vienodai ir

Р(Сі = k)=р b k = 0,1,... > P(z) - atsitiktinio dydžio i generuojanti funkcija - konverguoja į 1 spindulio apskritimą

22 Pažymėkite p(.) = (p(ad = o), Pn) = i),...).

Jei egzistuoja lygties z 1 sprendinys

M(*) = 7, tada jis yra unikalus /38/. Visur toliau darysime prielaidą, kad Pjfc>0,fc = 0,l,....

Antrojo skyriaus pirmos pastraipos pirmoje pastraipoje yra formos tikimybių logaritmų asimptotika

Įrodyta tokia teorema.

2 teorema. Apytikslė vietinė teorema apie didelių nuokrypių tikimybes. Tegul n, N - * w, kad - -> 7> 0

Teoremos teiginys tiesiogiai išplaukia iš jungtinio pasiskirstymo /į, A*b / /26/ formulės ir tokio įvertinimo: jei neneigiamos sveikųjų skaičių reikšmės fii,fi2,/ tenkina sąlygą /І1 + 2 // 2 + ... + 71/ = 71, tada nulinių reikšmių skaičius tarp jų yra 0 (l/n). Tai apytikslis įvertinimas, kuris nepretenduoja į naują. Nenulinių r skaičius apibendrintuose maketuose neviršija maksimalaus langelių užpildymo reikšmės, kuri centriniame regione su tikimybe, linkusia į 1, neviršija reikšmės 0(\np) /25/,/27/ . Nepaisant to, gautas įvertis 0 (y/n) yra patenkintas tikimybe 1 ir jo pakanka gauti apytikslę asimptotiką.

Antrojo skyriaus pirmos pastraipos antroje pastraipoje randama ribos reikšmė, kur adz yra realiųjų skaičių seka, konverguojanti į kai kuriuos a Є R, φ(x) yra tikrosios reikšmės funkcija. Įrodyta tokia teorema.

3 teorema. Apytikslė integralų teorema apie didelių nuokrypių tikimybes. Tegul tenkinamos 2 teoremos sąlygos, kai kurių r > 0, (> 0 tikroji funkcija φ(x) yra kompaktiška, tolygiai tolydi aibės metrikoje p

A = 0 rH (p(r 1))np n] ir tenkina neekstremalumo sąlygą aibėje r2 7 . Jei kuriai nors konstantai a tokia, kad inf φ(x)

24 yra vektorius p a fi 7 P 0 r (p(z 7)) ; toks kad

Ф(pа) > a J(( (x) >а,хЄ П 7 ),р(2; 7)) = J(p a ,p(^y)), mo bet kuriai sekai a^, konverguojančiai į a, ^ -^\nP(φ(φ, ^,...)>a m) = Pr a,p(r,)). (0,11)

Taikant papildomus funkcijos φ(x) apribojimus, informacijos atstumas J(pa, P(zy)) (2.3) gali būti apskaičiuojamas tiksliau. Būtent ši teorema yra teisinga. 4 teorema. Informacinis atstumas. Tegul už 0

Ar kai kurie r > 0, C > 0 tikroji funkcija φ(x) ir jos pirmos eilės dalinės išvestinės yra kompaktiškos ir tolygiai tolydžios apibendrintoje metrikoje p(x, y) aibėje

A = 0 r (p)PP bl] , egzistuoja T > 0, R > 0, kad visiems \t\ 0 p v v 1+ z u exp(i--φ(x))

0(p(gaL)) = a, / x X v \Z,t) T, u = oX LJ (Z,t)

Tada p(z a, t a) Є ft, u J ((z Є L, 0 (x) = a), p) = J (p (z a , t a), p) d _ 9 = 7111 + t a "-^ OFaL)) – 2Wexp( a --0(p(r a, i a))). j/=0 CnEi/ ^_o CX(/

Jei funkcija φ(x) yra tiesinė funkcija, o funkcija fix) yra apibrėžta naudojant lygybę (0,5), sąlyga (0,12) tampa atsitiktinio kintamojo f(,(z) Cramerio sąlyga). Sąlyga (0,13) yra sąlygos (0,10) forma ir naudojama įrodyti, kad formos (x Є T2, φ(x) > a) srityse yra bent vienas taškas nuo 0 (n, N) visiems. pakankamai didelis n, N.

Tegul v ()(n,iV) = (/i,...,/ijv) yra dažnio vektorius apibendrintoje paskirstymo schemoje (0.2). Dėl 3 ir 4 teoremų suformuluojama tokia teorema.

5 teorema. Apytikslė integralinė teorema apie simetrinės atskiriamos statistikos didelių nuokrypių tikimybes apibendrintoje paskirstymo schemoje.

Tegul n, N -> w taip, kad jfr - 7» 0 0, R > 0 taip, kad visoms \t\ Tada bet kuriai sekai a#, konverguojančiai į a, 1 i iv =

Šią teoremą pirmą kartą įrodė AF Ronzhin /38/, naudodamas balno taško metodą.

Antroje antrojo skyriaus dalyje nagrinėjame didelių atskiriamos statistikos nuokrypių tikimybes apibendrintuose cxj^iax susitarimuose, kai atsitiktiniam dydžiui /((z)) neįvykdoma Cramerio sąlyga. Kramerio sąlyga atsitiktiniam dydžiui f(,(z)) netenkinama, ypač jei (z) yra Puasono atsitiktinis kintamasis, o /(x) = x 2 . Atkreipkite dėmesį, kad Cramerio sąlyga pačiai atskiriamai statistikai apibendrintose paskirstymo schemose visada tenkinama, nes bet kokiam fiksuotam n, N skaičius galimus rezultatusšiose diagramose, žinoma.

Kaip pažymėta /2/, jei Cramerio sąlyga netenkinama, tada reikia rasti identiškai pasiskirstytų sumų didelių nuokrypių tikimybių asimptotiką. atsitiktiniai dydžiai reikalingas papildomų f sąlygų teisingam termino paskirstymo pakeitimui įvykdymas. Darbe (laikomas atvejis, atitinkantis sąlygos (3) įvykdymą /2/, tai yra septynių eksponentinį atvejį. Tegul P(i = k) > 0

28 k = 0,1,... ir funkcija p(k) = -\nP(t = k), gali būti išplėsta iki nuolatinio argumento funkcijos – reguliariai kintančios funkcijos, kurios eilės p, 0 oo P(tx) , r v P(t )

Tegul funkcija f(x) pakankamai didelėms argumento reikšmėms yra teigiama, griežtai didėjanti, reguliariai kintanti funkcija, kurios eilės q > 1, likusioje tikrosios ašies dalyje

Tada s. V. /(i) turi bet kokios eilės momentus ir netenkina Cramerio sąlygos, ip(x) = o(x) kaip x -> oo, ir galioja sekanti teorema ^p nedidėja monotoniškai, n, N --> oo taip, kad jf - A, 0 b(z\), kur b(z) = M/(1(2)), egzistuoja riba l(n,l)) > cN] = "(c ~ b( zx))l b""ї

Iš 6 teoremos išplaukia, kad jei Cramerio sąlyga netenkinama, riba (^ lim ~\nP(L N (h(n,N)) > cN) = 0, "" Dv

L/-per iV ir tai įrodo /39/ pateiktos hipotezės pagrįstumą. Taigi tinkamumo kriterijaus indekso reikšmė apibendrintose paskirstymo schemose -^ kai Cramerio sąlyga netenkinama, visada lygi nuliui. Šiuo atveju kriterijų klasėje, kai tenkinama Cramer sąlyga, sudaromi kriterijai, kurių indekso reikšmė nėra nulinė. Iš to galime daryti išvadą, kad naudojant kriterijus, kurių statistika neatitinka Cramerio sąlygos, pavyzdžiui, chi kvadrato testą polinominėje schemoje, konstruoti tinkamumo testus hipotezėms tikrinti su nepriartėjusiomis alternatyvomis yra asimptotiškai neefektyvu. šis jausmas. Panaši išvada buvo padaryta /54/ remiantis chi kvadrato statistikos ir didžiausios tikimybės santykio palyginimo polinominėje schemoje rezultatais.

Trečiame skyriuje sprendžiame tinkamumo kriterijų su didžiausia kriterijaus indekso reikšme (didžiausia kriterijaus žemesnio indekso reikšme) konstravimo uždavinį hipotezėms tikrinti apibendrintuose maketuose. Remiantis pirmojo ir antrojo skyrių rezultatais apie entropinių funkcijų savybes, informacijos atstumą ir didelių nuokrypių tikimybes, trečiajame skyriuje randama formos funkcija (0,4), kad atitiktų tinkamumo kriterijus. jos pagrindu pastatyta turi didžiausią tiksliai žemesnio indekso reikšmę nagrinėjamoje kriterijų klasėje. Įrodyta tokia teorema. 7 teorema. Apie indekso egzistavimą. Tegul tenkinamos 3 teoremos sąlygos, 0 ,... yra alternatyvių skirstinių seka, 0^(/3, iV) yra didžiausias skaičius, kuriam pagal hipotezę Н Р (lo, nelygybė

P(φ(^^,...) > a φ (P, M)) > (3, yra riba, yra kriterijaus f indeksas

3ff,K) = 3((φ(x) >a,xe 3D.P^)).

Tuo pačiu metu sph(0,th)N NP(e(2 7) = fc)"

Išvadoje išdėstomi gauti rezultatai jų santykyje su disertaciniame darbe keliamu bendruoju tikslu ir konkrečiais uždaviniais, formuluojamos išvados remiantis disertacijos tyrimo rezultatais, nurodomas mokslinis naujumas, teorinė ir praktinė darbo vertė, taip pat konkretus mokslinis darbas. problemos, kurias nustatė autorius ir kurių sprendimas atrodo aktualus.

Trumpa literatūros apžvalga tiriama tema.

Disertaciniame darbe nagrinėjama tinkamumo kriterijų gerumo konstravimo problema apibendrintose paskirstymo schemose, turinčiose didžiausią kriterijaus indekso reikšmę formos (0,4) funkcijų klasėje su nesiartinančiomis alternatyvomis.

Apibendrintas paskirstymo schemas VF Kolčinas pristatė /24/. Fi r reikšmės daugianario schemoje buvo vadinamos ląstelių su r šūviais skaičiumi ir buvo išsamiai išnagrinėtos V. F. Kolchino, B. A. Sevastjanovo, V. P. Chistyakovo monografijoje /27/. Vertes\і r apibendrintuose maketuose ištyrė VF Kolchin /25/,/26/. Formos (0,3) statistiką pirmasis apžvelgė Yu. I. Medvedevas /30/ ir ji buvo vadinama atskiriama (adityviai atskiriama) statistika. Jei funkcijos /„ in (0.3) nepriklauso nuo u, tokia statistika buvo vadinama /31/ simetriška atskiriama statistika. Atskiriamos statistikos momentų asimptotinę elgseną apibendrintose paskirstymo schemose GI Ivčenko gavo /9/. Apibendrintos paskirstymo schemos ribinės teoremos taip pat buvo nagrinėjamos /23/. Apžvalgas apie ribinių teoremų rezultatus ir tinkamumo gerumą diskrečiose tikimybinėse (0.2) tipo schemose pateikė V. A. Ivanovas, G. I. Ivčenka, Ju. I. Medvedevas /8/ ir G. I. Ivčenko, Ju. I. Medvedevas, A. F. Ronžinas. /14/. Apibendrintų maketų tinkamumo kriterijus svarstė A. F. Ronžinas /38/.

Šiuose darbuose statistinių testų savybių palyginimas atliktas santykinio asimptotinio efektyvumo požiūriu. Buvo nagrinėjamas artėjančių (gretutinių) hipotezių atvejis – efektyvumas Pitmano prasme ir nekonverguojančios hipotezės – efektyvumas Bahadur, Hodges – Lehman ir Chernov prasme. Ryšys tarp įvairių tipų santykinis statistinių kriterijų efektyvumas aptariamas, pavyzdžiui, /49/. Kaip matyti iš Yu. I. Medvedevo rezultatų /31/ apie skaidomos statistikos pasiskirstymą polinominėje schemoje, chi kvadrato statistika pagrįstas testas turi didžiausią asimptotinę galią esant konverguojančioms hipotezėms išskaidomos statistikos klasėje rezultatų dažniai daugianario schemoje. Šį rezultatą A. F. Ronžinas apibendrino (0,2) tipo schemoms /38/. II Viktorova ir V. P. Čistjakovas /4/ sukonstravo optimalų polinominės schemos kriterijų fi r tiesinių funkcijų klasėje. A. F. Ronžinas /38/ sukonstravo kriterijų, kuris, esant alternatyvų sekai, nepriartėjančiai prie nulinės hipotezės, sumažina logaritminę tikimybės, kad pirmosios rūšies klaidos linkusios į nulį formos statistikos klasėje. (0,6). Santykinis chi kvadrato statistikos efektyvumas ir konverguojančių bei nekonverguojančių hipotezių maksimalaus tikimybių santykio palyginimas atliktas /54/. Disertaciniame darbe buvo nagrinėjamas nepriartėjimo prie hipotezių atvejis. Kriterijų santykinio statistinio efektyvumo tyrimas pagal nekonverguojančias hipotezes reikalauja ištirti superdidelių nuokrypių tikimybes – 0(y/n) eilės. Pirmą kartą tokią daugianario skirstinio su fiksuotu rezultatų skaičiu problemą išsprendė IN Sanov /40/. Tinkamumo kriterijų asimptotinis optimalumas, skirtas paprastų ir sudėtingų daugianario skirstinio hipotezių tikrinimui, esant baigtiniam rezultatų skaičiui su neprieinamomis alternatyvomis, buvo nagrinėjamas /48/. Informacinio nuotolio savybes anksčiau svarstė Kullbackas, Leibleris /29/,/53/ ir I. II. Sanovas /40/, taip pat Heffdingas /48/. Šiuose dokumentuose informacijos atstumo tęstinumas buvo nagrinėjamas baigtinių matmenų erdvėse Euklido metrikoje. Autorius taip pat svarstė erdvių seką su didėjančia dimensija, pavyzdžiui, Ju. V. Prochorovo /37/ arba V. I. Bogačiovo, A. V. Kolesnikovo /1/ kūryboje. Apytiksles (iki logaritminio ekvivalentiškumo) teoremas apie didelių atskiriamos statistikos nuokrypių tikimybes apibendrintose paskirstymo schemose Kramerio sąlygoje AF Roizhin gavo /38/. A. N. Timaševas /42/,/43/ gavo tikslias (iki ekvivalentiškumo) daugiamates integralines ir lokalines ribines teoremas apie vektoriaus fir^n, N),..., fi rs (n,N) didelių nuokrypių tikimybes. , kur s, гі,..., r s – fiksuoti sveikieji skaičiai,

Statistines hipotezių tikrinimo ir parametrų įvertinimo atrankos schemoje be pakeitimo problemas kiek kitokioje formuluotėje nagrinėjo G. I. Ivčenko, V. V. Levinas, E. E. Timonina /10/, /15/, kur buvo išspręstos baigtinės populiacijos įvertinimo problemos, kai jo elementų skaičius yra nežinoma reikšmė, įrodytas daugiamatės S statistikos iš s nepriklausomų imčių asimptotinis normalumas atrankos schemoje be pakeitimo. Atsitiktinių dydžių, susijusių su pasikartojimais nepriklausomų bandymų sekose, tyrimo problemą nagrinėjo A. M. Zubkovas, V. G. Mikhailovas, A. M. Shoitovas /6/, /7/, /32/, /33/, / 34/. Pagrindinių statistinių problemų analizė ir hipotezių tikrinimas sistemoje bendras modelis Markov-Poya atliko G. I. Ivčenko, Ju. I. Medvedevas /13/, kurio tikimybinė analizė pateikta /11/. Kombinatorinių objektų rinkinio, kuris nėra redukuojamas į apibendrintą paskirstymo schemą (0,2), nelygiaverčių matų patikslinimo metodas buvo aprašytas GI Ivchenko, Yu. I. Medvedev /12/. Nemažai tikimybių teorijos problemų, į kurias atsakymą galima gauti atlikus skaičiavimus naudojant rekursines formules, AM Zubkovas nurodo /5/.

Diskrečiųjų skirstinių entropijos nelygybės buvo gautos /50/ (cituojama A. M. Zubkovo santraukoje RZhMat). Jei (p n )Lo yra tikimybių skirstinys,

Pn = E Pk, k=n A = supp^Pn+i

I + (In -f-) (X Rp - P p + 1)

Рп= (x f 1)n+v n>Q. (0,15)

Atkreipkite dėmesį, kad ekstremalus skirstinys (0,15) yra geometrinis skirstinys su lūkesčiu A, o parametro (0,14) funkcija F(X) sutampa su 1 teoremos lūkesčio funkcija.

Diskrečiųjų pasiskirstymų su ribotais lūkesčiais entropija

Jei kriterijaus indeksas yra, tada kriterijaus indeksas jį atitinka. Kriterijaus indeksas visada egzistuoja. Kuo didesnė kriterijaus indekso reikšmė (mažesnis kriterijaus indeksas), tuo geresnis statistinis kriterijus nagrinėjama prasme. /38/ buvo išspręsta apibendrintų maketų, kurių kriterijaus indekso reikšmė yra didžiausia kriterijų klasėje, kuri atmeta Ho(n,N) hipotezę, tinkamumo kriterijų konstravimo problema, kai m 0 yra koks nors fiksuotas. skaičius, konstantų seka pvz., parenkama remiantis duota verte alternatyvų sekos kriterijaus galia, ft yra realioji m + 1 argumentų funkcija.

Kriteriniai indeksai nustatomi pagal didelių nukrypimų tikimybes. Kaip parodyta /38/, apytikslė (iki logaritminio ekvivalento) didelių atskiriamos statistikos nukrypimų tikimybių asimptotika, kai tenkinama atsitiktinio kintamojo /() Cramerio sąlyga, nustatoma pagal atitinkamą Kullback-Leibler-Sanovo informacijos atstumą. (atsitiktinis dydis μ tenkina Cramerio sąlygą , jei tam tikram # 0 momentą generuojanti funkcija Mef7? intervale \t\ H /28/ yra baigtinė).

Klausimas dėl didelių statistikos nukrypimų nuo neriboto skaičiaus eglės, taip pat dėl ​​savavališkos atskiriamos statistikos, neatitinkančios Kramerio sąlygos, tikimybės liko atviras. Tai neleido galutinai išspręsti hipotezių tikrinimo kriterijų sukūrimo apibendrintose paskirstymo schemose su didžiausiu konvergencijos lygiu iki nulio pirmosios rūšies klaidos tikimybės konverguojančių alternatyvų kriterijų klasėje atveju. remiantis (0,4) formos statistika. Disertacijos tyrimo aktualumą lemia poreikis užbaigti šios problemos sprendimą.

Disertacinio darbo tikslas – sukonstruoti tinkamumo kriterijus su didžiausia kriterijaus indekso reikšme (žemesniu kriterijaus indeksu) hipotezėms tikrinti atrankos schemoje be pasikartojimo toje kriterijų klasėje, kuri atmeta hipotezę W( n, N), kur φ yra skaičiuojamo argumentų skaičiaus funkcija, o parametrai n, N kinta centrinėje srityje. Atsižvelgiant į tyrimo tikslą, buvo iškelti šie uždaviniai: - ištirti entropijos savybes ir Kullback - Leibler - Sanov informacijos atstumą diskretiesiems skirstiniams su skaičiuojamu rezultatų skaičiumi; - ištirti (0,4) formos statistikos didelių nukrypimų tikimybes; - ištirti simetrinės atskiriamos statistikos didelių nuokrypių (0,3) tikimybes, kurios netenkina Cramerio sąlygos; - rasti tokią statistiką, kad jos pagrindu sukurtas susitarimo kriterijus hipotezėms tikrinti apibendrintose paskirstymo schemose turi didžiausią indekso reikšmę formos kriterijų klasėje (0,7). Mokslinė naujovė: - pateikiama apibendrintos metrikos samprata - funkcija, kuri leidžia begalines reikšmes ir tenkina tapatumo, simetrijos ir trikampio nelygybės aksiomas. Surandama apibendrinta metrika ir nurodomos aibės, kuriose entropijos ir informacijos atstumo funkcijos, pateiktos diskrečiųjų skirstinių šeimoje su skaičiuojamu rezultatų skaičiumi, yra tolydžios šioje metrikoje; - apibendrintame skirstymo schemoje randama grubi (iki logaritminio ekvivalento) asimptotika formų (0,4) statistikos didelių nukrypimų tikimybei, tenkinančiai atitinkamą Kramerio sąlygos formą; - apibendrintoje paskirstymo schemoje randama grubi (iki logaritminio ekvivalentiškumo) asimptotika simetrinės atskiriamos statistikos didelių nuokrypių, neatitinkančių Kramerio sąlygos, tikimybių; - formos kriterijų klasėje (0,7) statomas kriterijus, turintis didžiausią kriterijaus indekso reikšmę. Mokslinė ir praktinė vertė. Straipsnyje išspręsta nemažai klausimų apie didelių nukrypimų tikimybių elgesį apibendrintose paskirstymo schemose. Gauti rezultatai gali būti panaudoti ugdymo procese matematinės statistikos ir informacijos teorijos specialybėse, tiriant statistines diskrečiųjų sekų analizės procedūras ir buvo panaudoti /3/, /21/ pagrindžiant vienos klasės saugumą. informacinių sistemų. Pateiktos gynybos nuostatos: - tikrinimo problemos, naudojant vieną kamuoliukų spalvų seką, sumažinimas, hipotezė, kad ši seka buvo gauta pasirinkus be pakeitimo iki kamuolių išnaudojimo iš urnos, kurioje yra dviejų kamuoliukų. spalvos, ir kiekvienas toks pasirinkimas turi tą pačią tikimybę, kad kriterijų sudarymas susitartų patikrinti hipotezes atitinkamame apibendrintame išdėstyme; - entropijos ir Kullback funkcijų tęstinumas - Leibleris - Sanovo informacijos atstumas begaliniame vienpusyje su įvestu logaritminiu apibendrintu metriku; - teorema apie grubią (iki logaritminio ekvivalento) simetrinės atskiriamos statistikos didelių nukrypimų, neatitinkančių Cramerio sąlygos, tikimybių asimptotikos apibendrintoje paskirstymo schemoje septyniais egzistenciniais atvejais;

Kullback-Leibler-Sanov informacijos atstumo tęstinumas

Apibendrintas paskirstymo schemas VF Kolčinas pristatė /24/. Eglės reikšmės daugianario schemoje buvo vadinamos ląstelių su r šūviais skaičiumi ir buvo išsamiai išnagrinėtos V. F. Kolchino, B. A. Sevastjanovo, V. P. Chistyakovo monografijoje /27/. Vertes apibendrintuose maketuose ištyrė VF Kolchin /25/,/26/. Formos (0,3) statistiką pirmasis apžvelgė Yu. I. Medvedevas /30/ ir ji buvo vadinama atskiriama (adityviai atskiriama) statistika. Jei funkcijos /„ in (0.3) nepriklauso nuo u, tokia statistika buvo vadinama /31/ simetriška atskiriama statistika. Atskiriamos statistikos momentų asimptotinę elgseną apibendrintose paskirstymo schemose GI Ivčenko gavo /9/. Apibendrintos paskirstymo schemos ribinės teoremos taip pat buvo nagrinėjamos /23/. Apžvalgas apie ribinių teoremų rezultatus ir tinkamumo gerumą diskrečiose tikimybinėse (0.2) tipo schemose pateikė V. A. Ivanovas, G. I. Ivčenka, Ju. I. Medvedevas /8/ ir G. I. Ivčenko, Ju. I. Medvedevas, A. F. Ronžinas. /14/. Apibendrintų maketų tinkamumo kriterijus svarstė A. F. Ronžinas /38/.

Šiuose darbuose statistinių testų savybių palyginimas atliktas santykinio asimptotinio efektyvumo požiūriu. Buvo nagrinėjamas artėjančių (gretutinių) hipotezių atvejis – efektyvumas Pitmano prasme ir nekonverguojančios hipotezės – efektyvumas Bahadur, Hodges – Lehman ir Chernov prasme. Ryšys tarp skirtingų statistinių testų santykinio atlikimo tipų aptariamas, pavyzdžiui, /49/. Kaip matyti iš Yu. I. Medvedevo rezultatų /31/ dėl atskiriamos statistikos pasiskirstymo polinominėje schemoje, chi kvadrato statistika pagrįstas testas turi didžiausią asimptotinę galią esant konverguojančioms hipotezėms atskiriamos statistikos klasėje rezultatų dažniai daugianario schemoje. Šį rezultatą A. F. Ronžinas apibendrino (0,2) tipo schemoms /38/. II Viktorova ir V. P. Čistjakovas /4/ sukonstravo optimalų daugianario schemos kriterijų eglės tiesinių funkcijų klasėje. A. F. Ronžinas /38/ sukonstravo kriterijų, kuris, esant alternatyvų sekai, nepriartėjančiai prie nulinės hipotezės, sumažina logaritminę tikimybės, kad pirmosios rūšies klaidos linkusios į nulį formos statistikos klasėje. (0,6). Santykinis chi kvadrato statistikos efektyvumas ir konverguojančių bei nekonverguojančių hipotezių maksimalaus tikimybių santykio palyginimas atliktas /54/. Disertaciniame darbe buvo nagrinėjamas nepriartėjimo prie hipotezių atvejis. Kriterijų santykinio statistinio efektyvumo tyrimas pagal nekonverguojančias hipotezes reikalauja ištirti superdidelių nuokrypių tikimybes – 0(y/n) eilės. Pirmą kartą tokią daugianario skirstinio su fiksuotu rezultatų skaičiu problemą išsprendė IN Sanov /40/. Tinkamumo kriterijų asimptotinis optimalumas, skirtas paprastų ir sudėtingų daugianario skirstinio hipotezių tikrinimui, esant baigtiniam rezultatų skaičiui su neprieinamomis alternatyvomis, buvo nagrinėjamas /48/. Informacinio nuotolio savybes anksčiau svarstė Kullbackas, Leibleris /29/,/53/ ir I. II. Sanovas /40/, taip pat Heffdingas /48/. Šiuose dokumentuose informacijos atstumo tęstinumas buvo nagrinėjamas baigtinių matmenų erdvėse Euklido metrikoje. Autorius taip pat svarstė erdvių seką su didėjančia dimensija, pavyzdžiui, Ju. V. Prochorovo /37/ arba V. I. Bogačiovo, A. V. Kolesnikovo /1/ kūryboje. Apytiksles (iki logaritminio ekvivalentiškumo) teoremas apie didelių atskiriamos statistikos nukrypimų tikimybę apibendrintose paskirstymo schemose Kramerio sąlyga gavo A. F. Roižinas /38/. A. N. Timaševas /42/,/43/ gavo tikslias (iki ekvivalentiškumo) daugiamates integralines ir lokalines ribines teoremas apie vektoriaus didelių nuokrypių tikimybes.

Didelių nuokrypių tikimybių tyrimas, kai Kramerio sąlyga neįvykdoma nepriklausomų atsitiktinių dydžių atveju, atliktas A. V. Nagajevo darbuose /35/. Konjuguotų skirstinių metodą aprašo Feleris /45/.

Statistines hipotezių tikrinimo ir parametrų įvertinimo atrankos schemoje be pakeitimo problemas kiek kitokioje formuluotėje nagrinėjo G. I. Ivčenko, V. V. Levinas, E. E. Timonina /10/, /15/, kur buvo išspręstos baigtinės populiacijos įvertinimo problemos, kai jo elementų skaičius yra nežinoma reikšmė, įrodytas daugiamatės S statistikos iš s nepriklausomų imčių asimptotinis normalumas atrankos schemoje be pakeitimo. Atsitiktinių dydžių, susijusių su pasikartojimais nepriklausomų bandymų sekose, tyrimo problemą nagrinėjo A. M. Zubkovas, V. G. Mikhailovas, A. M. Shoitovas /6/, /7/, /32/, /33/, /34/. Pagrindinių statistinių hipotezių vertinimo ir tikrinimo problemų analizę bendro Markovo-Pojos modelio rėmuose atliko G. I. Ivčenko, Ju. I. Medvedevas /13/, kurių tikimybinė analizė pateikta /11. /. Kombinatorinių objektų rinkinio, kuris nėra redukuojamas į apibendrintą paskirstymo schemą (0,2), nelygiaverčių matų patikslinimo metodas buvo aprašytas GI Ivchenko, Yu. I. Medvedev /12/. Nemažai tikimybių teorijos problemų, į kurias atsakymą galima gauti atlikus skaičiavimus naudojant rekursines formules, AM Zubkovas nurodo /5/.

Informacinis atstumas ir atskiriamos statistikos didelių nuokrypių tikimybės

Kai Cramerio sąlyga netenkinama, dideli atskiriamos statistikos nuokrypiai apibendrintoje paskirstymo schemoje nagrinėjamu septynių eksponentinių atveju nustatomi pagal vieno nepriklausomo nario nukrypimo tikimybę. Kai Cramerio sąlyga yra patenkinta, tai, kaip pabrėžiama /39/, taip nėra. 10 pastaba. Funkcija φ(x) yra tokia, kad matematinė viltis Ee (A) yra baigtinė, kai 0 t 1, ir begalinė, kai t 1. 11 pastaba. Atskiriamai statistikai, kuri neatitinka Cramerio sąlygos, riba (2.14) yra lygus 0, kas įrodo /39/ išreikšto spėjimo pagrįstumą. 12 pastaba. Chi kvadrato statistikai polinomo schemoje n, ./V - co, kad - A, iš teoremos tiesiogiai išplaukia, kad Šis rezultatas buvo gautas tiesiogiai /54/. Šiame skyriuje apibendrintų dalelių pasiskirstymo ląstelėse schemų centriniame parametrų diapazone yra apytikslė (iki logaritminio ekvivalentiškumo) didelių adityviai atskiriamos statistikos nukrypimų nuo langelių užpildymo ir ląstelių skaičiaus funkcijų asimptotika. buvo rastas duotas užpildas.

Jei Cramerio sąlyga tenkinama, tai grubią didelių nukrypimų tikimybių asimptotiką lemia grubi tikimybių asimptotika patekti į taškų seką su racionaliomis koordinatėmis, konverguojančiomis aukščiau nurodyta prasme į tašką, kuriame atitinkamos vertės ekstremumas. pasiekiamas informacinis atstumas.

Atsižvelgta į septynių eksponentinį Cramerio sąlygos neįvykdymo atsitiktinių dydžių f(i),..., f(x) atvejį, kur b, x yra nepriklausomi atsitiktiniai dydžiai, generuojantys apibendrintą skaidymo schemą (0,2). f(k) yra funkcija, apibrėžianti simetrišką adityviai atskiriamą statistiką (0.3). Tai yra, buvo daroma prielaida, kad funkcijos p(k) = - lnP(i = k) ir f(k) gali būti išplėstos iki reguliariai kintančių nuolatinio argumento funkcijų, kurių eilės atitinkamai p 0 ir q 0 ir p q. . Paaiškėjo, kad pagrindinį indėlį į apytikslę atskiriamos statistikos didelių nuokrypių tikimybių asimptotiką apibendrintose paskirstymo schemose įneša ir grubi paskirstymo tikimybės atitinkamai taškų sekai asimptotika. Įdomu pastebėti, kad anksčiau atskiriamos statistikos didelių nuokrypių tikimybių teorema buvo įrodyta balno taško metodu, o pagrindinį indėlį į asimptotiką įnešė vienas balno taškas. Atvejis liko neištirtas, kai, jei Cramerio sąlyga netenkinama, netenkinama 2 kN sąlyga.

Jei Cramerio sąlyga netenkinama, tai nurodyta sąlyga gali būti netenkinama tik p 1 atveju. Kaip tiesiogiai matyti iš atitinkamo tikimybių skirstinio logaritmo, Puasono skirstiniui ir geometriniam skirstiniui p=1. Iš didelių nukrypimų tikimybių asimptotikos rezultato, kai Kramerio sąlyga netenkinama, galime daryti išvadą, kad kriterijai, kurių statistika neatitinka Cramerio sąlygos, turi žymiai mažesnį sekundės klaidų tikimybių konvergencijos greitį iki nulio. natūra fiksuotai pirmos rūšies klaidos tikimybei ir nepriartėjusioms alternatyvoms, palyginti su kriterijais, kurių statistika atitinka Cramerio sąlygą. Tegul urna, kurioje yra N - 1 1 balti ir JV 1 juodi rutuliukai, pasirenkama be pakeitimo, kol ji bus išnaudota. Baltųjų rutuliukų padėtis pasirinkime 1 i\ ... r -i n - 1 susiekime su atstumų seka hi,..., h tarp gretimų baltų rutuliukų taip: Tada hv l,v =1, ... ,N,M EjLi i/ - n- Apibrėžkime vektorių aibės h = (hi,..., λg) tikimybių skirstinį, nustatydami V(hv = rv,v = l,... ,N) čia i,... ,lg - nepriklausomi neneigiami sveikieji atsitiktiniai dydžiai (r.v.), tai yra, nagrinėkime apibendrintą paskirstymo schemą (0.2). Vektoriaus h skirstinys priklauso nuo n,N, bet atitinkami indeksai, jei įmanoma, bus praleisti, kad būtų lengviau žymėti. 14 pastaba. Jei kiekvienam iš (]) kamuoliukų pasirinkimo iš urnos būdų priskiriama tokia pati tikimybė (\) mn bet kuriam r i,..., rg, kad rn 1,u = l,...,N , T,v=\ru = n, tikimybė, kad atstumai tarp gretimų baltų rutuliukų pasirinkime įgaus šias reikšmes

Kriterijai, pagrįsti ląstelių skaičiumi apibendrintame išdėstyme

Disertacinio darbo tikslas buvo sukonstruoti tinkamumo kriterijus hipotezėms tikrinti atrankos schemoje negrįžtant iš urnos, kurioje yra 2 spalvų kamuoliukai. Autorius nusprendė ištirti statistiką pagal atstumų tarp tos pačios spalvos kamuoliukų dažnį. Šioje formuluotėje problema buvo sumažinta iki hipotezių tikrinimo tinkamu apibendrintu išdėstymu.

Disertaciniame darbe buvo - ištirtos diskrečiųjų skirstinių entropijos savybės ir informacijos atstumas su neribotu rezultatų skaičiumi su ribotu matematiniu lūkesčiu; - gauta apytikslė (iki logaritminio ekvivalento) plačios statistikos klasės didelių nukrypimų tikimybių asimptotika apibendrintai paskirstymo schemoje; - remiantis gautais rezultatais, fiksuotai antrojo tipo klaidos tikimybei ir nepriartėjančioms alternatyvoms sukonstruojama kriterinė funkcija, turinti didžiausią logaritminį konvergencijos greitį iki pirmos rūšies paklaidos tikimybės nulio; - Įrodyta, kad statistiniai duomenys, kurie netenkina Cramerio sąlygos, turi mažesnį didelių nukrypimų tikimybės tendenciją nulį, palyginti su statistika, kuri tenkina tokią sąlygą. Darbo mokslinis naujumas yra toks. - pateikiama apibendrintos metrikos sąvoka - funkcija, kuri leidžia turėti begalines reikšmes ir tenkina tapatybės, simetrijos ir trikampio nelygybės aksiomas. Surandama apibendrinta metrika ir nurodomos aibės, kuriose entropijos ir informacijos atstumo funkcijos, pateiktos diskrečiųjų skirstinių šeimoje su skaičiuojamu rezultatų skaičiumi, yra tolydžios šioje metrikoje; - apibendrintame skirstymo schemoje randama grubi (iki logaritminio ekvivalento) asimptotika formų (0,4) statistikos didelių nukrypimų tikimybei, tenkinančiai atitinkamą Kramerio sąlygos formą; - apibendrintoje paskirstymo schemoje randama grubi (iki logaritminio ekvivalentiškumo) asimptotika simetrinės atskiriamos statistikos didelių nuokrypių, neatitinkančių Kramerio sąlygos, tikimybių; - formos kriterijų klasėje (0,7) statomas kriterijus, turintis didžiausią kriterijaus indekso reikšmę. Straipsnyje išspręsta nemažai klausimų apie didelių nukrypimų tikimybių elgesį apibendrintose paskirstymo schemose. Gauti rezultatai gali būti panaudoti ugdymo procese matematinės statistikos ir informacijos teorijos specialybėse, tiriant statistines diskrečiųjų sekų analizės procedūras ir buvo panaudoti /3/, /21/ pagrindžiant vienos klasės saugumą. informacinių sistemų. Tačiau nemažai klausimų lieka atviri. Autorius apsiribojo centrinės pokyčių zonos svarstymu parametrai n, N apibendrintos schemos n dalelių išdėstymui /V ląstelėse. Jei atsitiktinių dydžių skirstinio, generuojančio apibendrintą paskirstymo schemą (0,2), nešėjas nėra r, r 4-1, r + 2,... formos aibė, tai įrodant informacijos atstumo funkcijos tęstinumą ir tiriant didelių nukrypimų tikimybes, būtina atsižvelgti į tokio nešiklio aritmetinę struktūrą, kuri nebuvo nagrinėjama autoriaus darbe. Praktiniam kriterijų, sukurtų remiantis pasiūlyta funkcija su didžiausia indekso reikšme, pritaikymui, reikia ištirti jos pasiskirstymą tiek pagal nulinę hipotezę, tiek pagal alternatyvas, įskaitant konverguojančias. Taip pat įdomu perkelti sukurtus metodus ir apibendrinti gautus rezultatus į kitas tikimybines schemas, išskyrus apibendrintas paskirstymo schemas. Jei //1,/ 2,-.. yra atstumų tarp rezultato skaičių 0 dvinarėje schemoje su baigčių tikimybėmis рї 1 -POj dažniai, tai galima parodyti, kad šiuo atveju įrodyta /26 /, iš to išplaukia, kad pasiskirstymas (3.3), apskritai kalbant, negali būti pavaizduotas kaip bendras z reikšmių pasiskirstymas bet kurioje apibendrintoje dalelių patalpinimo ląstelėse schemoje. Šis skirstinys yra ypatingas paskirstymo atvejis kombinatorinių objektų rinkinyje, įvestas /12/. Atrodo, kad yra neatidėliotinas uždavinys perkelti apibendrintų maketų disertacinio darbo rezultatus į šią bylą, kuri buvo aptarta /52/.

Įkeliama...