ecosmak.ru

Fonksiyonların asimptotik davranışı. sonsuz küçük fonksiyonların karşılaştırılması

belirtildiği gibi önceki bölüm Birçok durumda klasik algoritmaların incelenmesi, matematiksel istatistiğin asimptotik yöntemleri, özellikle CLT ve yakınsaklığın kalıtım yöntemleri kullanılarak gerçekleştirilebilir. Klasik matematiksel istatistiklerin uygulamalı araştırmanın ihtiyaçlarından ayrılması, özellikle yaygın monografilerin, özellikle iki örnekli istatistiklerin incelenmesi için gerekli matematiksel aparatlardan yoksun olmasıyla kendini göstermektedir. Mesele şu ki, sınıra tek bir parametreyle değil, iki parametreyle - iki numunenin hacmiyle - gitmeniz gerekiyor. Monografimizde ortaya koyduğumuz uygun bir teori - yakınsama mirası teorisi - geliştirmemiz gerekiyordu.

Ancak böyle bir çalışmanın sonuçlarının sınırlı örneklem büyüklüklerine uygulanması gerekecektir. Böyle bir geçişle bağlantılı olarak bir sürü sorun ortaya çıkıyor. Bunlardan bazıları, belirli dağılımlardan alınan örneklerden oluşturulan istatistiklerin özelliklerinin incelenmesiyle bağlantılı olarak tartışıldı.

Ancak başlangıç ​​varsayımlarından sapmaların istatistiksel prosedürlerin özellikleri üzerindeki etkisi tartışılırken ek sorunlar ortaya çıkar. Hangi sapmalar tipik olarak kabul edilir? Algoritmaların özelliklerini en çok bozan en “zararlı” sapmalara mı odaklanmalıyız yoksa “tipik” sapmalara mı odaklanmalıyız?

İlk yaklaşımla garantili bir sonuç elde ederiz ancak bu sonucun “bedeli” çok yüksek olabilir. Örnek olarak CLT'deki hata için evrensel Berry-Esseen eşitsizliğini gösterelim. A.A. kesinlikle haklı olarak vurguluyor. Borovkov, "gerçek problemlerde yakınsama hızının kural olarak daha iyi olduğunu" söyledi.

İkinci yaklaşımda hangi sapmaların “tipik” kabul edildiği sorusu ortaya çıkıyor. Büyük miktarda gerçek veriyi analiz ederek bu soruyu cevaplamaya çalışabilirsiniz. Farklı araştırma gruplarının cevaplarının, örneğin makalede verilen sonuçlardan da görülebileceği gibi farklılık göstermesi oldukça doğaldır.

Yanlış fikirlerden biri, olası sapmaları analiz ederken yalnızca belirli bir parametrik aileyi kullanmaktır - Weibull-Gnedenko dağılımları, üç parametreli gama dağılımları ailesi vb. 1927'de Acad. SSCB Bilimler Akademisi S.N. Bernstein, tüm ampirik dağılımların dört parametreli Pearson ailesine indirgenmesinin metodolojik hatasını tartıştı. Bununla birlikte, parametrik istatistik yöntemleri, özellikle uygulamalı bilim adamları arasında hala çok popülerdir ve bu yanlış anlamanın suçu öncelikle istatistiksel yöntem öğretmenlerine aittir (makalenin yanı sıra aşağıya bakınız).

15. Belirli bir hipotezi test etmek için birçok kriterden birini seçmek

Çoğu durumda, belirli bir pratik sorunu çözmek için birçok yöntem geliştirilmiştir ve matematiksel araştırma yöntemlerinde uzman bir sorunla karşı karşıya kalır: Uygulamalı bilim insanına belirli verileri analiz etmek için hangisi önerilmelidir?

Örnek olarak, iki bağımsız numunenin homojenliğini test etme problemini düşünün. Bildiğiniz gibi, bunu çözmek için birçok kriter sunabilirsiniz: Öğrenci, Cramer-Welch, Lord, ki-kare, Wilcoxon (Mann-Whitney), Van der Waerden, Savage, N.V. Smirnov, omega-kare tipi (Lehman) -Rozenblatt), G.V. Martynov, vb. Hangisini seçmelisiniz?

Doğal olarak akla “oylama” fikri geliyor: Birçok kriteri kontrol edip ardından “çoğunlukla” karar vermek. İstatistik teorisi açısından bakıldığında, böyle bir prosedür basitçe başka bir kriterin oluşturulmasına yol açar; bu, öncekilerden daha iyi değildir, ancak incelenmesi daha zordur. Öte yandan, eğer çözümler, farklı ilkelere dayalı olarak dikkate alınan tüm istatistiksel kriterlere göre çakışıyorsa, bu durum, kararlılık kavramına uygun olarak, ortaya çıkan genel çözüme olan güveni artırır.

Özellikle matematikçiler arasında optimal yöntemleri, çözümleri vb. aramanın gerekliliği konusunda yanlış ve zararlı bir görüş yaygındır. Gerçek şu ki, başlangıçtaki öncüllerden saptığınızda genellikle optimallik ortadan kalkar. Bu nedenle, matematiksel beklentinin bir tahmini olarak aritmetik ortalama, yalnızca başlangıç ​​dağılımı normal olduğunda optimaldir; matematiksel beklenti mevcut olduğu sürece her zaman geçerli bir tahmindir. Öte yandan, keyfi olarak seçilen herhangi bir tahmin veya hipotez testi yöntemi için, optimallik kavramını, söz konusu yöntemin - özel olarak seçilmiş bu bakış açısına göre - optimal hale gelmesini sağlayacak şekilde formüle etmek genellikle mümkündür. Örneğin örnek medyanı matematiksel beklentinin bir tahmini olarak ele alalım. Elbette ki optimaldir, ancak aritmetik ortalamadan farklı bir anlamdadır (normal dağılım için optimaldir). Yani Laplace dağılımı için örnek medyan maksimum olasılık tahminidir ve bu nedenle optimaldir (monografide belirtilen anlamda).

Monografide homojenlik kriterleri analiz edildi. Kriterleri karşılaştırmaya yönelik, Bahadur, Hodges-Lehman ve Pitman'a göre asimptotik bağıl etkinliğe dayanan çeşitli doğal yaklaşımlar vardır. Ve alternatifler kümesindeki karşılık gelen alternatif veya uygun dağılım verildiğinde her kriterin optimal olduğu ortaya çıktı. Bu durumda, matematiksel hesaplamalar genellikle gerçek istatistiksel verilerin analizinde nispeten nadir görülen kaydırma alternatifini kullanır (Wilcoxon testiyle bağlantılı olarak bu alternatif tarafımızdan tartışılmış ve eleştirilmiştir). Sonuç üzücü - gösterilen mükemmel matematiksel teknik, gerçek verileri analiz ederken homojenliği test etmek için bir kriter seçme konusunda önerilerde bulunmamıza izin vermiyor. Başka bir deyişle, uygulama çalışanının işi açısından, yani. Belirli verilerin analizi, monografi işe yaramaz. Ne yazık ki, bu monografinin yazarının matematikteki parlak ustalığı ve gösterdiği muazzam titizlik uygulamaya hiçbir şey getirmedi.

Elbette pratikte çalışan her istatistikçi, şu ya da bu şekilde, istatistiksel bir kriter seçme sorununu kendisi çözer. Bir takım metodolojik değerlendirmelere dayanarak, herhangi bir alternatifle tutarlı olan omega-kare (Lehman-Rosenblatt) kriterini seçtik. Ancak bu tercihin gerekçesinin olmayışı nedeniyle bir tatminsizlik duygusu varlığını sürdürüyor.

Tanım. Sıfırdan farklı bir vektörün belirlediği yöne denir. asimptotik yön ikinci derece çizgisine göre, eğer herhangi bu yöndeki (yani vektöre paralel) bir düz çizginin ya çizgiyle en fazla bir ortak noktası vardır ya da bu çizginin içinde yer alır.

? İkinci dereceden bir çizgi ile asimptotik yöndeki bir düz çizginin bu doğruya göre kaç ortak noktası olabilir?

İkinci dereceden doğruların genel teorisinde kanıtlanmıştır ki eğer

Daha sonra sıfır olmayan vektör ( çizgiye göre asimptotik yönü belirtir)

(asimptotik yön için genel kriter).

İkinci dereceden hatlar için

eğer ise asimptotik yön yoktur,

eğer o zaman iki asimptotik yön varsa,

eğer o zaman sadece bir asimptotik yön varsa.

Aşağıdaki lemmanın yararlı olduğu ortaya çıkıyor ( Parabolik tipte bir çizginin asimptotik yönü için kriter).

Lemma . Parabolik tipte bir doğru olsun.

Sıfır olmayan vektörün asimptotik bir yönü vardır

nispeten . (5)

(Sorun: Lemmayı kanıtlayın.)

Tanım. Asimptotik yönün düz çizgisine denir asimptot ikinci dereceden çizgi, eğer bu çizgi onunla kesişmiyorsa veya onun içinde yer alıyorsa.

Teorem . 'ye göre asimptotik bir yöne sahipse, vektöre paralel asimptot denklemle belirlenir.

Tabloyu dolduralım.

GÖREVLER.

1. Aşağıdaki ikinci dereceden çizgiler için asimptotik yönlerin vektörlerini bulun:

4 - hiperbolik tip iki asimptotik yön.

Asimptotik yön kriterini kullanalım:

Bu 4 doğrusuna göre asimptotik bir yöne sahiptir.

=0 ise =0 yani sıfırdır. Sonra Bölerek Buluyoruz ikinci dereceden denklem: , burada t = . Bu ikinci dereceden denklemi çözüyoruz ve iki çözüm buluyoruz: t = 4 ve t = 1. Sonra doğrunun asimptotik yönleri .

(Çizgi parabolik tipte olduğundan iki yöntem düşünülebilir.)

2. Koordinat eksenlerinin ikinci dereceden çizgilere göre asimptotik yönlere sahip olup olmadığını öğrenin:

3. İkinci dereceden doğrunun genel denklemini yazınız.

a) x ekseninin asimptotik bir yönü vardır;

b) Her iki koordinat ekseni de asimptotik yönlere sahiptir;

c) Koordinat eksenleri asimptotik yönlere sahiptir ve O doğrunun merkezidir.

4. Doğruların asimptot denklemlerini yazın:

a) ng w:val="EN-US"/>sen=0"> ;

5. İkinci dereceden bir doğrunun paralel olmayan iki asimptotu varsa, bunların kesişme noktasının bu doğrunun merkezi olduğunu kanıtlayın.

Not: Paralel olmayan iki asimptot olduğundan, iki asimptotik yön vardır ve bu nedenle çizgi merkezidir.

Asimptotların denklemlerini yazın Genel görünüm ve merkezi bulmak için bir sistem. Her şey net.

6.(No. 920) A(0, -5) noktasından geçen ve asimptotları x – 1 = 0 ve 2x – y + 1 = 0 olan bir hiperbolün denklemini yazın.

Not. Önceki problemdeki ifadeyi kullanın.

Ev ödevi . , No. 915 (c, e, f), No. 916 (c, d, e), No. 920 (zamanınız yoksa);

Beşikler;

Silaev, Timoşenko. Pratik görevler geometride,

1. Yarıyıl. S.67, sorular 1-8, s.70, sorular 1-3 (sözlü).

İKİNCİ DERECE HATLARIN ÇAPLARI.

BAĞLI ÇAPLAR.

Bir afin koordinat sistemi verilmiştir.

Tanım. Çap 'ye göre asimptotik olmayan yöndeki bir vektöre eşlenik ikinci dereceden bir çizgi, vektöre paralel olan doğrunun tüm kirişlerinin orta noktalarının kümesidir.

Ders sırasında çapın düz bir çizgi olduğu kanıtlandı ve denklemi elde edildi

Öneriler: Nasıl oluşturulduğunu (bir elips üzerinde) gösterin (asimptotik olmayan bir yön belirleriz; bu yönde çizgiyle kesişen [iki] düz çizgi çizeriz; kesilecek kirişlerin orta noktalarını buluruz; orta noktalar - bu çaptır).

Tartışmak:

1. Çapı belirlerken neden asimptotik olmayan bir yönün vektörü alınır? Cevap veremezlerse, örneğin bir parabolün çapını bulmalarını isteyin.

2. İkinci dereceden herhangi bir doğrunun en az bir çapı var mıdır? Neden?

3. Ders sırasında çapın düz bir çizgi olduğu kanıtlandı. Şekilde hangi akorun orta noktası M noktasıdır?


4. Denklem (7)'deki parantezlere bakın. Size neyi hatırlatıyorlar?

Sonuç: 1) her merkez, her çapa aittir;

2) Merkezlerin bir çizgisi varsa, o zaman tek bir çap vardır.

5. Parabolik bir çizginin çapları hangi yöndedir? (Asimptotik)

Kanıt (muhtemelen derste).

Denklem (7') ile verilen çap d'nin asimptotik olmayan yöndeki bir vektöre eşlenik olmasına izin verin. Daha sonra yön vektörü

(-(), ). Bu vektörün asimptotik bir yöne sahip olduğunu gösterelim. Parabolik tipte bir çizgi için asimptotik yön vektörü kriterini kullanalım (bkz. (5)). Değiştirelim ve emin olalım (bunu unutmayın.

6. Bir parabolün çapı kaçtır? Göreceli konumları mı? Geriye kalan parabolik çizgilerin çapı kaçtır? Neden?

7. Bazı ikinci derece çizgi çiftlerinin toplam çapının nasıl oluşturulacağı (aşağıdaki 30, 31. sorulara bakınız).

8. Tabloyu dolduruyoruz ve mutlaka çizim yapıyoruz.

1. . Vektöre paralel tüm akorların orta noktalarının kümesi için bir denklem yazın

2. Doğrunun K(1,-2) noktasından geçen d çapının denklemini yazın.

Çözüm adımları:

1. yöntem.

1. Türü belirleyin (bu çizginin çaplarının nasıl davrandığını bilmek).

Bu durumda çizgi merkezdedir, bu durumda tüm çaplar C merkezinden geçer.

2. K ve C noktalarından geçen düz bir çizginin denklemini oluşturuyoruz. Bu istenen çaptır.

2. yöntem.

1. D çapının denklemini (7`) formunda yazıyoruz.

2. K noktasının koordinatlarını bu denklemde yerine koyarsak, vektör eşleniğinin koordinatları ile d çapı arasındaki ilişkiyi buluruz.

3. Bulunan bağımlılığı dikkate alarak bu vektörü belirledik ve d çapı için bir denklem oluşturduk.

Bu problemde ikinci yöntemi kullanarak hesaplama yapmak daha kolaydır.

3. . X eksenine paralel çapın denklemini yazın.

4. Çizginin kestiği akorun orta noktasını bulun

x + 3y – 12 =0 düz çizgisi üzerinde.

Çözüme yönelik talimatlar: Tabii ki, düz çizgi ile çizgi verilerinin kesişme noktalarını ve ardından ortaya çıkan parçanın ortasını bulabilirsiniz. Örneğin x +3y – 2009 =0 denklemine sahip bir doğruyu alırsak, bunu yapma isteği ortadan kalkar.

İÇİNDE modern koşullar Biyoloji, dil bilimi, ekonomi ve tabii ki BT gibi tamamen farklı alanlarda veri analizine olan ilgi sürekli ve yoğun bir şekilde artıyor. Bu analizin temeli istatistiksel yöntemlerdir ve kendine saygısı olan her veri madenciliği uzmanının bunları anlaması gerekir.

Ne yazık ki, hem matematiksel olarak kesin kanıtlar hem de net sezgisel açıklamalar sağlayabilen gerçekten iyi bir edebiyat çok yaygın değildir. Ve bence bu dersler, olasılık teorisini tam da bu nedenle anlayan matematikçiler için alışılmadık derecede iyi. Alman Christian-Albrecht Üniversitesi'nde Matematik ve Finansal Matematik programlarında yüksek lisans eğitimleri verilmektedir. Ve bu konunun yurt dışında nasıl öğretildiğini merak edenler için bu dersleri tercüme ettim. Çeviri yapmam birkaç ay sürdü; dersleri resimlerle, alıştırmalarla ve bazı teoremlere ilişkin dipnotlarla sulandırdım. Profesyonel bir çevirmen olmadığımı, bu alanda sadece fedakar ve amatör olduğumu, dolayısıyla yapıcı olan her türlü eleştiriyi kabul edeceğimi belirtmek isterim.

Kısaca derslerin konusu şu:


Koşullu matematiksel beklenti

Bu bölüm doğrudan istatistikle ilgili değildir, ancak çalışmaya başlamak için idealdir. Koşullu beklenti, halihazırda mevcut olan bilgilere dayanarak rastgele bir sonucu tahmin etmek için en iyi seçimdir. Ve bu aynı zamanda bir rastgele değişkendir. Burada doğrusallık, monotonluk, monoton yakınsaklık ve diğerleri gibi çeşitli özelliklerini göz önünde bulunduruyoruz.

Nokta Tahmininin Temelleri

Dağıtım parametresi nasıl tahmin edilir? Bunun için hangi kriteri seçmeliyim? Hangi yöntemleri kullanmalıyım? Bu bölüm tüm bu soruların yanıtlanmasına yardımcı olacaktır. Burada tarafsız tahminci ve tekdüze tarafsız minimum varyans tahmincisi kavramlarını tanıtıyoruz. Ki-kare ve t-dağılımlarının nereden geldiğini ve normal dağılım parametrelerinin tahmin edilmesinde neden önemli olduklarını açıklar. Rao-Kramer eşitsizliğinin ve Fisher bilgisinin ne olduğunu açıklar. İyi bir tahmin elde etmeyi büyük ölçüde kolaylaştıran üstel aile kavramı da tanıtılmıştır.

Bayesian ve minimax parametre tahmini

Burada değerlendirmeye farklı bir felsefi yaklaşım anlatılmaktadır. Bu durumda parametre bilinmeyen olarak kabul edilir çünkü bu, bilinen (a priori) dağılıma sahip belirli bir rastgele değişkenin gerçekleşmesidir. Deneyin sonucunu gözlemleyerek parametrenin sonsal dağılımını hesaplıyoruz. Buna dayanarak, kriterin ortalama minimum kayıp olduğu bir Bayes tahmincisi veya mümkün olan maksimum kaybı en aza indiren bir minimax tahmincisi elde edebiliriz.

Yeterlilik ve tamlık

Bu bölümün ciddi pratik önemi vardır. Yeterli bir istatistik, parametreyi tahmin etmek için yalnızca bu fonksiyonun sonucunu depolamanın yeterli olacağı şekilde numunenin bir fonksiyonudur. Bu tür pek çok işlev vardır ve bunların arasında minimum yeterli istatistikler de vardır. Örneğin, normal bir dağılımın medyanını tahmin etmek için yalnızca bir sayıyı (tüm numunenin aritmetik ortalamasını) depolamak yeterlidir. Bu aynı zamanda Cauchy dağıtımı gibi diğer dağıtımlar için de geçerli mi? Yeterli istatistik, tahmin seçiminde nasıl yardımcı olur? Burada bu soruların cevaplarını bulabilirsiniz.

Tahminlerin asimptotik özellikleri

Bir değerlendirmenin belki de en önemli ve gerekli özelliği tutarlılığı, yani örneklem büyüklüğü arttıkça doğru bir parametreye yönelmesidir. Bu bölümde, önceki bölümlerde açıklanan istatistiksel yöntemlerle elde ettiğimiz, bildiğimiz tahminlerin hangi özelliklere sahip olduğu açıklanmaktadır. Asimptotik tarafsızlık, asimptotik verimlilik ve Kullback-Leibler mesafesi kavramları tanıtılmaktadır.

Test Temelleri

Bilinmeyen bir parametrenin nasıl tahmin edileceği sorusuna ek olarak, bir şekilde gerekli özellikleri karşılayıp karşılamadığını da kontrol etmeliyiz. Örneğin yeni bir ilacı test etmek için bir deney yapılıyor. İyileşme olasılığının eski ilaçları kullanmaya göre daha yüksek olup olmadığını nasıl anlarsınız? Bu bölümde bu tür testlerin nasıl oluşturulduğu açıklanmaktadır. En güçlü testin ne olduğunu, Neyman-Pearson testini, anlamlılık düzeyini, güven aralığını ve iyi bilinen Gauss testi ile t testinin nereden geldiğini öğreneceksiniz.

Kriterlerin asimptotik özellikleri

Değerlendirmeler gibi kriterlerin de belirli asimptotik özellikleri karşılaması gerekir. Bazen gerekli kriteri oluşturmanın imkansız olduğu durumlar ortaya çıkabilir, ancak iyi bilinen merkezi limit teoremini kullanarak gerekli olana asimptotik olarak yönelen bir kriter oluştururuz. Burada asimptotik anlamlılık düzeyinin ne olduğunu, olabilirlik oranı yöntemini ve Bartlett testi ile ki-kare bağımsızlık testinin nasıl oluşturulduğunu öğreneceksiniz.

Doğrusal model

Bu bölüm bir tamamlayıcı olarak, yani doğrusal regresyon durumunda istatistiğin uygulanması olarak görülebilir. Hangi notların iyi olduğunu ve hangi koşullar altında olduğunu anlayacaksınız. En küçük kareler yönteminin nereden geldiğini, testlerin nasıl oluşturulacağını ve F dağılımının neden gerekli olduğunu öğreneceksiniz.

Bir fonksiyonun belirli bir a noktası (sonlu veya sonsuz) yakınındaki asimptotik davranışı (veya asimptotikleri), x argümanı bu noktaya yöneldiğinden fonksiyonun değişiminin doğası olarak anlaşılır. Genellikle bu davranışı, a noktasının yakınında ilgilendiğimiz fonksiyondaki değişikliği yeterli doğrulukla tanımlayan veya davranışını bir taraftan veya diğer taraftan değerlendiren, daha basit ve üzerinde çalışılmış başka bir fonksiyon kullanarak temsil etmeye çalışırlar. Bu bağlamda, a noktası yakınındaki iki fonksiyonun değişiminin doğasının, bölümlerinin dikkate alınmasıyla ilişkili olarak karşılaştırılması sorunu ortaya çıkar. Özellikle ilgi çekici olan, x a için her iki fonksiyonun ya sonsuz küçük (sonsuz küçük) ya da sonsuz büyük (sonsuz büyük) olduğu durumlardır. 10.1. Sonsuz küçük fonksiyonların karşılaştırılması B.m.'yi karşılaştırmanın temel amacı. Fonksiyonlar x a noktasında sıfıra yaklaşmalarının doğasını veya sıfıra yaklaşma hızlarını karşılaştırmayı içerir. Bırakın b.m. x a için a(i) ve P(x) fonksiyonları, a noktasının bazı delinmiş komşuluklarında (a) sıfır değildir ve a noktasında sıfıra eşittirler veya tanımlı değildirler. Tanım 10.1. a(x) ve 0(x) fonksiyonlarına b.m denir. a için aynı sıradadır ve O (/?(«)) cinsinden og(a:) = yazın (O sembolü “O büyük” olarak okunur), eğer x a'da a oranının sıfır olmayan bir sonlu limiti varsa (x)//?( i), yani Açıkçası, o zaman (7.24)'e göre, Βi € R\(0) ve X^a0[a(x) gösterimi geçerlidir).O sembolü şu özelliğe sahiptir: geçişliliğin, yani eğer - aslında, Tanım 10.1'i ve sonlu (bu durumda sıfır olmayan) limitlere sahip fonksiyonların çarpımının özelliğini (bkz. (7.23)) dikkate alarak, FONKSİYONLARIN ASİMPTOTİK DAVRANIŞINI elde ederiz. Tanım 10.2 Fonksiyon a(x), x a için (3(x)'e (veya /3(x'e göre) göre) kıyasla daha yüksek derecede küçük bir bm çağırır ve yazar) (o sembolü io küçükse okunur) a oranının limiti mevcuttur ve sıfıra eşittir. Bu durumda ayrıca bir fonksiyonun x a için a(x) ile karşılaştırıldığında daha düşük düzeyde küçük olduğu söylenir ve küçüklük kelimesi genellikle atlanır (durumda olduğu gibi) Tanım 10.2'de daha yüksek düzeydedir.Bu, eğer lim (o zaman /)(x) fonksiyonu, Tanım 10.2'ye göre b.m. x a ve a(i) için a(x) ile karşılaştırıldığında daha yüksek mertebeden b.m'dir. x a için /3(x) ile karşılaştırıldığında daha düşük sıralıdır, çünkü bu durumda lijTi (fi(x)/ot(x)) . Yani bir fonksiyon, limiti ve b.m arasındaki bağlantı hakkında Teorem 7.3'e göre yazabiliriz. (10.3)'teki fonksiyonlardan ot)'un bir fonksiyon olduğu sonucu çıkar, b.m. en. Dolayısıyla a(x), yani. değerler |a(z)| x'in a'ya yakın olması için çok daha az değer\0(x)\. Başka bir deyişle, a(x) fonksiyonu sıfıra doğru yönelir daha hızlı işlevler/?(X). Teorem 10.1. Herhangi bir b.m.'nin ürünü. x a için a(x) ve P(x)) fonksiyonları a noktasının bazı delinmiş mahallelerinde sıfırdan farklıdır, x-¥a b.m için vardır. faktörlerin her birine kıyasla daha yüksek mertebeden bir fonksiyon. Nitekim 10.2 b.m.'nin tanımına göre. daha yüksek mertebeden (Tanım 7.10 b.m. fonksiyonları dikkate alındığında), eşitlikler teoremin geçerliliği anlamına gelir. O ve o sembollerini içeren eşitliklere bazen asimptotik tahminler denir. Tanım 10.3. ot(x) ve /3(x) fonksiyonlarına eşsiz b.m adı verilir. x -¥ a için, eğer oranlarında ne sonlu ne de sonsuz bir limit varsa; if $ lim a(x)/0(x) (p £ ve ayrıca $ lim 0(x)/a(x)). Örnek 10.1. A. Tanım gereği a(x) = x ve /?(x) = sin2ar fonksiyonları 10.1 - b.m. (b) dikkate alındığından beri x 0'da aynı mertebedendir. a(x) = 1 -coss fonksiyonu, 10.2 tanımı gereği, x 0'daki 0(x) = x ile karşılaştırıldığında daha yüksek mertebeden b.m.'dir, çünkü c dikkate alındığında a(zz) = \/x fonksiyonu x 0 için fl(x) = x ile karşılaştırıldığında daha düşük bir mertebededir, çünkü g. Tanım 10.3'e göre a(s) = = x fonksiyonları karşılaştırılamaz x 0'da b.m., limitten beri FONKSİYONLARIN ASİMPTOTİK DAVRANIŞI Sonsuz küçük fonksiyonların karşılaştırması mevcut değildir (ne sonlu ne de sonsuz - bkz. örnek 7.5).Üssü n 6 N olan, n > 1 olan bir x11 kuvvet fonksiyonu, x ve b.m'dedir. xn~1) ile karşılaştırıldığında daha yüksek bir mertebede yani. yapa = ao(a:n"*1), çünkü lim (xL/xn"1) = Gerekirse, daha doğru karşılaştırmalı özellikler davranış b.m. x için işlevler - ve bunlardan biri bir tür standart olarak seçilir ve ana işlev olarak adlandırılır. Tabii ki, ana b.m.'nin seçimi. bir dereceye kadar keyfidir (daha basit olanı seçmeye çalışırlar: x -*0 için x; x -41 için x-1; x ->oo için 1/x, vb.). 0k(x) dereceden itibaren ana b.m. Farklı k > 0 üstellerine sahip /)(x) fonksiyonları (k ^ 0 için 0k(x) bir b.m. değildir) daha karmaşık bir b.m.'yi tahmin etmek için bir karşılaştırma bağı oluşturur. a(z) fonksiyonları. Tanım 10.4. a(z) fonksiyonuna b.m denir. x a için (3(x)'e göre k'inci küçüklük mertebesindedir ve eğer a(z) ve /Zk(x) fonksiyonları x a) için aynı mertebedeyse k sayısı küçüklük mertebesindedir; Not: 1) bir b.m. fonksiyonunun diğerine göre sırası k herhangi bir pozitif sayı olabilir; 2) a(x) fonksiyonunun /3('e göre sırası ise x) k'ye eşitse, bu durumda P(x) fonksiyonunun a(x)'e göre sırası 1/k'ye eşit olur; 3) bm fonksiyonu a( için belirli bir k sırasını belirtmek her zaman mümkün değildir. x), hatta /?*(x'in tüm kuvvetleriyle karşılaştırılabilir) Örnek 10.2.a. Tanım 10.4'e göre cosx fonksiyonu, x 0 için 0(x) = x'e göre k = 2 düzeyinde bm'dir, b'yi hesaba kattığımız için.Fonksiyonları ele alalım.Bunu herhangi bir Reel için (7.32'ye göre) gösterelim.Böylece x -» + 0 için bm fonksiyonu a1/1, herhangi bir k > 0 için xk ile karşılaştırılabilir, ancak bu fonksiyonun x'e göre küçüklük sırasını belirtmek mümkün değildir. # Bir bm fonksiyonunun diğerine göre sırasını belirlemek her zaman basit değildir. Aşağıdaki prosedürü önerebiliriz: 1) limit işaretinin altına yazın a(x)/0k(x)\ ilişkisi 2) yazılı ilişkiyi analiz edin ve onu basitleştirmeye çalışın; 3) bilinen sonuçlara dayanarak, sıfır olmayan bir sonlu limitin olacağı olası j) değeri hakkında bir varsayımda bulunun ; 4) Limiti hesaplayarak varsayımı kontrol edin. Örnek 10.3. B.m.'nin sırasını belirleyelim. x -» 0 için x'e göre tgx - sin x fonksiyonları FONKSİYONLARIN ASİMPTOTİK DAVRANIŞINA sahip olacak şekilde k > O sayısını bulalım. Sonsuz küçük fonksiyonların karşılaştırılması. Bu aşamada x 0 için (7.35) ve (7.36), (sinx)/x 1 ve cosx -> 1 olduğunu bilerek ve (7.23) ve (7.33)'ü hesaba katarak bu koşulu belirleyebiliriz ( 10.7) k = 3'te yerine gelecektir. Aslında, k = 3'teki limitin doğrudan hesaplanması A = 1/2 değerini verir: k > 3 için sonsuz bir limit elde ettiğimizi ve limitte bunun eşit olacağını unutmayın. sıfıra.

480 ovmak. | 150 UAH | $7,5 ", MOUSEOFF, FGCOLOR, "#FFFFCC",BGCOLOR, "#393939");" onMouseOut="return nd();"> Tez - 480 RUR, teslimat 10 dakika, günün her saati, haftanın yedi günü ve tatil günleri

Kolodzey Alexander Vladimirovich. Genelleştirilmiş bir yerleştirme şemasındaki hücrelerin doldurulmasına dayalı, geri dönüşü olmayan bir seçim şemasındaki hipotezleri test etmek için anlaşma kriterlerinin asimptotik özellikleri: tez... Fiziksel ve Matematik Bilimleri Adayı: 01.01.05.- Moskova, 2006.- 110 pp.: hasta. RSL OD, 61 07-1/496

giriiş

1 Entropi ve bilgi mesafesi 36

1.1 Temel tanımlar ve gösterimler 36

1.2 Sınırlı matematiksel beklentiye sahip ayrık dağılımların entropisi 39

1.3 Bir dizi ayrık dağılıma ilişkin logaritmik genelleştirilmiş metrik 43

1.4 Sayılabilir argümanlar dizisine sahip fonksiyonların kompaktlığı. 46

1.5 Bilgi mesafesinin sürekliliği Kullback - Leibler - Sanov 49

1.6 Sonuçlar 67

2 Büyük sapma olasılıkları 68

2.1 Belirli bir dolgu ile hücre sayısından büyük fonksiyon sapma olasılıkları 68

2.1.1 Yerel limit teoremi 68

2.1.2 İntegral limit teoremi 70

2.1.3 Bilgi mesafesi ve ayrılabilir istatistiklerin büyük sapma olasılıkları 75

2.2 Cramer koşulunu karşılamayan ayrılabilir istatistiklerdeki büyük sapmaların olasılıkları 81

2.3 Sonuçlar 90

3 Uyum iyiliği kriterlerinin asimptotik özellikleri 92

3.1 İade tasarımı olmadan seçim için onay kriterleri. 92

3.2 Uyum iyiliği kriterlerinin asimptotik göreceli etkinliği 94

3.3 Genelleştirilmiş yerleşimlerdeki hücre sayısına dayalı kriterler 95

3.4 Sonuçlar 98

Sonuç 99

Edebiyat 103

Çalışmaya giriş

Araştırmanın amacı ve konunun alaka düzeyi. Ayrık dizilerin istatistiksel analizi teorisinde, muhtemelen karmaşık bir sıfır hipotezini test etmek için uyum iyiliği kriterleri tarafından özel bir yer işgal edilir; bu, rastgele bir dizi pQ)?=i için öyledir:

Хі Є Ім,і= 1,...,n, Ім = (о, і,..., M), herhangi bir і = 1,..., n için ve herhangi bir k Є їm olay olasılığı için ( Хі = k) r'ye bağlı değildir Bu, (Хі)f =1 dizisinin bir anlamda durağan olduğu anlamına gelir.

Bir numarada uygulamalı problemler(X() =1 dizisi olarak, rik - 1 > 0 k renginde toplar içeren bir torbadan tükenene kadar geri dönmeden seçim yaparken topların renk sırasını dikkate alırız, k Є їm - Bu tür seçimlerin kümesini göstereceğiz T(n 0 - 1, .. .,п/ - 1) Torbanın toplamda n - 1 top içermesine izin verin, m n-l= (n fc -l).

Örnekteki k rengindeki topların sayı dizisini r (k) _ r (fc) r (fc) ile gösterelim. h« = (^,...,)) dizisini düşünün. M fc) =ri fc) , ^ = ^-^ = 2,...,^-1, _ (fc)

h^ dizisi, k rengindeki komşu topların yerleri arasındaki mesafeler kullanılarak *Ф = n olacak şekilde belirlenir.

Tüm k Є їм için h(fc) dizileri kümesi (Х()^ =1) dizisini benzersiz bir şekilde belirler. Farklı k için hk dizileri birbirine bağımlıdır. Özellikle bunlardan herhangi biri diğerleri tarafından benzersiz bir şekilde belirlenir. 1m kümesinin önem derecesi 2 ise, o zaman topların renk sırası, aynı sabit renkteki komşu topların yerleri arasındaki mesafelerin h() dizisi tarafından benzersiz bir şekilde belirlenir. 0 renkli N - 1 top olsun. iki farklı renkte n - 1 top içeren bir torbada M(N-l,n - N) kümesi ile h(n, N) = 9\ Пі m vektörlerinden oluşan bir küme arasında bire bir yazışma kurabiliriz. (merhaba,..., /i#) pozitif tamsayı bileşenleriyle öyle ki

9\n,m kümesi, bir pozitif tamsayı n'nin N sıralı terime tüm farklı bölümlerinin kümesine karşılık gelir.

9R n d vektörleri kümesi üzerinde belirli bir olasılık dağılımını belirleyerek, Wl(N - l, n - N) kümesi üzerinde karşılık gelen olasılık dağılımını elde ederiz. V\n,y kümesi, negatif olmayan tamsayı bileşenleri (0,1)'i karşılayan 2J n,iv vektör kümesinin bir alt kümesidir. Tez çalışmasında formun dağılımları vektörler kümesi üzerindeki olasılık dağılımları olarak ele alınacaktır.

P(%, N) = (r b..., r N)) = P(& = r, u = 1,..., N\ & = n), (0,2) burada 6 > , lg - bağımsız negatif olmayan tamsayı rastgele değişkenler.

/24/'deki (0.2) formunun dağılımlarına, n tane parçacığın N hücreye yerleştirilmesine yönelik genelleştirilmiş şemalar denir. Özellikle, (0.2)'deki b...,lr rastgele değişkenleri Poisson yasalarına göre sırasıyla Ai,...,Alr parametreleriyle dağıtılırsa, o zaman h(n,N) vektörü şu şekilde bir polinom dağılımına sahiptir: sonuçların olasılıkları

Ri = t--~t~> ^ = 1,---,^-

Li + ... + l^

(0.2)'deki i> >&v rastgele değişkenleri V(Zi = k)= P k - 1 (l-p),k=l,2,... geometrik yasasına göre aynı şekilde dağılıyorsa, burada p herhangi bir değerdir aralık 0

/14/,/38/'de belirtildiği gibi, N hücreye n tanecik yerleştirmek için genelleştirilmiş şemalarda h(n, N) = (hi,..., h^) frekans vektörlerinin dağılımı hakkındaki hipotezlerin test edilmesinde özel bir yer ad%,lo) = L(i (o.z) formundaki istatistiklere dayanarak oluşturulan kriterler tarafından işgal edilir

Фк «%,%..;$, (0.4) burada /j/, v = 1,2,... ve ф bazı gerçek değerli fonksiyonlardır,

Mg = E 1(K = g), g = 0,1,.... 1/=1

/27/'deki // r miktarlarına tam olarak r parçacık içeren hücre sayısı adı verildi.

/30/'deki (0.3) formundaki istatistiklere ayrılabilir (toplamsal olarak ayrılabilir) istatistikler denir. Eğer (0.3)'teki /" fonksiyonları u'ya bağlı değilse, bu tür istatistiklere /31/ simetrik ayrılabilir istatistikler adı verilir.

Herhangi bir r için /x r istatistiği simetrik ayrılabilir bir istatistiktir. Eşitlikten

DM = DFg (0.5), bundan, h u'nun simetrik ayrılabilir istatistik sınıfının, fi r'nin doğrusal fonksiyonları sınıfıyla çakıştığı sonucu çıkar. Üstelik (0.4) formunun fonksiyon sınıfı, simetrik ayrılabilir istatistik sınıfından daha geniştir.

H 0 = (Rao(n,A0), h(n,N) vektörünün dağılımının (0.2) olduğunu söyleyen basit sıfır hipotezlerinin bir dizisidir; burada rastgele değişkenler i,...,ln ve (0.2) şöyledir: aynı dağılıma sahip ve P(ti = k)=p k ,k = 0,l,2,..., n, N parametreleri merkez bölgede değişiyor.

Bazı P Є (0,1)'i ve genel olarak konuşursak, karmaşık alternatiflerden oluşan bir diziyi düşünün n = (H(n,N)) öyle ki bir n var olsun

P(fm > OpAR)) >: 0-Eğer fm > a s m((3) ise Hq(ti,N) hipotezini reddedeceğiz.Jim ~1nP(0l > a n, N (P)) = limiti varsa ШН ), burada her N için olasılık #o(n,iV hipotezi altında hesaplanır), o zaman j değeri (fi,lcl) /38/'de (/?, N). Genel anlamda son sınır mevcut olmayabilir. Bu nedenle tez çalışmasında, kriter indeksinin yanı sıra, tez çalışmasının yazarının benzetme yoluyla lim (_IlnP(tor > a N (J3))) =if(P,P) değeri dikkate alınır, (/3,H) noktasındaki φ kriterinin alt indeksi denir. Burada ve altında, lim adg, lim а# jV-уо ЛГ-оо sırasıyla N -> yu için dizinin (odg) alt ve üst limitlerini ifade eder,

Bir kriter endeksi mevcutsa, kriterin alt simgesi onunla çakışır. Kriterin alt endeksi her zaman mevcuttur. Nasıl daha büyük değer kriter indeksi (kriterin alt simgesi), söz konusu anlamda istatistiksel kriter ne kadar iyi olursa. /38/'de genelleştirilmiş yerleşim şemaları için anlaşma kriterleri oluşturma sorunu en yüksek değer m > 0'ın bazı olduğu durumlarda Ho(n,N) hipotezini reddeden kriterler sınıfındaki kriter indeksi sabit numara, sabitlerin sırası, alternatiflerin dizisi için kriterin gücünün verilen değerine göre seçilir, ft t, t + 1 argümanlarının gerçek bir fonksiyonudur.

Kriter endeksleri büyük sapma olasılıklarına göre belirlenir. /38/'de gösterildiği gibi, rastgele değişken /() için Cramer koşulu sağlandığında, ayrılabilir istatistiklerdeki büyük sapmaların olasılıklarının kaba (logaritmik eşdeğerliğe kadar) asimptotikleri karşılık gelen Kull-Bak-Leibler- tarafından belirlenir. Sanov bilgi mesafesi (rastgele değişken q Cramer koşulunu karşılar, eğer bazı # > 0 için moment üreten Me f7? fonksiyonu \t\ aralığında sonlu ise)

Sınırsız sayıda kökten istatistiklerde büyük sapmaların olasılığı ve ayrıca Cramer koşulunu karşılamayan keyfi ayrılabilir istatistikler sorunu açık kaldı. Bu, genelleştirilmiş yerleştirme şemalarında hipotezleri test etmek için kriterler oluşturma sorununu, en yüksek oranda I. tip hata olasılığının sıfıra yönelme oranı ile kriterler sınıfındaki alternatiflere yaklaşma ile çözmeyi mümkün kılmadı. formu (0.4). Tez araştırmasının alaka düzeyi, belirtilen problemin çözümünü tamamlama ihtiyacına göre belirlenir.

Tez çalışmasının amacı, U(n, N) hipotezini reddeden kriterler sınıfında geri dönüşsüz seçim şemasındaki hipotezleri test etmek için kriter indeksinin en yüksek değeri (kriterin alt simgesi) ile uyum kriterleri oluşturmaktır. 0(iv"iv"-""" o """)>CiV " (0 " 7) burada φ sayılabilir argüman sayısının bir fonksiyonudur ve n, N parametreleri merkezi bölgede değişir.

Çalışmanın amacına uygun olarak aşağıdaki görevler belirlendi: sayılabilir sayıda sonuca sahip ayrık dağılımlar için Kull-Bak - Leibler - Sanov'un entropi ve bilgi mesafesinin özelliklerini araştırmak; formun istatistiklerindeki büyük sapmaların olasılıklarını incelemek (0,4); Simetrik ayrılabilir istatistiklerin (0,3) Cramer koşulunu karşılamayan büyük sapmalarının olasılıklarını incelemek; - genelleştirilmiş yerleştirme şemalarında hipotezleri test etmek için temel alınarak oluşturulan anlaşma kriterinin, formun kriterler sınıfında en yüksek endeks değerine sahip olduğu istatistikleri bulun (0,7).

Bilimsel yenilik: genelleştirilmiş bir metrik kavramı verilmiştir - sonsuz değerleri kabul eden ve kimlik, simetri ve üçgen eşitsizliği aksiyomlarını karşılayan bir işlev. Genelleştirilmiş bir metrik bulunur ve sayılabilir sayıda sonucu olan ayrık dağılımlar ailesinde tanımlanan entropi ve bilgi mesafesi fonksiyonlarının bu metrikte sürekli olduğu kümeler gösterilir; genelleştirilmiş yerleştirme şemasında, Cramer koşulunun karşılık gelen formunu karşılayan, formun (0.4) istatistiklerindeki büyük sapma olasılıkları için kaba (logaritmik eşdeğerliğe kadar) bir asimptotik bulundu; genelleştirilmiş yerleştirme şemasında, Cramer koşulunu karşılamayan simetrik ayrılabilir istatistiklerin büyük sapma olasılıkları için kaba (logaritmik eşdeğerliğe kadar) bir asimptotik bulunmuştur; formun kriter sınıfında (0.7), kriter indeksinin en yüksek değerine sahip bir kriter oluşturulur.

Bilimsel ve pratik değer. Çalışma, genelleştirilmiş yerleştirme planlarındaki büyük sapma olasılıklarının davranışına ilişkin bir dizi soruyu çözmektedir. Elde edilen sonuçlar şu alanlarda kullanılabilir: Eğitim süreci matematiksel istatistik ve bilgi teorisi uzmanlıklarında, ayrık dizilerin analizine yönelik istatistiksel prosedürlerin incelenmesinde ve /3/, /21/'de bir bilgi sistemi sınıfının güvenliğinin gerekçelendirilmesinde kullanılmıştır. Savunma için öne sürülen hükümler: hipotezi tek bir renk top dizisinden test etme sorununu, bu dizinin geri dönmeden yapılan bir seçim sonucu elde edilmesinden, iki renkli topların bulunduğu bir torbadan topların tükenmesine kadar azaltılması ve bu tür her seçim, karşılık gelen genel düzende hipotezleri test etmek için anlaşma kriterlerinin oluşturulmasında aynı olasılığa sahiptir; tanıtılan logaritmik genelleştirilmiş metrik ile sonsuz boyutlu bir simpleks üzerinde entropi ve Kullback-Leibler-Sanov bilgi mesafesi fonksiyonlarının sürekliliği; yarı üstel durumda genelleştirilmiş yerleştirme şemasında Cramer koşulunu karşılamayan simetrik ayrılabilir istatistiklerin büyük sapmalarının olasılıklarının kaba (logaritmik eşdeğerliğe kadar) asimptotiklerine ilişkin bir teorem; (0.4) formundaki istatistikler için büyük sapma olasılıklarının kaba (logaritmik eşdeğerliğe kadar) asimptotiklerine ilişkin bir teorem; - formun kriterleri sınıfında en yüksek endeks değerine (0,7) sahip genelleştirilmiş düzenlerde hipotezleri test etmek için bir uyum iyiliği kriterinin oluşturulması.

İşin onaylanması. Sonuçlar, adını taşıyan Matematik Enstitüsü Ayrık Matematik Bölümü'nün seminerlerinde sunuldu. V. A. Steklov RAS, ITM&VT'nin bilgi güvenliği departmanı adını almıştır. S. A. Lebedev RAS ve at: Beşinci Tüm Rusya Uygulamalı ve Endüstriyel Matematik Sempozyumu. Bahar oturumu, Kislovodsk, 2 - 8 Mayıs 2004; altıncı Uluslararası Petrozavodsk konferansı "Ayrık matematikte olasılıksal yöntemler" 10 - 16 Haziran 2004; ikinci Uluslararası konferans"Bilgi sistemleri ve teknolojileri (IST" 2004)", Minsk, 8 - 10 Kasım 2004;

Uluslararası konferans "Modern Sorunlar ve Olasılık Teorisinde Yeni Eğilimler", Chernivtsi, Ukrayna, 19 - 26 Haziran 2005.

Çalışmanın ana sonuçları ITMiVT RAS tarafından yürütülen "Özür" araştırma çalışmasında kullanıldı. S. A. Lebedev, Rusya Federasyonu Federal Teknik ve İhracat Kontrol Servisi'nin çıkarları doğrultusunda araştırma aşamasının uygulanmasına ilişkin rapora /21/ dahil edildi. Tezin bazı sonuçları, Rusya Federasyonu Kriptografi Akademisi'nin 2004/22/ tarihli "Kriptografinin matematiksel problemlerinin geliştirilmesi" araştırma raporuna dahil edildi.

Yazar, bilimsel danışman, Fiziksel ve Matematik Bilimleri Doktoru A. F. Ronzhin ve bilimsel danışman, Fiziksel ve Matematik Bilimleri Doktoru, Kıdemli Araştırmacı A. V. Knyazev'e derin şükranlarını sunar. Yazar, Fiziksel ve Matematik Bilimleri Doktoru Profesör A. M. Zubkov'a şükranlarını sunar. ve Fiziksel ve Matematik Bilimleri Adayı Matematik Bilimleri I. A. Kruglov'a çalışmaya gösterdiği ilgi ve bir dizi değerli yorumu için teşekkür ederiz.

Çalışmanın yapısı ve içeriği.

Birinci bölümde, negatif olmayan tamsayılar kümesindeki dağılımlar için entropi ve bilgi mesafesinin özellikleri incelenmektedir.

Birinci bölümün ilk paragrafında notasyonlar tanıtılmış ve gerekli tanımlar verilmiştir. Özellikle kullanılırlar aşağıdaki tanımlamalar: x = (:ro,i, ---) - sayılabilir sayıda bileşene sahip sonsuz boyutlu vektör;

Н(х) - -Ex^oXvlnx,; trunc m (x) = (x 0,x 1,...,x t,0,0,...); SI* = (x, x u > 0, u = 0,1,..., E~ o x 0,v = 0,l,...,E? =Q x v = 1); fi 7 = (x Є Ö, L 0 vx v = 7); %] = (хЄП,Эо»х и

16 mі = e o ** v \ &c = Ue>1 | 5 є Q 7) o

Vt kümesinin, negatif olmayan tamsayılar kümesindeki bir olasılık dağılımları ailesine karşılık geldiği açıktır, P 7 - matematiksel beklenti 7 ile negatif olmayan tamsayılar kümesindeki bir olasılık dağılımları ailesine karşılık gelir - Eğer y Є Q ise, bu durumda є > 0 için küme O e (y) ile gösterilecektir.

Оє(у) - (х eO,x v

Birinci bölümün ikinci paragrafında, sınırlı matematiksel beklentiye sahip ayrık dağılımların entropisinin sınırlılığına ilişkin bir teorem kanıtlanmıştır.

Teorem 1. Sınırlı matematiksel beklentiyle ayrık dağılımların entropisinin sınırlılığı üzerine. Herhangi bir betonarme için 7

Eğer xЄ fi 7 matematiksel dağılımı 7 olan geometrik bir dağılıma karşılık geliyorsa; yani

7 x = (1- р)р\ v = 0,1,..., burada р = --,

1 + 7 ise H(x) = F(1) eşitliği sağlanır.

Teoremin ifadesi, Lagrange'ın koşullu çarpanlar yönteminin sonsuz sayıda değişken durumunda resmi olarak uygulanmasının sonucu olarak görülebilir. (k, k + 1, k + 2,...) kümesindeki belirli bir matematiksel beklentiye ve maksimum entropiye sahip tek dağılımın, belirli bir matematiksel beklentiye sahip geometrik bir dağılım olduğu teoremi (kanıtsız) /47'de verilmiştir. /. Ancak yazar kesin kanıtlar sunmuştur.

İlk bölümün üçüncü paragrafı, genelleştirilmiş bir ölçümün - sonsuz değerlere izin veren bir ölçümün - tanımını verir.

x,y Є Гі için p(x,y) fonksiyonu y v e~ e özelliğiyle minimum є > O olarak tanımlanır

Eğer böyle bir є yoksa p(x,y) = oo olduğu varsayılır.

p(x,y) fonksiyonunun, negatif olmayan tamsayılar kümesindeki ve Ci* kümesinin tamamındaki dağılım ailesi üzerinde genelleştirilmiş bir metrik olduğu kanıtlanmıştır. p(x,y) metriğinin tanımında e yerine 1 dışında herhangi bir pozitif sayı kullanabilirsiniz. Ortaya çıkan metrikler çarpımsal bir sabit kadar farklılık gösterecektir. Bilgi mesafesini J(x, y) ile gösterelim

Burada ve aşağıda 0 In 0 = 0,01n ^ = 0 olduğu varsayılmaktadır. Bilgi mesafesi x, y için, tümü için x v - 0 olacak şekilde ve y v = 0 olacak şekilde tanımlanır. Bu koşul karşılanmazsa, o zaman şunu yapacağız: J(S,y) = co olduğunu varsayalım. A C $1 olsun. O zaman J(Ay)="mU(x,y)'yi göstereceğiz.

J(Jb,y) = 00 olsun.

Birinci bölümün dördüncü paragrafında P* kümesi üzerinde tanımlanan fonksiyonların kompaktlığının tanımı verilmektedir. Sayılabilir sayıda argümana sahip bir fonksiyonun kompaktlığı, herhangi bir doğruluk derecesiyle, fonksiyonun değerinin, yalnızca sonlu sayıda argümanın sıfır olmadığı noktalarda bu fonksiyonun değerlerine yaklaştırılabileceği anlamına gelir. Entropi ve bilgi mesafesi fonksiyonlarının kompaktlığı kanıtlanmıştır.

Herhangi bir 0 için

Eğer bazı 0 0 için \(x) = J(x,p) fonksiyonu 7 ] P O g (p) kümesinde kompakttır.

Birinci bölümün beşinci paragrafında sonsuz boyutlu bir uzayda tanımlanan bilgi mesafesinin özellikleri tartışılmaktadır. Sonlu boyutlu durumla karşılaştırıldığında bilgi mesafesi fonksiyonunun sürekliliği durumu niteliksel olarak değişmektedir. Bilgi uzaklığı fonksiyonunun Г2 kümesi üzerinde pi(,y)= E|z‐i/„|, ( metriklerinden herhangi birinde sürekli olmadığı gösterilmiştir.

00 \ 2 p 2 (x,y) = sup (x^-ij^.

Entropi fonksiyonları H(x) ve bilgi mesafesi J(x,p) için aşağıdaki eşitsizliklerin geçerliliği kanıtlanmıştır:

1. Herhangi bir x için x" Є fi \H(x) - H(x")\

2. Eğer bazı х,р є П için х є О є (р) olacak şekilde є > 0 varsa, o zaman herhangi bir X і Є Q \J(x,p) - J(x",p)\

Bu eşitsizliklerden, Teorem 1 dikkate alındığında, entropi ve bilgi mesafesi fonksiyonlarının p(x,y) metriğindeki karşılık gelen fi alt kümeleri üzerinde düzgün şekilde sürekli olduğu sonucu çıkar:

0 olacak şekilde herhangi bir 7 için

Eğer yaklaşık 7o için, O

20 ise herhangi bir 0 0 için \p(x) = J(x t p) fonksiyonu p(x,y) metriğindeki 7 ] P O є (p) kümesinde düzgün süreklidir.

Ekstrem olmayan fonksiyonun tanımı verilmiştir. Ekstrem olmayan koşul, fonksiyonun yerel ekstremumlara sahip olmadığı veya fonksiyonun yerel minimumlarda (yerel maksimumlarda) aynı değerleri aldığı anlamına gelir. Ekstrem olmayan koşul, yerel ekstremlerin yokluğu gerekliliğini zayıflatır. Örneğin, gerçek sayılar kümesindeki sin x fonksiyonu yerel ekstrema sahiptir, ancak ekstrem olmayan koşulu karşılar.

Bazı 7 > 0 için A bölgesi şu koşulla verilir:

А = (хЄЇ1 1 ,ф(х) >а), (0.9) burada Ф(х) gerçel değerli bir fonksiyondur, а bir tür gerçel sabittir, inf Ф(х)

Ve 3y, şu soru ortaya çıktı, n P „ hangi koşullar altında “a „ φ için i_ „ara- q metre n, merkezi bölgede N, ^ -> 7, tüm yeterince büyük değerleri için böyle olmayanlar olacak -negatif tamsayılar ko, k\, ..., k n, ne ko + hi + ... + k n = N,

21 k\ + 2/... + nk n - N

Kqk\kn . ^"iv"-"iv" 0 " 0 "-")>a -

Bunun için φ fonksiyonunun p(x,y) metriğinde ekstrem olmayan, kompakt ve sürekli olmasını gerektirmesinin yeterli olduğu ve ayrıca bazı є değerleri için en az bir x noktasının (0,9) tatmin edici olmasının yeterli olduğu kanıtlanmıştır. > 0 derecesinde sonlu bir moment vardır 1 + є Ml + = і 1+є x ve herhangi bir u = 0,1 için 0,....

İkinci bölümde, fonksiyonların D = (fio,..., cn, 0,...) - belirli bir hücre sayısına göre büyük sapma olasılığının kaba (logaritmik eşdeğerliğe kadar) asimptotiklerini inceliyoruz. N,n parametrelerinin değişiminin merkezi bölgesini dolduruyor. Büyük sapma olasılıklarının kaba asimptotikleri, uyum iyiliği kriterlerinin endekslerini incelemek için yeterlidir.

(0.2)'deki ^ rastgele değişkenlerinin aynı şekilde dağıtılmasına izin verin ve

Р(Сі = к)=рьк = 0.1,... > P(z) - rastgele değişken i'nin fonksiyonu üreten - yarıçapı 1 olan bir dairede yakınsar

22 p(.) = (p(ad = o),P№) = i),...).

Denklemin z 1 çözümü varsa

M(*) = 7 ise benzersiz /38/ olur. Aşağıda Pjfc>0,fc = 0,l,... olduğunu varsayacağız.

İkinci bölümün ilk paragrafının ilk paragrafında -m^1nP(th) = ^,...,/ = K)- formundaki olasılıkların logaritmasının asimptotikleri vardır.

Aşağıdaki teorem kanıtlanmıştır.

Teorem 2. Büyük sapmaların olasılıkları üzerine kaba yerel teorem. n, N -* öyle olsun ki - ->7>0

Teoremin ifadesi doğrudan /to, A*b / /26/ ortak dağılımı formülünden ve aşağıdaki tahminden gelir: negatif olmayan tamsayı değerleri fii,fi2,/ /I1 + 2 koşulunu karşılıyorsa // 2 + ... + 71/ = 71 ise aralarında sıfır olmayan değerlerin sayısı 0(l/n) olur. Bu kaba bir tahmindir ve yeni olduğu iddia edilmemektedir. Genelleştirilmiş yerleşim şemalarında sıfır olmayan τ sayısı, hücrelerin maksimum dolum değerini aşmaz; bu, merkezi bölgede, 1'e yönelme olasılığıyla, 0(\n) /25/ değerini aşmaz, /27/. Bununla birlikte, elde edilen 0(y/n) tahmini, 1 olasılığı karşılamaktadır ve kaba asimptotikler elde etmek için yeterlidir.

İkinci bölümün ilk paragrafının ikinci paragrafında, adg'nin bazı a Є R'ye yakınsak bir reel sayılar dizisi olduğu, φ(x)'in ise gerçel değerli bir fonksiyon olduğu limit değeri bulunur. Aşağıdaki teorem kanıtlanmıştır.

Teorem 3. Büyük sapmaların olasılıkları üzerine kaba integral teoremi. Teorem 2'nin koşulları karşılansın, bazı r > 0, (> 0) için gerçek fonksiyon φ(x) kompakttır ve kümedeki p metriğinde düzgün süreklidir

A = 0 rH (p(r 1))nP bn] ve Г2 7 kümesinde ekstremitesizlik koşulunu karşılıyor. Eğer inf f(x) şeklinde bir a sabiti varsa

24'te bir p a fi 7 P 0 r (p(z 7)) vektörü vardır; öyle ki

Ф(ra) > а J(( (x) >а,хЄ П 7 ),р(2; 7)) = J(pa ,p(^y))), mo, а, ^'ye yakınsayan herhangi bir а^ dizisi için -^\nP(f(^,^,...)>a m) = Pr a,p(r,)) (0.11)

φ(x) fonksiyonu üzerindeki ek kısıtlamalarla, (2.3)'teki bilgi mesafesi J(pa,P(zy)) daha spesifik olarak hesaplanabilir. Yani aşağıdaki teorem doğrudur. Teorem 4. Bilgi mesafesi hakkında. Biraz 0 olsun

Bazı r > 0, C > 0 olsun, φ(x) gerçek fonksiyonu ve onun birinci dereceden kısmi türevleri, kümedeki genelleştirilmiş p(x, y) metriğinde kompakt ve düzgün şekilde süreklidir.

A = O g (p)PP bn] , T > 0, R > 0 vardır, öyle ki tüm \t\ O p v v 1+ z u exp(i--ph(x))

0(p(gaL)) = a, / h X v \Z,t) T, u= oX LJ (Z,t)

O zaman p(za , t a) Є ft, u J((z Є Л,0(z) = а),р) = J(p(za ,ta),p) d _ 9 = 7111 + t a «-^ OFaL)) - 2Wexp( a --0(p(g a,i a))). j/=0 CnEi/ ^_o CX(/

Eğer f(x) fonksiyonu doğrusal bir fonksiyon ise ve fix) fonksiyonu eşitlik (0.5) kullanılarak tanımlanmışsa, bu durumda (0.12) koşulu, f(,(z)) rastgele değişkeni için Cramer koşuluna dönüşür. Koşul (0.13), koşul (0.10)'un bir biçimidir ve tümü için 0(n, N)'den en az bir noktanın (x Є Г2, φ(x) > a) biçimindeki alanlardaki varlığını kanıtlamak için kullanılır. yeterince büyük n, N.

Genelleştirilmiş düzende (0.2) v ()(n,iV) = (/гі,...,/ijv) frekans vektörü olsun. Teorem 3 ve 4'ün bir sonucu olarak aşağıdaki teorem formüle edilir.

Teorem 5. Genelleştirilmiş bir yerleştirme şemasında simetrik ayrılabilir istatistiklerdeki büyük sapmaların olasılıkları üzerine kaba integral teoremi.

n, N -> co öyle olsun ki jfr - 7» 0 0,R > 0 öyle olsun ki tüm \t\ için O halde a'ya yakınsayan herhangi bir a# dizisi için, 1 iv =

Bu teorem ilk olarak A.F. Ronzhin tarafından /38/'de eyer noktası yöntemi kullanılarak kanıtlandı.

İkinci bölümün ikinci paragrafında, rasgele değişken /((z)) için Cramer koşulunun sağlanamaması durumunda, genelleştirilmiş cxj^iax yerleşiminde ayrılabilir istatistiklerde büyük sapmaların olasılıkları incelenmiştir. Rastgele değişken f(,(z)) için Cramer koşulu, özellikle (z) bir Poisson rastgele değişkeniyse ve /(x) = x 2 ise karşılanmaz. Genelleştirilmiş tahsis şemalarında ayrılabilir istatistikler için Cramer koşulunun her zaman karşılandığını unutmayın, çünkü herhangi bir sabit n, N için sayı Olası sonuçlar elbette bu planlarda.

/2/'de belirtildiği gibi, eğer Cramer koşulu karşılanmazsa, aynı şekilde dağıtılan toplamların büyük sapma olasılıklarının asimptotiklerini bulmak rastgele değişkenler Vade dağılımında doğru değişiklik yapılabilmesi için ek şartların da yerine getirilmesi gerekmektedir. Çalışma (/2/'deki (3) koşulunun yerine getirilmesine karşılık gelen durumu, yani yedi üstel durumu dikkate alır. Her şey için P(i = k) > O olsun.

28 k = 0,1,... ve p(k) = -\nP(^ = k) fonksiyonu, sürekli argüman fonksiyonuna devam ettirilebilir - p, 0 oo P(tx) mertebesinde düzenli olarak değişen bir fonksiyon, r v P(t)

Bağımsız değişkenin yeterince büyük değerleri için f(x) fonksiyonunun pozitif, kesinlikle artan, düzenli olarak değişen d>1,^ düzeyinde bir fonksiyon olmasına izin verin. Sayı ekseninin geri kalanında

Sonra s. V. /(i) herhangi bir mertebeden momentlere sahiptir ve Cramer koşulunu karşılamaz, x -> oo olarak ip(x) = o(x) ve aşağıdaki Teorem 6 geçerlidir. ip(x) fonksiyonunun monotonik olarak azalmayan olmasına izin verin yeterince büyük x için, ^p fonksiyonu monoton olarak artmaz, n, N --> oo öyle ki jf - A, 0 b(z\), burada b(z) = M/(1(2)) bir limittir l(n,lg)) > cN] = "(c ~ b(zx))l b""ї

Teorem b'den, Cramer koşulu sağlanmazsa limitin (^ lim ~\nP(L N (h(n,N)) > cN) = 0, "" Dv olacağı sonucu çıkar.

L/-çok iV ve /39/'de ifade edilen hipotezin geçerliliğini kanıtlıyor. Bu nedenle, genelleştirilmiş yerleştirme şemalarında uyum kriteri endeksinin değeri -^ Cramer koşulu karşılanmadığında her zaman sıfıra eşittir. Bu durumda kriterler sınıfında Cramer koşulu sağlandığında sıfırdan farklı indeks değerine sahip kriterler oluşturulur. Buradan, istatistikleri Cramer koşulunu karşılamayan kriterlerin (örneğin, bir polinom şemasındaki ki-kare testi) kullanılarak, belirtilen anlamda yakınsamayan alternatifler için hipotezleri test etmek amacıyla uyum iyiliği testleri oluşturulacağı sonucuna varabiliriz. asimptotik olarak etkisizdir. Benzer bir sonuç /54/'de bir polinom şemasında ki-kare ve maksimum olabilirlik oranı istatistiklerinin karşılaştırılması sonuçlarına dayanarak yapılmıştır.

Üçüncü bölüm, genelleştirilmiş yerleştirme şemalarındaki hipotezleri test etmek için, kriter endeksinin en büyük değeri (kriterin alt simgesinin en büyük değeri) ile uyum iyiliği kriterleri oluşturma problemini çözmektedir. Entropi fonksiyonlarının özelliklerine, bilgi mesafesine ve büyük sapma olasılıklarına ilişkin birinci ve ikinci bölümlerin sonuçlarına dayanarak, üçüncü bölümde uyum iyiliği kriterini oluşturacak şekilde (0.4) formunda bir fonksiyon bulunur. esasında, söz konusu kriter sınıfında tam alt simgenin en büyük değerine sahiptir. Aşağıdaki teorem kanıtlanmıştır. Teorem 7. Bir indeksin varlığı hakkında. Teorem 3'ün koşulları karşılansın, 0 ,... - bir alternatif dağılımlar dizisi, 0^(/3, iV) - hipotezi altında Н Р (lo, eşitsizlik) için maksimum sayı

P(φ(^^,...)>a φ (P,M))>(3, bir limit vardır limjv-»oo o>φ(P, N) - a. Sonra (/3) noktasında , N) f kriter endeksi var

Zff,K) = 3((φ(x) >a,xe ZD.P^)).

Bu durumda zf(0,th)N NP(e(2 7) = fc)"

Sonuç, tezde ortaya konan genel amaç ve belirli görevlerle olan ilişkilerinde elde edilen sonuçları ortaya koyar, tez araştırmasının sonuçlarına dayanarak sonuçları formüle eder, çalışmanın bilimsel yeniliğini, teorik ve pratik değerini ve ayrıca spesifik olduğunu belirtir. yazar tarafından belirlenen ve çözümü konuyla ilgili görünen bilimsel görevler.

Araştırma konusuyla ilgili literatürün kısa özeti.

Tez, genelleştirilmiş yerleştirme şemalarında, yakınsamayan alternatiflerle, formun işlevler sınıfında (0,4) kriter indeksinin en yüksek değerine sahip uyum kriterleri oluşturma problemini incelemektedir.

Genelleştirilmiş yerleşim şemaları /24/'de V.F. Kolchin tarafından tanıtıldı. Polinom şemasındaki fi r miktarlarına r tanecikli hücre sayısı adı verildi ve V. F. Kolchin, B. A. Sevastyanov, V. P. Chistyakov /27/ tarafından yazılan monografide ayrıntılı olarak incelenmiştir. Genelleştirilmiş düzenlerdeki \i r değerleri, /25/, /26/'da V.F. Kolchin tarafından incelenmiştir. Formun (0.3) istatistikleri ilk olarak /30/'da Yu I. Medvedev tarafından değerlendirildi ve ayrılabilir (toplamsal olarak ayrılabilir) istatistikler olarak adlandırıldı. (0.3)'teki /' fonksiyonları u'ya bağlı değilse, bu tür istatistiklere /31/ simetrik ayrılabilir istatistikler adı verilir. Genelleştirilmiş tahsis şemalarında ayrılabilir istatistiklerin momentlerinin asimptotik davranışı /9/'da G. I. Ivchenko tarafından elde edildi. Genelleştirilmiş bir yerleşim şeması için limit teoremleri de /23/'de ele alınmıştır. Limit teoremlerinin sonuçlarının ve ayrık olasılık şemalarındaki (0.2) anlaşma kriterlerinin incelemeleri, /8/'de V. A. Ivanov, G. I. Ivchenko, Yu. I. Medvedev ve G. I. Ivchenko, Yu. I. Medvedev, A.F. Ronzhin tarafından verilmiştir. /14/. Genelleştirilmiş düzenler için anlaşma kriterleri /38/'de A.F. Ronzhin tarafından değerlendirildi.

Bu çalışmalarda istatistiksel kriterlerin özelliklerinin karşılaştırılması göreceli asimptotik verimlilik açısından yapılmıştır. Yakınsak (bitişik) hipotezler durumu dikkate alındı ​​- Pitman anlamında verimlilik ve yakınsak olmayan hipotezler - Bahadur, Hodges - Lehman ve Chernov anlamında verimlilik. Arasındaki bağlantı çeşitli türlerİstatistiksel testlerin göreceli etkinliği örneğin /49/'da tartışılmaktadır. Yu.I. Medvedev'in /31/'de ayrılabilir istatistiklerin polinom şemasındaki dağılımına ilişkin sonuçlarından da anlaşılacağı üzere, ki-kare istatistiğine dayanan kriter, ayrılabilir istatistikler sınıfında yakınsak hipotezler altında en büyük asimptotik güce sahiptir. bir polinom şemasındaki sonuçların frekansları. Bu sonuç A.F. Ronzhin tarafından /38/'deki (0.2) tipi devreler için genelleştirildi. /4/'de I. I. Viktorova ve V. P. Chistyakov, köknarın doğrusal fonksiyonları sınıfındaki bir polinom şeması için en uygun kriteri oluşturdular. A.F. Ronzhin, /38/'de sıfır hipotezine yakın olmayan bir dizi alternatif verildiğinde, istatistik sınıfında birinci türden bir hata olasılığının sıfıra yöneldiği logaritmik oranı en aza indiren bir kriter oluşturdu. formu (0.6). Yaklaşan ve yaklaşmayan hipotezler altında ki-kare ve maksimum olasılık oranı istatistiklerinin göreceli performansının karşılaştırılması /54/'de gerçekleştirilmiştir. Tez, yakınsamayan hipotezlerin durumunu değerlendirdi. Yakınsamayan hipotezler altında kriterlerin göreceli istatistiksel etkinliğinin incelenmesi, 0(u/n) düzeyindeki aşırı büyük sapmaların olasılıklarının incelenmesini gerektirir. İlk kez, sabit sayıda sonuç içeren bir polinom dağılımına ilişkin böyle bir problem, /40/'da I. N. Sanov tarafından çözüldü. Yakınsamayan alternatiflere sahip sonlu sayıda sonuç durumunda çok terimli bir dağılım için basit ve karmaşık hipotezleri test etmek için uyum iyiliği testlerinin asimptotik optimalliği /48/'de ele alınmıştır. Bilgi mesafesinin özellikleri daha önce Kullback, Leibler /29/,/53/ ve I. II tarafından ele alınmıştı. Sanov /40/ ve Hoeffding /48/. Bu çalışmalarda Öklid metriğinde sonlu boyutlu uzaylarda bilgi mesafesinin sürekliliği dikkate alınmıştır. Bazı yazarlar, örneğin Yu.V. Prokhorov'un çalışmasında /37/ veya V.I. Bogachev, A.V. Kolesnikov'un /1/ çalışmasında artan boyutlara sahip bir alan dizisini değerlendirdi. Cramer koşulu altında genelleştirilmiş yerleştirme şemalarında ayrılabilir istatistiklerdeki büyük sapmaların olasılıklarına ilişkin kaba (logaritmik eşdeğerliğe kadar) teoremler, A.F. Roizhin tarafından /38/'de elde edildi. A. N. Timashev /42/,/43/'de fir^n, N),..., firs (n,N) vektörünün büyük sapma olasılıkları üzerine tam (eşdeğerliğe kadar) çok boyutlu integral ve yerel limit teoremleri elde etti , burada s, gi,..., r s sabit tamsayılardır,

Biraz farklı bir formülasyonda geri dönüşsüz bir seçim şemasındaki hipotezlerin test edilmesine ve parametrelerin tahmin edilmesine ilişkin istatistiksel problemler, tahmin problemlerinin sonlu bir popülasyon için çözüldüğü G. I. Ivchenko, V. V. Levin, E. E. Timonina /10/, /15/ tarafından ele alındı. elemanlarının sayısı bilinmeyen bir miktar olduğundan, geri dönüşsüz bir seçim şemasındaki bağımsız örneklerden alınan çok değişkenli S - istatistiklerinin asimptotik normalliği kanıtlandı. Bağımsız deneme dizilerindeki tekrarlarla ilişkili rastgele değişkenleri inceleme sorunu, A. M. Zubkov, V. G. Mikhailov, A. M. Shoitov tarafından /6/, /7/, /32/, /33/, / 34/'de incelenmiştir. Hipotezlerin tahmin edilmesi ve test edilmesine ilişkin temel istatistiksel problemlerin analizi. genel model Markova-Polya, olasılık analizi /11/'de verilen G.I. Ivchenko, Yu.I. Medvedev tarafından /13/'de gerçekleştirildi. Genelleştirilmiş yerleştirme şemasına (0.2) indirgenemeyen bir dizi kombinatoryal nesne üzerinde tekdüze olmayan olasılık ölçümlerini belirlemeye yönelik bir yöntem, G. I. Ivchenko, Yu. I. Medvedev /12/'de açıklanmıştır. Tekrarlanan formüller kullanılarak yapılan hesaplamalar sonucunda cevabın elde edilebildiği olasılık teorisindeki bir dizi problem, A. M. Zubkov tarafından /5/'de belirtilmiştir.

Ayrık dağılımların entropisine ilişkin eşitsizlikler /50/'de elde edilmiştir (RZhMat'ta A. M. Zubkov'un özetinden alıntılanmıştır). (p n )Lo bir olasılık dağılımı ise,

Рп = Е Рк, к=п A = destek^Pn+i

I + (In -f-) (X Rn - R n+1)

Рп= (x f 1)n+v n>Q. (0,15)

Ekstremal dağılımın (0,15) matematiksel beklenti A olan geometrik bir dağılım olduğuna ve parametre (0,14)'ün F(X) fonksiyonunun Teorem 1'deki matematiksel beklenti fonksiyonuyla örtüştüğüne dikkat edin.

Sınırlı matematiksel beklentiye sahip ayrık dağılımların entropisi

Bir kriter endeksi mevcutsa, kriterin alt simgesi onunla çakışır. Kriterin alt endeksi her zaman mevcuttur. Kriter indeksinin değeri (kriterin alt simgesi) ne kadar yüksek olursa, bu anlamda istatistiksel kriter o kadar iyi olur. /38/'de, Ho(n,N) hipotezini reddeden kriterler sınıfında kriter indeksinin en yüksek değerine sahip genelleştirilmiş düzenler için uyum kriterleri oluşturma sorunu, m 0'ın bir sabit sayı olduğu dizi için çözüldü. Sabit birimlerin sayısı, bir alternatifler dizisi için kriterin verilen değer gücüne göre seçilir, ft - m + 1 argümanlarının gerçek fonksiyonu.

Kriter endeksleri büyük sapma olasılıklarına göre belirlenir. /38/'de gösterildiği gibi, rastgele değişken /() için Cramer koşulu sağlandığında, ayrılabilir istatistiklerdeki büyük sapmaların olasılıklarının kaba (logaritmik eşdeğerliğe kadar) asimptotikleri karşılık gelen Kull-Bak-Leibler- tarafından belirlenir. Sanov bilgi mesafesi (rastgele değişken q, Cramer koşulunu karşılar, eğer bazı # 0 için Mef7? anlarının üreten fonksiyonu \t\ H /28/ aralığında sonluysa).

Sınırsız sayıda köknardan büyük istatistik sapmalarının ve ayrıca Cramer koşulunu karşılamayan keyfi ayrılabilir istatistiklerin olasılıkları sorunu açık kaldı. Bu, genelleştirilmiş yerleştirme şemalarında hipotezleri test etmek için kriterler oluşturma sorununu, en yüksek oranda I. tip hata olasılığının sıfıra yönelme oranı ile kriterler sınıfındaki alternatiflere yaklaşma ile çözmeyi mümkün kılmadı. formu (0.4). Tez araştırmasının alaka düzeyi, belirtilen problemin çözümünü tamamlama ihtiyacına göre belirlenir.

Tez çalışmasının amacı, U(n, N) hipotezini reddeden kriterler sınıfında geri dönüşü olmayan bir seçim şemasında hipotezleri test etmek için kriter indeksinin en büyük değeri (kriterin alt simgesi) ile uyum kriterleri oluşturmaktır. burada φ sayılabilir argüman sayısının bir fonksiyonudur ve n, N parametreleri merkezi bölgede değişir. Çalışmanın amacına uygun olarak aşağıdaki görevler belirlendi: - sayılabilir sayıda sonuca sahip ayrık dağılımlar için Kull-Bak - Leibler - Sanov'un entropi özelliklerini ve bilgi mesafesini incelemek; - formun istatistiklerindeki büyük sapmaların olasılıklarını incelemek (0,4); - Cramer koşulunu karşılamayan simetrik ayrılabilir istatistiklerin (0,3) büyük sapmalarının olasılıklarını incelemek; - genelleştirilmiş yerleştirme şemalarında hipotezleri test etmek için temel alınarak oluşturulan anlaşma kriterinin, formun kriterler sınıfında en yüksek endeks değerine sahip olduğu istatistikleri bulun (0,7). Bilimsel yenilik: - genelleştirilmiş bir metrik kavramı verilmiştir - sonsuz değerleri kabul eden ve özdeşlik, simetri ve üçgen eşitsizliği aksiyomlarını karşılayan bir fonksiyon. Genelleştirilmiş bir metrik bulunur ve sayılabilir sayıda sonucu olan ayrık dağılımlar ailesinde tanımlanan entropi ve bilgi mesafesi fonksiyonlarının bu metrikte sürekli olduğu kümeler gösterilir; - genelleştirilmiş yerleştirme şemasında, Cramer koşulunun karşılık gelen formunu karşılayan, formun (0.4) istatistiklerindeki büyük sapma olasılıkları için kaba (logaritmik eşdeğerliğe kadar) bir asimptotik bulunmuştur; - genelleştirilmiş yerleştirme şemasında, Cramer koşulunu karşılamayan simetrik ayrılabilir istatistiklerin büyük sapma olasılıkları için kaba (logaritmik eşdeğerliğe kadar) bir asimptotik bulunmuştur; - formun (0.7) kriter sınıfında, kriter endeksinin en yüksek değerine sahip bir kriter oluşturulur. Bilimsel ve pratik değer. Çalışma, genelleştirilmiş yerleştirme planlarındaki büyük sapma olasılıklarının davranışına ilişkin bir dizi soruyu çözmektedir. Elde edilen sonuçlar, matematiksel istatistik ve bilgi teorisi uzmanlıklarındaki eğitim sürecinde, ayrık dizilerin analizi için istatistiksel prosedürlerin incelenmesinde kullanılabilir ve /3/, /21/'de birinin güvenliğini haklı çıkarmak için kullanılmıştır. bilgi sistemleri sınıfı. Savunma için sunulan hükümler: - hipotezi tek bir top rengi dizisinden test etme sorununun, bu dizilimin iki top içeren bir torbadan topların tükenmesine kadar geri dönmeden yapılan bir seçimin sonucu olarak elde edilmesi gerçeğinden azaltılması Renkler ve bu tür seçimlerin her biri, hipotezleri uygun genelleştirilmiş düzende test etmek için kriterlerin anlaşmasının oluşturulmasında aynı olasılığa sahiptir; - tanıtılan logaritmik genelleştirilmiş metrik ile sonsuz boyutlu bir simpleks üzerinde entropi ve Kullback-Leibler-Sanov bilgi mesafesi fonksiyonlarının sürekliliği; - yarı üstel durumda genelleştirilmiş yerleştirme şemasında Cramer koşulunu karşılamayan simetrik ayrılabilir istatistiklerin büyük sapmalarının olasılıklarının kaba (logaritmik eşdeğerliğe kadar) asimptotiklerine ilişkin bir teorem;

Kullback - Leibler - Sanov bilgi mesafesinin sürekliliği

Genelleştirilmiş yerleşim şemaları /24/'de V.F. Kolchin tarafından tanıtıldı. Polinom şemasındaki köknar miktarlarına r tanecikli hücre sayısı adı verildi ve V. F. Kolchin, B. A. Sevastyanov, V. P. Chistyakov /27/ tarafından yazılan monografide ayrıntılı olarak incelenmiştir. Genelleştirilmiş düzenlerdeki değerleri V.F. Kolchin tarafından /25/,/26/'da incelenmiştir. Formun (0.3) istatistikleri ilk olarak /30/'da Yu I. Medvedev tarafından değerlendirildi ve ayrılabilir (toplamsal olarak ayrılabilir) istatistikler olarak adlandırıldı. (0.3)'teki /' fonksiyonları u'ya bağlı değilse, bu tür istatistiklere /31/ simetrik ayrılabilir istatistikler adı verilir. Genelleştirilmiş tahsis şemalarında ayrılabilir istatistiklerin momentlerinin asimptotik davranışı /9/'da G. I. Ivchenko tarafından elde edildi. Genelleştirilmiş bir yerleşim şeması için limit teoremleri de /23/'de ele alınmıştır. Limit teoremlerinin sonuçlarının ve ayrık olasılık şemalarındaki (0.2) anlaşma kriterlerinin incelemeleri, /8/'de V. A. Ivanov, G. I. Ivchenko, Yu. I. Medvedev ve G. I. Ivchenko, Yu. I. Medvedev, A.F. Ronzhin tarafından verilmiştir. /14/. Genelleştirilmiş düzenler için anlaşma kriterleri /38/'de A.F. Ronzhin tarafından değerlendirildi.

Bu çalışmalarda istatistiksel kriterlerin özelliklerinin karşılaştırılması göreceli asimptotik verimlilik açısından yapılmıştır. Yakınsak (bitişik) hipotezler durumu dikkate alındı ​​- Pitman anlamında verimlilik ve yakınsak olmayan hipotezler - Bahadur, Hodges - Lehman ve Chernov anlamında verimlilik. Farklı göreceli performans istatistiksel testleri arasındaki ilişki örneğin /49/'da tartışılmaktadır. Yu.I. Medvedev'in /31/'de ayrılabilir istatistiklerin bir polinom şemasında dağılımı hakkındaki sonuçlarından aşağıdaki gibi, bir polinom şemasındaki sonuçların frekanslarına ilişkin ayrılabilir istatistikler sınıfında yakınsak hipotezler altında en büyük asimptotik güç, kriter ki-kare istatistiğine dayanmaktadır. Bu sonuç A.F. Ronzhin tarafından /38/'deki (0.2) tipi devreler için genelleştirildi. I. I. Viktorova ve V. P. Chistyakov /4/'de köknarın doğrusal fonksiyonları sınıfındaki bir polinom şeması için en uygun kriteri oluşturdular. A.F. Ronzhin, /38/'de sıfır hipotezine yakın olmayan bir dizi alternatif verildiğinde, istatistik sınıfında birinci türden bir hata olasılığının sıfıra yöneldiği logaritmik oranı en aza indiren bir kriter oluşturdu. formu (0.6). Yaklaşan ve yaklaşmayan hipotezler altında ki-kare ve maksimum olasılık oranı istatistiklerinin göreceli performansının karşılaştırılması /54/'de gerçekleştirilmiştir. Tez, yakınsamayan hipotezlerin durumunu değerlendirdi. Yakınsamayan hipotezler altında kriterlerin göreceli istatistiksel etkinliğinin incelenmesi, 0(u/n) düzeyindeki aşırı büyük sapmaların olasılıklarının incelenmesini gerektirir. İlk kez, sabit sayıda sonuç içeren bir polinom dağılımına ilişkin böyle bir problem, /40/'da I. N. Sanov tarafından çözüldü. Yakınsamayan alternatiflere sahip sonlu sayıda sonuç durumunda çok terimli bir dağılım için basit ve karmaşık hipotezleri test etmek için uyum iyiliği testlerinin asimptotik optimalliği /48/'de ele alınmıştır. Bilgi mesafesinin özellikleri daha önce Kullback, Leibler /29/,/53/ ve I. II tarafından ele alınmıştı. Sanov /40/ ve Hoeffding /48/. Bu çalışmalarda Öklid metriğinde sonlu boyutlu uzaylarda bilgi mesafesinin sürekliliği dikkate alınmıştır. Bazı yazarlar, örneğin Yu.V. Prokhorov'un çalışmasında /37/ veya V.I. Bogachev, A.V. Kolesnikov'un /1/ çalışmasında artan boyutlara sahip bir alan dizisini değerlendirdi. Cramer koşulu altında genelleştirilmiş yerleştirme şemalarında ayrılabilir istatistiklerdeki büyük sapmaların olasılıkları üzerine kaba (logaritmik eşdeğerliğe kadar) teoremler A. F. Roizhin /38/'de. A. N. Timashev /42/,/43/'de bir vektörün büyük sapma olasılıkları üzerine kesin (eşdeğerliğe kadar) çok boyutlu integral ve yerel limit teoremleri elde etti

Bağımsız rastgele değişkenler durumunda Cramer koşulu karşılanmadığında büyük sapma olasılıklarının incelenmesi A. V. Nagaev /35/'in çalışmalarında gerçekleştirilmiştir. Eşlenik dağılımların yöntemi Feller /45/ tarafından anlatılmıştır.

Biraz farklı bir formülasyonda geri dönüşsüz bir seçim şemasındaki hipotezlerin test edilmesine ve parametrelerin tahmin edilmesine ilişkin istatistiksel problemler, tahmin problemlerinin sonlu bir popülasyon için çözüldüğü G. I. Ivchenko, V. V. Levin, E. E. Timonina /10/, /15/ tarafından ele alındı. elemanlarının sayısı bilinmeyen bir miktar olduğundan, geri dönüşsüz bir seçim şemasındaki bağımsız örneklerden alınan çok değişkenli S - istatistiklerinin asimptotik normalliği kanıtlandı. Bağımsız deneme dizilerindeki tekrarlarla ilişkili rastgele değişkenleri inceleme sorunu, A. M. Zubkov, V. G. Mikhailov, A. M. Shoitov tarafından /6/, /7/, /32/, /33/, /34/'de incelenmiştir. Genel Markov-Pólya modeli çerçevesinde hipotezlerin tahmin edilmesi ve test edilmesine ilişkin temel istatistiksel problemlerin bir analizi, G. I. Ivchenko, Yu. I. Medvedev tarafından /13/'de gerçekleştirilmiş olup, olasılık analizi /11'de verilmiştir. /. Genelleştirilmiş yerleştirme şemasına (0.2) indirgenemeyen bir dizi kombinatoryal nesne üzerinde tekdüze olmayan olasılık ölçümlerini belirlemeye yönelik bir yöntem, G. I. Ivchenko, Yu. I. Medvedev /12/'de açıklanmıştır. Tekrarlanan formüller kullanılarak yapılan hesaplamalar sonucunda cevabın elde edilebildiği olasılık teorisindeki bir dizi problem, A. M. Zubkov tarafından /5/'de belirtilmiştir.

Ayrılabilir istatistiklerin bilgi mesafesi ve büyük sapma olasılıkları

Cramer koşulu sağlanmadığında, dikkate alınan yedi üstel durumda genelleştirilmiş yerleştirme şemasındaki ayrılabilir istatistiklerin büyük sapmaları, bir bağımsız terimin sapma olasılığı ile belirlenir. Cramer'in koşulu sağlandığında, /39/'da vurgulandığı gibi durum böyle değildir. Açıklama 10. φ(x) fonksiyonu, AН)'nin matematiksel beklentisi 0 t 1 için sonlu ve t 1 için sonsuz olacak şekildedir. Açıklama 11. Cramer koşulunu sağlamayan ayrılabilir istatistikler için limit (2.14) 0'a eşittir, bu da /39/ ile ifade edilen hipotezin geçerliliğini kanıtlar. Açıklama 12. n, ./V - co ve böylece - A için bir polinom şemasındaki ki-kare istatistiği için, teoremden hemen şu sonuç çıkar: Bu sonuç doğrudan /54/'de elde edilmiştir. Bu bölümde, hücrelerdeki genelleştirilmiş parçacık yerleştirme şemalarının parametrelerindeki değişikliklerin merkezi bölgesinde, hücre sayısından toplanarak ayrılabilir istatistiklerin ve hücre sayısından fonksiyonların büyük sapma olasılıklarının kaba (logaritmik eşdeğerliğe kadar) asimptotikleri belirli bir dolguya sahip hücreler bulundu.

Eğer Cramer koşulu sağlanırsa, o zaman büyük sapma olasılıklarının kaba asimptotikleri, rasyonel koordinatlara sahip bir noktalar dizisine girme olasılıklarının kaba asimptotikleri tarafından belirlenir ve yukarıdaki anlamda, en uç noktanın olduğu noktaya yakınsar. karşılık gelen bilgi mesafesine ulaşılır.

Rastgele değişkenler f(i),..., f(n) için Cramer koşulunun yerine getirilmemesinin yedi üstel durumu dikkate alındı; burada b, kr, genelleştirilmiş ayrıştırma şemasını (0.2), f oluşturan bağımsız rastgele değişkenlerdir. (k), (0.3)'teki simetrik toplanabilir ayrılabilir istatistiklerin tanımındaki bir fonksiyondur. Yani, p(k) = - lnP(i = k) ve f(k) fonksiyonlarının sırasıyla p 0 ve q 0 mertebesinde sürekli bir argümanın düzenli olarak değişen fonksiyonlarına genişletilebileceği varsayılmıştır ve p Q. Genelleştirilmiş yerleştirme şemalarında ayrılabilir istatistiklerin büyük sapma olasılıklarının kaba asimptotiklerine ana katkının, karşılık gelen nokta dizisindeki iyonizasyon olasılığının kaba asimptotikleri tarafından benzer şekilde yapıldığı ortaya çıktı. Daha önce ayrılabilir istatistikler için büyük sapmaların olasılıkları hakkındaki teoremin eyer noktası yöntemi kullanılarak kanıtlandığını ve asimptotiklere asıl katkının tek bir eyer noktası tarafından yapıldığını belirtmek ilginçtir. Cramer koşulunun karşılanmaması durumunda 2-kN koşulunun karşılanmaması durumu henüz araştırılmamıştır.

Cramer koşulu karşılanmazsa, belirtilen koşul yalnızca p 1 durumunda sağlanamayabilir. Poisson dağılımı ve geometrik dağılım p = 1 için karşılık gelen olasılıkların logaritmasından doğrudan anlaşıldığı gibi. Cramer koşulu karşılanmadığında büyük sapma olasılıklarının asimptotikleri sonucundan, istatistikleri Cramer koşulunu sağlamayan kriterlerin, hata olasılıklarının sıfıra doğru önemli ölçüde daha düşük bir eğilim oranına sahip olduğu sonucuna varabiliriz. birinci türden bir hatanın sabit olasılığı olan ikinci tür ve istatistikleri Cramer koşulunu karşılayan kriterlere kıyasla yakınsamayan alternatifler. N - 1 1 beyaz ip-JV 1 siyah top içeren bir torbadan tamamen tükenene kadar geri dönmeden bir seçim yapılsın. 1 i\ ... r -i n - 1 seçeneğindeki beyaz topların yerlerini komşu beyaz toplar hi,..., h arasındaki uzaklık dizisine şu şekilde bağlarız: O halde hv l,v =1,.. ,N,M EjLi i/ - n- V(hv = rv,v = l,...,N) değerini ayarlayarak h = (hi,...,Lg) vektörleri kümesi üzerinde bir olasılık dağılımı tanımlayalım. ) burada i,...,lg - bağımsız negatif olmayan tamsayı rastgele değişkenler (r.v.), yani genelleştirilmiş tahsis şemasını (0.2) dikkate alın. h vektörünün dağılımı n,N'ye bağlıdır, ancak gösterimi basitleştirmek için mümkün olan yerlerde karşılık gelen indeksler çıkarılacaktır. Açıklama 14. Bir torbadan topları seçmenin (]) yollarından her birine, herhangi bir r i,..., rg için aynı olasılık (\) mn atanırsa, öyle ki r" 1,u = l,...,N , T,v=\ru = n, seçimdeki bitişik beyaz toplar arasındaki mesafelerin bu değerleri alma olasılığı

Genel yerleşimlerdeki hücre sayısına dayalı kriterler

Tez çalışmasının amacı, 2 renkli top içeren bir kavanozdan geri dönmeden bir seçim şemasındaki hipotezleri test etmek için uyum iyiliği kriterleri oluşturmaktı. Yazar, aynı renkteki toplar arasındaki mesafelerin frekanslarına dayalı istatistikler incelemeye karar verdi. Bu formülasyonda sorun, hipotezlerin uygun bir genel düzende test edilmesi görevine indirgenmiştir.

Tez çalışması şunları içeriyordu: Sınırlı bir matematiksel beklenti ile sınırsız sayıda sonuca sahip ayrık dağılımların entropi özellikleri ve bilgi mesafesi; - genelleştirilmiş bir yerleştirme şemasında geniş bir istatistik sınıfının büyük sapma olasılıklarının kaba (logaritmik eşdeğerliğe kadar) asimptotikleri elde edildi; - elde edilen sonuçlara dayanarak, ikinci tür bir hatanın sabit olasılığı ile birinci türden bir hata olasılığının sıfıra yönelmesinin en yüksek logaritmik oranına sahip bir kriter fonksiyonu ve yakınsamayan alternatifler oluşturulmuştur; - Cramer koşulunu sağlamayan istatistiklerin, bu koşulu karşılayan istatistiklerle karşılaştırıldığında büyük sapma olasılıklarının sıfıra yakınsama oranının daha düşük olduğu kanıtlanmıştır. Eserin bilimsel yeniliği şu şekildedir. - genelleştirilmiş bir metrik kavramı verilmiştir - sonsuz değerleri kabul eden ve kimlik, simetri ve üçgen eşitsizliği aksiyomlarını karşılayan bir fonksiyon. Genelleştirilmiş bir metrik bulunur ve sayılabilir sayıda sonucu olan ayrık dağılımlar ailesinde tanımlanan entropi ve bilgi mesafesi fonksiyonlarının bu metrikte sürekli olduğu kümeler gösterilir; - genelleştirilmiş yerleştirme şemasında, Cramer koşulunun karşılık gelen formunu karşılayan, formun (0.4) istatistiklerindeki büyük sapma olasılıkları için kaba (logaritmik eşdeğerliğe kadar) bir asimptotik bulunmuştur; - genelleştirilmiş yerleştirme şemasında, Cramer koşulunu karşılamayan simetrik ayrılabilir istatistiklerin büyük sapma olasılıkları için kaba (logaritmik eşdeğerliğe kadar) bir asimptotik bulunmuştur; - formun (0.7) kriter sınıfında, kriter endeksinin en yüksek değerine sahip bir kriter oluşturulur. Çalışma, genelleştirilmiş yerleştirme planlarındaki büyük sapma olasılıklarının davranışına ilişkin bir dizi soruyu çözmektedir. Elde edilen sonuçlar, matematiksel istatistik ve bilgi teorisi uzmanlıklarındaki eğitim sürecinde, ayrık dizilerin analizi için istatistiksel prosedürlerin incelenmesinde kullanılabilir ve /3/, /21/'de birinin güvenliğini haklı çıkarmak için kullanılmıştır. bilgi sistemleri sınıfı. Ancak bir takım sorular hala açık kalıyor. Yazar kendisini merkezi değişim bölgesini dikkate almakla sınırladı parametreler n,N/V hücrelerine n tanecik yerleştirmek için genelleştirilmiş şemalar. Genelleştirilmiş düzenleme şemasını (0.2) oluşturan rastgele değişkenlerin dağılımının taşıyıcısı r, r 4-1, r + 2,... biçiminde bir küme değilse, o zaman bilgi mesafesi fonksiyonunun sürekliliğini kanıtlarken ve Büyük sapmaların olasılıklarını inceleyerek, bu tür bir taşıyıcının yazarın çalışmasında dikkate alınmayan aritmetik yapısını hesaba katmak gerekir. Maksimum endeks değerine sahip önerilen fonksiyon temelinde oluşturulan kriterlerin pratik uygulaması için, dağılımının hem sıfır hipotezi hem de yakınsak olanlar dahil alternatifler altında incelenmesi gerekir. Geliştirilen yöntemlerin aktarılması ve elde edilen sonuçların genelleştirilmiş yerleştirme şemaları dışındaki diğer olasılıksal şemalara genellenmesi de ilgi çekicidir. Eğer //1,/ 2,-.., sonuç sürüsü olasılıkları 1 -POj olan bir binom şemasında 0 sonuç sayıları arasındaki mesafelerin frekansları ise, bu durumda, /26/'de kanıtlanmış genelleştirilmiş bir yerleştirme şemasında değerlerin ortak dağılımına ilişkin formül, genel olarak konuşursak, dağılımın (3.3) genel durumda değerlerin ortak bir dağılımı olarak temsil edilemeyeceği sonucu çıkar. Parçacıkları hücrelere yerleştirmek için herhangi bir genelleştirilmiş şemada cg. Bu dağılım, /12/'de tanıtılan kombinatoryal nesneler kümesindeki dağılımların özel bir durumudur. Genelleştirilmiş yerleştirme şemalarına yönelik tez çalışmasının sonuçlarının /52/'de tartışılan bu vakaya aktarılması acil bir görev gibi görünmektedir.

Yükleniyor...