ekosmak.ru

Dağılım parametrelerinin istatistiksel tahminleri. Dağılım parametrelerinin nokta tahmini İstatistiksel tahmin ve özellikleri

Rastgele bir değişkenin dağılımı (genel popülasyon dağılımı) genellikle bir dizi sayısal özellik ile karakterize edilir:

  • normal bir dağılım için, N(a, σ) matematiksel beklenti a ve standart sapma σ'dır;
  • düzgün bir dağılım için R(a,b), bu rastgele değişkenin değerlerinin gözlendiği aralığın sınırlarıdır.
Kural olarak bilinmeyen bu tür sayısal özelliklere denir. nüfus parametreleri . Parametre Tahmini - numuneden hesaplanan karşılık gelen sayısal özellik. Nüfus parametresi tahminleri iki sınıfa ayrılır: nokta Ve aralık.

Bir tahmin tek bir sayı ile tanımlandığında, buna denir. Nokta tahmini. Nokta Tahminiörneğin bir fonksiyonu olarak rastgele bir değişkendir ve tekrarlanan deneyler sırasında örnekten örneğe değişir.
Puan tahminleri, herhangi bir anlamda "iyi" olmaları için yerine getirmeleri gereken gerekliliklere tabidir. Bu tarafsızlık, yeterlik Ve ödeme gücü.

Aralık Tahminleri iki sayı ile belirlenir - tahmini parametreyi kapsayan aralığın uçları. Tahmini parametrenin onlardan ne kadar uzakta olabileceğine dair bir fikir vermeyen nokta tahminlerinin aksine, aralık tahminleri, tahminlerin doğruluğunu ve güvenilirliğini belirlemenizi sağlar.

Matematiksel beklenti, varyans ve standart sapmanın nokta tahminleri olarak, sırasıyla örnek ortalaması, örnek varyansı ve örnek standart sapması, örnek özellikleri kullanılır.

Tahmin tarafsız özelliği.
Tahmin için arzu edilen bir gereklilik, sistematik hatanın olmamasıdır, yani tahmininin θ parametresi yerine tekrarlanan kullanımda, yaklaşıklık hatasının ortalama değeri sıfırdır - bu değerleme tarafsız mülk.

Tanım. Matematiksel beklentisi, tahmin edilen parametrenin gerçek değerine eşitse, bir tahmin tarafsız olarak adlandırılır:

Örnek aritmetik ortalama, matematiksel beklentinin yansız bir tahminidir ve örnek varyansı - genel varyansın yanlı tahmini D. Genel varyansın tarafsız tahmini, tahmindir.

Değerlendirme tutarlılığı özelliği.
Bir tahmin için ikinci gereklilik - tutarlılığı - örneklem büyüklüğündeki artışla birlikte tahminde bir iyileşme anlamına gelir.

Tanım. Seviye olasılık olarak tahmin edilen θ parametresine n→∞ olarak yaklaşıyorsa tutarlı olarak adlandırılır.


Olasılıkta yakınsama, büyük bir örneklem boyutuyla, tahminin gerçek değerden büyük sapma olasılığının küçük olduğu anlamına gelir.

Verimli Tahmin Özelliği.
Üçüncü gereklilik, aynı parametrenin birkaç tahmininden en iyi tahmini seçmenize izin verir.

Tanım. Tüm tarafsız tahminciler arasında en küçük varyansa sahipse, tarafsız bir tahminci etkilidir.

Bu, etkili tahminin, parametrenin gerçek değeri hakkında minimum dağılıma sahip olduğu anlamına gelir. Etkili bir tahmin edicinin her zaman mevcut olmadığına dikkat edin, ancak genellikle iki tahmin ediciden daha verimli bir tahminci seçilebilir, yani, daha az dağılım ile. Örneğin, normal bir genel popülasyonun N(a,σ) bilinmeyen bir parametresi için, hem örnek aritmetik ortalama hem de örnek medyan tarafsız bir tahmin olarak alınabilir. Ancak örneklem medyanının varyansı, aritmetik ortalamanın varyansından yaklaşık 1,6 kat daha fazladır. Bu nedenle, daha verimli bir tahmin, örnek aritmetik ortalamadır.

Örnek 1. Ölçüm sonuçları (mm cinsinden): 13,15,17 olan bir cihaz tarafından (sistematik hatalar olmadan) bazı rastgele değişkenlerin ölçümlerinin varyansının tarafsız bir tahminini bulun.
Çözüm. Göstergeleri hesaplama tablosu.

X|x - x cf |(x - x sr) 2
13 2 4
15 0 0
17 2 4
45 4 8

basit aritmetik ortalama(tarafsız beklenti tahmini)


Dağılım- ortalama değeri etrafındaki yayılma ölçüsünü karakterize eder (dağılım ölçüsü, yani ortalamadan sapma - yanlı bir tahmin).


Tarafsız varyans tahmincisi- varyansın tutarlı tahmini (düzeltilmiş varyans).

Örnek 2. Ölçüm sonuçları (mm cinsinden): 4,5,8,9,11 olan bir cihaz tarafından (sistematik hatalar olmadan) bazı rastgele değişkenlerin ölçümlerinin matematiksel beklentisinin tarafsız bir tahminini bulun.
Çözüm. m = (4+5+8+9+11)/5 = 7,4

Örnek 3. Örnek varyansı D = 180 ise, n=10 örnek boyutu için düzeltilmiş varyans S 2'yi bulun.
Çözüm. S 2 \u003d n * D / (n-1) \u003d 10 * 180 / (10-1) \u003d 200

istatistiksel tahmin dağılım örneği

Tahmin, seçici bir gözlemin sonuçlarına dayanarak elde edilen, istenen değerin değerlerinin bir yaklaşımıdır. Tahminler rastgele değişkenlerdir. Genel popülasyonun bilinmeyen parametreleri hakkında makul bir yargıya varma olasılığını sağlarlar. Genel ortalamayı tahmin etmenin bir örneği, genel varyansın örnek ortalamasıdır - örnek varyans, vb.

Değerlendirmenin ilgili genel özelliği ne kadar “iyi” karşıladığını değerlendirmek için 4 kriter geliştirilmiştir: tutarlılık, yansızlık, etkinlik ve yeterlilik. Bu yaklaşım, bir tahminin kalitesinin bireysel değerleri tarafından değil, rastgele bir değişken olarak dağılımının özellikleri tarafından belirlendiği gerçeğine dayanmaktadır.

Olasılık teorisi hükümlerine dayanarak, aritmetik ortalama, mod ve medyan gibi örnek özelliklerin yalnızca aritmetik ortalamanın genel ortalamanın tutarlı, yansız, verimli ve yeterli bir tahmini olduğu kanıtlanabilir. Bu, bir dizi başka örnek özelliğinde aritmetik ortalamaya verilen tercihi belirler.

tarafsız değerlendirme, herhangi bir örneklem büyüklüğü için matematiksel beklentisinin, genel popülasyondaki tahmin edilen parametrenin değerine eşit olduğu gerçeğinde kendini gösterir. Bu gereklilik karşılanmazsa, tahmin yerinden edilmiş.

Tarafsız tahminin koşulu, sistematik tahmin hatalarını ortadan kaldırmayı amaçlar.

Değerlendirme problemlerini çözerken, ayrıca asimptotik olarak tarafsız tahminler, bunun için, örneklem büyüklüğündeki artışla birlikte, matematiksel beklenti genel popülasyonun tahmin edilen parametresine yönelir.

ödeme gücü istatistiksel tahminler, örneklem büyüklüğündeki bir artışla, tahminin tahmin edilen parametrenin gerçek değerine giderek daha fazla yaklaşması veya dedikleri gibi, tahminin olasılık açısından istenen parametreye yaklaşması veya eğiliminde olması gerçeğinde kendini gösterir. matematiksel beklenti. Yalnızca tutarlı tahminler pratik öneme sahiptir.

Bu, belirli bir örneklem büyüklüğü için en küçük varyansa sahip tarafsız parametrenin tahminidir. Uygulamada, tahminin varyansı genellikle tahminin hatasıyla tanımlanır.

Gibi değerlendirme etkinliği önlemleri mümkün olan minimum varyansın başka bir tahminin varyansına oranını alın.

Genel popülasyonun bilinmeyen bir özelliği hakkında örneklemde yer alan tüm bilgilerin kullanımının eksiksiz olmasını sağlayan bir tahmine denir. yeterli(kapsamlı).

Yukarıda tartışılan istatistiksel tahminlerin özelliklerine uygunluk, genel popülasyonun parametrelerini mümkün olan en iyi şekilde tahmin etmek için örnek özelliklerinin dikkate alınmasını mümkün kılar.

Matematiksel istatistiğin en önemli görevi, örnek verilerden genel popülasyonun istenen parametrelerinin en rasyonel, "doğru" istatistiksel tahminlerini elde etmektir. İki tür istatistiksel çıkarım vardır: istatistiksel değerlendirme; istatistiksel hipotezlerin test edilmesi.

İstatistiksel tahminler elde etmenin ana görevi, genel popülasyonun bilinmeyen parametrelerinin anlamlı bir şekilde değerlendirilmesi olasılığını sağlayan en iyi tahminleri seçmek ve gerekçelendirmektir.

Bilinmeyen parametreleri tahmin etme sorunu iki şekilde çözülebilir:

  • 1. Bilinmeyen bir parametre bir sayı (nokta) ile karakterize edilir - nokta tahmini yöntemi kullanılır;
  • 2. Aralık tahmini, yani istenen parametrenin bir miktar olasılıkla bulunabileceği bir aralık belirlenir.

Nokta Tahmini bilinmeyen parametrenin büyük bir kısmı, örneklem tahmininin belirli bir sayısal değerinin, genel popülasyonun gerçek parametresine en iyi yaklaşım olarak alınması, yani genel popülasyonun bilinmeyen parametresinin bir sayı (nokta) ile tahmin edilmesi gerçeğinde yatmaktadır. numuneden belirlenir. Bu yaklaşımda her zaman hata yapma riski vardır, bu nedenle nokta tahmini, belirli bir olasılık düzeyinde olası hatanın bir göstergesi ile desteklenmelidir.

Standart sapması, ortalama tahmin hatası olarak alınır.

Daha sonra genel ortalamanın nokta tahmini bir aralık olarak temsil edilebilir.

örnek aritmetik ortalama nerede.

Nokta tahmininde, örnek verilerden tahminler elde etmek için çeşitli yöntemler kullanılır:

  • 1. genel popülasyonun anlarının numunenin anlarıyla değiştirildiği anlar yöntemi;
  • 2. en küçük kareler yöntemi;
  • 3. maksimum olasılık yöntemi.

Birçok problemde, sadece genel popülasyonun parametresinin sayısal bir tahminini bulmak değil, aynı zamanda doğruluğunu ve güvenilirliğini de değerlendirmek gerekir. Bu nispeten küçük örnekler için özellikle önemlidir. İstatistiksel bir parametrenin nokta tahmininin genelleştirilmesi, aralık tahmini- belirli bir olasılıkla tahmin edilen parametreyi içeren sayısal bir aralığın bulunması.

Örnek verilerden genel özelliklerin belirlenmesinde her zaman bir miktar hata olduğu gerçeğinden dolayı, genel özelliğin tahmin edilen parametresinin gerçek istenen değerinin bulunduğu bulunan nokta tahmininde merkezli aralığı belirlemek daha pratiktir. verilen belirli bir olasılık. Böyle bir aralığa güven aralığı denir.

Güven aralığı belirli bir olasılıkla r ile genel popülasyonun tahmin edilen parametresini kapsayan sayısal bir aralıktır. Bu olasılığa güven denir. güven olasılığı r, örnek gözlemlere dayanarak elde edilen özelliklerin güvenilirliğini yargılamak için çözülmekte olan problem çerçevesinde yeterli kabul edilebilecek olasılıktır. değer

hata yapma olasılığına denir anlamlılık düzeyi.

Genel popülasyonun VE parametresinin seçici (nokta) tahmini VE * (teta) doğruluğu için ( marjinal hata) D ve güven olasılığı r güven aralığı eşitlikle belirlenir:

Güven olasılığı r, kurulmasını mümkün kılar güven limitleriçalışılan parametrenin rastgele dalgalanması Ve belirli bir numune için.

Aşağıdaki değerler ve bunlara karşılık gelen değerler genellikle bir güven düzeyi olarak alınır. anlamlılık seviyeleri

Tablo 1. En sık kullanılan güven düzeyleri ve anlamlılık düzeyleri

Örneğin, yüzde 5 önem düzeyi şu anlama gelir: 100 vakadan 5'inde, örnek verilerden popülasyonun özelliklerini belirlemede hata yapma riski vardır. Ya da başka bir deyişle 100 vakanın 95'inde örneklem bazında belirlenen genel özellik güven aralığında olacaktır.

Örneğin, genel popülasyonun niceliksel bir işaretini incelemek istensin. Varsayalım ki, teorik değerlendirmelerden, hangi dağılımın bir özelliği olduğunu belirlemenin mümkün olduğunu varsayalım. Doğal olarak, bu dağılımı belirleyen parametrelerin tahmin edilmesi sorunu ortaya çıkmaktadır. Örneğin, incelenen özelliğin genel popülasyonda normal olarak dağıldığı önceden biliniyorsa, bu iki parametre normali tamamen belirlediğinden, matematiksel beklenti a ve standart sapma s'yi tahmin etmek (yaklaşık olarak bulmak) gerekir. dağıtım.

Genellikle, araştırmacının elinde yalnızca örnek veriler vardır, örneğin, n gözlem sonucunda elde edilen nicel bir özelliğin x 1, x 2, ..., x n değerleri. Bu veriler aracılığıyla ve tahmin edilen parametreyi ifade edin.

q* teorik dağılımın bilinmeyen parametresi q'nun istatistiksel bir tahmini olsun. Ayırt etmek tarafsız Ve yerinden edilmiş tahminler.

tarafsız matematiksel beklentisi, herhangi bir örneklem boyutu için tahmin edilen parametre q'ya eşit olan istatistiksel bir tahmin q * olarak adlandırılır, yani

Aksi takdirde, yani M(q *) ¹ q ise, tahmin yerinden edilmiş.

Tarafsızlık şartı, gözlenen değerlerin q'dan aynı yönde sistematik bir sapma olmaması gerektiği anlamına gelir.

İstatistiksel değerlendirme için de bir gereklilik vardır. yeterlik, bu (belirli bir örneklem büyüklüğü için) mümkün olan en küçük varyansı ifade eder ve büyük bir örneklem büyüklüğü olması durumunda, gereklilik ödeme gücü yani, rastgele değişkenin gözlenen değerlerinin tahmin edilen parametre ile pratik olarak çakışması.

İstatistiksel materyal bir varyasyon dizisi şeklinde sunulursa, sonraki analizi, kural olarak, çalışılan genel popülasyonun doğasında var olan kalıpları tamamen yansıtan bazı sabit değerlerin yardımıyla gerçekleştirilir.

Bu sabitler, aralarında en önemli olanın ortalama değerleri içerir. aritmetik ortalama- hem anlam hem de özellikler ve elde etme yöntemi açısından diğerlerinden daha basittir.

Genel popülasyon çalışmasında örnekleme yapıldığından, örneği karakterize eden sabite denir. örnek ortalama ve belirtilir.

var olduğu gösterilebilir yansız tahminci genel popülasyonun işaretinin aritmetik ortalama değeri, yani

Bazı kümelerin parçalara bölünmesine izin verin - gruplar, mutlaka aynı boyutta değil. Daha sonra grup üyelerinin aritmetik ortalama dağılımlarına denir. grup ortalamaları ve tüm popülasyonun aynı temelinde dağılımın aritmetik ortalaması - genel ortalama. gruplar denir ayrık nüfusun her üyesi yalnızca bir gruba aitse.

Genel ortalama, örtüşmeyen tüm grupların grup araçlarının aritmetik ortalamasına eşittir.

Örnek.İşletme çalışanlarının ortalama ücretlerini tabloya göre hesaplayın

Çözüm. Tanım olarak, genel ortalama

. (*)

n 1 \u003d 40, n 2 \u003d 50, n 3 \u003d 60

1 numaralı dükkan çalışanlarının ortalama ücreti Bulmak için tüm dükkan için aritmetik ortalama maaşı derledik: 75, 85, 95 ve 105 (c.u.) Kolaylık sağlamak için bu değerler olabilir beş kat azaltıldı (bu onların en büyüğü ortak bölen): 15, 17, 19, 21. Gerisi formülden anlaşılır.

Benzer işlemleri yaptıktan sonra , buluyoruz.

Elde edilen değerleri (*) ile değiştirerek, elde ederiz

Ortalamalar, dağılımları belirli bir şekilde karakterize eden sabit değerlerdir. Bazı dağıtımlar yalnızca araçlarla değerlendirilir. Örneğin, seviyeleri karşılaştırmak için ücretlerçeşitli sanayi kollarında ortalama ücretlerin karşılaştırılması yeterlidir. Bununla birlikte, ortalamalar, en yüksek ve en düşük ücretli işçilerin ücret seviyeleri arasındaki farkları veya ortalama ücretlerden hangi sapmaların meydana geldiğini yargılamak için kullanılamaz.

İstatistikte, en büyük ilgi, bir özelliğin değerlerinin aritmetik ortalamaları etrafında yayılmasıdır. Uygulamada ve teorik çalışmalarda, bir özelliğin dağılımı daha çok dağılım ve standart sapma ile karakterize edilir.

Örnek varyans DB, özelliğin gözlemlenen değerlerinin ortalama değerlerinden sapma karelerinin aritmetik ortalaması olarak adlandırılır.

Örnek boyutu n özelliğinin tüm değerleri х 1 , х 2 , … х n farklıysa, o zaman

. (3)

X 1, x 2, ... x k özniteliğinin değerleri sırasıyla n 1, n 2, ... n k ve n 1 + n 2 + ... + n k \u003d n frekanslarına sahipse, o zaman

. (4)

Saçılma indeksinin karakteristik değerlerle aynı birimlerde ifade edilmesine ihtiyaç varsa, o zaman özet karakteristiği kullanabilirsiniz - standart sapma

Varyansı hesaplamak için genellikle formül kullanılır.

Popülasyon örtüşmeyen gruplara ayrılırsa, onları karakterize etmek için grup, grup içi, grup içi ve toplam varyans kavramlarını tanıtabiliriz.

Grup varyans, j'inci grup üyelerinin dağılımının ortalama grup ortalamalarına göre varyansıdır, yani

burada n i, x i değerinin frekansı, j grubunun hacmidir.

grup içi varyans, grup varyanslarının aritmetik ortalamasıdır

burada N j (j = 1, 2, …, m) ayrık grupların hacimleridir.

gruplar arası varyans, örtüşmeyen tüm grupların grup ortalamalarının ortak ortalamadan kare sapmalarının aritmetik ortalamasıdır, yani

.

Genel varyans, tüm popülasyonun niteliğinin değerlerinin toplam ortalamaya göre varyansıdır

,

nerede n ben - frekans değeri x ben ; - genel ortalama; n, tüm popülasyonun hacmidir.

Toplam varyans D'nin toplama eşit olduğu gösterilebilir, yani.

Örnek. Aşağıdaki iki gruptan oluşan popülasyonun toplam varyansını bulunuz.

İlk grup İkinci grup
x ben n ben x ben n ben

Çözüm. Grup ortalamalarını bulalım.

Grup varyanslarını bulalım

ortak ortalamayı bulalım

Gerekli toplam varyans

Yukarıda ele alınan tahminler genellikle nokta atışı, bu tahminler belirlendiği için bir numara. Ne zaman küçük hacimli tarafından belirlenen bir aralık tahmini kullanılır. iki sayı, aralığın sonları olarak adlandırılır.

Aralık tahminleri şunları belirlemeyi mümkün kılar: doğruluk ve güvenilirlik derecelendirmeler. Bu kavramların anlamlarını açıklayalım. Örnek verilerden bulunan istatistiksel özellik q * bilinmeyen parametre q'nun bir tahmini olarak hizmet etsin. Açıktır ki q *, q parametresini ne kadar doğru belirlerse, mutlak değer o kadar küçük olur. Başka bir deyişle, eğer d > 0 ve d ne kadar küçükse, tahmin o kadar doğru olur.

Böylece, d > 0 sayısı karakterize eder kesinlik tahminler. Ancak öte yandan istatistiksel yöntemler, q * tahmininin eşitsizliği karşıladığını kategorik olarak belirtmemize izin vermez. Burada sadece hakkında konuşabiliriz olasılıklar g, bu eşitsizliğin gerçekleştiği. Bu olasılığa g denir güvenilirlik (güven olasılığı) q'nun q * ile tahmin edilmesi.

Böylece, söylenenlerden şu sonuç çıkar:

(*) ilişkisi şu şekilde anlaşılmalıdır: aralığın (q * - d, q * + d) bilinmeyen q parametresini içermesi (kapsaması) olasılığı g'ye eşittir. Belirli bir g güvenilirliği ile bilinmeyen parametreyi kapsayan (q * - d, q * + d) aralığına güven aralığı denir.

Örnek. X rasgele değişkeni, bilinen bir standart sapma s = 3 ile normal bir dağılıma sahiptir. Örnek boyutu n = 36 ise ve tahminin güvenilirliği g = verilmişse, örnek ortalamadan bilinmeyen matematiksel beklenti a'yı tahmin etmek için güven aralıklarını bulun. 0.95.

Çözüm. not eğer rastgele değer X normal dağılır, ardından bağımsız gözlemlerden bulunan örnek ortalaması da normal dağılır ve dağılım parametreleri: , (bkz. sayfa 54).

ilişkisini şart koşuyoruz

.

(**) formülünü kullanarak (bkz. s. 43), içindeki X'i ve s'yi değiştirerek şunu elde ederiz:

Genel popülasyonun parametrelerinin istatistiksel tahminleri. İstatistiksel hipotezler

DERS 16

Genel popülasyonun niceliksel işaretini incelemek gerekli olsun. Varsayalım ki, teorik değerlendirmelerden, hangi dağılımın bir özelliği olduğunu belirlemenin mümkün olduğunu varsayalım. Bu, bu dağılımı belirleyen parametrelerin tahmin edilmesi sorununu doğurur. Örneğin, incelenen özelliğin genel popülasyonda normal yasaya göre dağıldığı biliniyorsa, matematiksel beklentiyi ve standart sapmayı tahmin etmek (yaklaşık olarak bulmak) gerekir, çünkü bu iki parametre normal dağılımı tamamen belirler. . Özelliğin bir Poisson dağılımına sahip olduğuna inanmak için nedenler varsa, bu dağılımı belirleyen parametreyi tahmin etmek gerekir.

Genellikle, dağıtımda, araştırmacının yalnızca örnek verileri vardır, örneğin, gözlemler sonucunda elde edilen nicel bir özelliğin değerleri (bundan sonra gözlemlerin bağımsız olduğu varsayılacaktır). Bu veriler aracılığıyla ve tahmin edilen parametreyi ifade eder.

Bağımsız rasgele değişkenlerin değerleri olarak ele alındığında , teorik bir dağılımın bilinmeyen bir parametresinin istatistiksel bir tahminini bulmanın, tahmin edilen parametrenin yaklaşık bir değerini veren gözlenen rastgele değişkenlerin bir fonksiyonunu bulmak anlamına geldiğini söyleyebiliriz. Örneğin, aşağıda gösterileceği gibi, normal bir dağılımın matematiksel beklentisini tahmin etmek için fonksiyon (bir özelliğin gözlenen değerlerinin aritmetik ortalaması) kullanılır:

.

Bu yüzden, istatistiksel değerlendirme teorik dağılımın bilinmeyen parametresine gözlenen rastgele değişkenlerin bir fonksiyonu denir. Genel popülasyonun bilinmeyen bir parametresinin tek bir sayı olarak yazılan istatistiksel tahminine ne ad verilir? nokta. Aşağıdaki nokta tahminlerini göz önünde bulundurun: önyargılı ve tarafsız, etkili ve tutarlı.

İstatistiksel tahminlerin, tahmin edilen parametrelere "iyi" yaklaşımlar verebilmesi için belirli gereklilikleri karşılamaları gerekir. Bu gereksinimleri belirtelim.

Teorik dağılımın bilinmeyen parametresinin istatistiksel bir tahmini olsun. Hacmi örnek alırken bir tahminin bulunduğunu varsayalım. Deneyi tekrarlayalım, yani genel popülasyondan aynı büyüklükte başka bir örnek çıkaracağız ve verilerini kullanarak bir tahmin bulacağız vb. Deneyi birçok kez tekrarlayarak sayıları elde ederiz. , genel olarak konuşursak, birbirinden farklı olacaktır. Böylece, tahmin rastgele bir değişken olarak kabul edilebilir ve sayılar olası değerler olarak

Tahmin, fazlalıklı yaklaşık bir değer verirse, örneklerin verilerinden bulunan her sayının gerçek değerinden daha büyük olacağı açıktır. Bu nedenle, bu durumda, rastgele değişkenin matematiksel (ortalama değeri) değerinden büyük olacaktır, yani, olacaktır. Açıkçası, dezavantajlı yaklaşık bir değer veriyorsa, o zaman .


Bu nedenle, matematiksel beklentisi tahmin edilen parametreye eşit olmayan istatistiksel bir tahminin kullanılması sistematik (tek işaretli) hatalara yol açar. Bu nedenle, tahminin matematiksel beklentisinin tahmin edilen parametreye eşit olması doğaldır. Bu gerekliliğe uygunluk genel olarak hataları ortadan kaldırmasa da (bazı değerler , 'den büyük ve diğerleri daha küçüktür), farklı işaretlerdeki hatalar eşit sıklıkta ortaya çıkacaktır. Bununla birlikte, gereksinime uygunluk, sistematik hatalar elde etmenin imkansızlığını garanti eder, yani sistematik hataları ortadan kaldırır.

tarafsız matematiksel beklentisi herhangi bir örneklem boyutu için tahmin edilen parametreye eşit olan, yani, istatistiksel tahmin (hata) olarak adlandırılır.

yerinden edilmiş matematiksel beklentisi, herhangi bir örneklem büyüklüğü için tahmin edilen parametreye eşit olmayan, yani istatistiksel bir tahmin olarak adlandırılır.

Bununla birlikte, tarafsız bir tahminin her zaman tahmin edilen parametrenin iyi bir tahminini verdiğini varsaymak hatalı olacaktır. Gerçekten de, olası değerler ortalamaları etrafında oldukça dağılmış olabilir, yani varyans önemli olabilir. Bu durumda, örneğin bir numunenin verilerinden bulunan tahmin, ortalama değerden ve dolayısıyla tahmin edilen parametrenin kendisinden çok uzak olabilir. Böylece yaklaşık bir değer olarak alarak büyük bir hata yapacağız. Ancak varyansın küçük olması isteniyorsa, büyük bir hata yapma olasılığı ortadan kalkacaktır. Bu nedenle istatistiksel değerlendirmede etkinlik şartı getirilmiştir.

verimli(belirli bir örneklem büyüklüğü için) mümkün olan en küçük varyansa sahip olan istatistiksel bir tahmin olarak adlandırılır.

Zengin olasılık olarak tahmin edilen parametreye eğilimli olan istatistiksel bir tahmin olarak adlandırılır, yani eşitlik doğrudur:

.

Örneğin, yansız tahmin edicinin varyansı sıfıra eğilimliyse, bu durumda böyle bir tahmin edicinin de tutarlı olduğu ortaya çıkar.

Tarafsızlık, verimlilik ve tutarlılık açısından genel ortalamayı ve varyansı en iyi tahmin eden örneklem özelliklerinin hangileri olduğu sorusunu düşünün.

Ayrı bir genel popülasyonun bazı niceliksel özelliklere göre çalışılmasına izin verin.

Genel ikincil genel popülasyonun özelliğinin değerlerinin aritmetik ortalaması denir. Aşağıdaki formülle hesaplanır:

§ - genel hacim popülasyonunun işaretinin tüm değerleri farklıysa;

§ – genel popülasyonun işaretinin değerleri sırasıyla frekanslara sahipse ve . Yani genel ortalama, karşılık gelen frekanslara eşit ağırlıklarla özellik değerlerinin ağırlıklı ortalamasıdır.

Yorum: birim popülasyonunun, özniteliğin farklı değerlerine sahip nesneler içermesine izin verin. Bu koleksiyondan rastgele bir nesne seçildiğini hayal edin. Örneğin, bir özellik değerine sahip bir nesnenin geri getirilme olasılığı açıkça eşittir. Başka herhangi bir nesne aynı olasılıkla çıkarılabilir. Böylece, bir özelliğin değeri, olası değerleri aynı olasılıklara eşit olan rastgele bir değişken olarak düşünülebilir. Bu durumda matematiksel beklentiyi bulmak zor değil:

Dolayısıyla, genel popülasyonun incelenen işaretini rastgele bir değişken olarak düşünürsek, işaretin matematiksel beklentisi bu işaretin genel ortalamasına eşittir: . Genel popülasyonun tüm nesnelerinin farklı özellik değerlerine sahip olduğunu varsayarak bu sonucu elde ettik. Genel popülasyonun aynı özellik değerine sahip birkaç nesne içerdiğini varsayarsak aynı sonuç elde edilecektir.

Niteliğin sürekli dağılımıyla elde edilen sonucu genel popülasyona genelleyerek, genel ortalamayı özelliğin matematiksel beklentisi olarak tanımlarız: .

Genel popülasyonu nicel bir niteliğe göre incelemek için bir hacim örneğinin çıkarılmasına izin verin.

Örnek ortalamaörnek popülasyonun özelliğinin değerlerinin aritmetik ortalaması denir. Aşağıdaki formülle hesaplanır:

§ - örnek hacmin işaretinin tüm değerleri farklıysa;

§ – örnekleme kümesinin özelliğinin değerleri sırasıyla frekanslara sahipse ve . Yani, örnek ortalama, karşılık gelen frekanslara eşit ağırlıklarla özellik değerlerinin ağırlıklı ortalamasıdır.

Yorum: bir numunenin verilerinden bulunan numune ortalaması, açıkça belli bir sayıdır. Aynı genel popülasyondan aynı büyüklükteki diğer numuneleri çıkarırsak, numune ortalaması numuneden numuneye değişecektir. Böylece örneklem ortalaması rastgele bir değişken olarak kabul edilebilir ve bu nedenle örneklem ortalamasının dağılımlarından (teorik ve ampirik) ve bu dağılımın sayısal özelliklerinden, özellikle örneklem dağılımının ortalama ve varyansından bahsedebiliriz. .

Ayrıca, eğer genel ortalama bilinmiyorsa ve bunun örnek verilerden tahmin edilmesi gerekiyorsa, o zaman örnek ortalama, tarafsız ve tutarlı bir tahmin olan genel ortalamanın bir tahmini olarak alınır (bu ifadeyi bizim kanıtlamamızı öneriyoruz). sahip olmak). Yukarıdakilerden, aynı genel popülasyondan yeterince büyük hacimli birkaç numunenin numune araçlarını bulmak için kullanılması durumunda, bunların yaklaşık olarak birbirine eşit olacağı sonucu çıkar. bu özellik numune araçlarının kararlılığı.

İki popülasyonun varyansları aynı ise, örneklemin genel olanlara yakınlığının örneklem büyüklüğünün genel popülasyon büyüklüğüne oranına bağlı olmadığına dikkat edin. Örnek boyutuna bağlıdır: örnek boyutu ne kadar büyükse, örnek ortalaması genel olandan o kadar az farklıdır. Örneğin, bir kümeden nesnelerin %1'i ve başka bir kümeden nesnelerin %4'ü seçilirse ve birinci numunenin hacmi ikinciden daha büyük çıkarsa, o zaman ilk numune ortalaması daha az farklı olacaktır. ikinciden karşılık gelen genel ortalama.

) matematiksel istatistik problemleri.

Olasılık dağılımlarının parametrik bir ailesi olduğunu varsayalım (basitlik için, rasgele değişkenlerin dağılımını ve bir parametrenin durumunu ele alacağız). Burada değeri bilinmeyen sayısal bir parametre var. Bu dağılımın ürettiği mevcut değer örneği ile tahmin edilmesi gerekir.

İki ana değerlendirme türü vardır: nokta tahminleri Ve güvenilirlik aralığı.

Nokta Tahmini

Nokta tahmini, bilinmeyen bir parametrenin değerinin tek bir sayı ile tahmin edildiği bir istatistiksel tahmin türüdür. Yani, örneğin işlevini (istatistik) belirtmeniz gerekir.

,

değeri bilinmeyen gerçek değere bir yaklaşım olarak kabul edilecektir.

Parametrelerin nokta tahminlerini oluşturmaya yönelik yaygın yöntemler şunları içerir: maksimum olasılık yöntemi, momentler yöntemi, nicelik yöntemi.

Aşağıda, nokta tahminlerinin sahip olabileceği veya olmayabileceği bazı özellikler verilmiştir.

ödeme gücü

Bir nokta tahmini için en bariz gerekliliklerden biri, yeterince verilen parametrenin gerçek değerine oldukça iyi bir yaklaşım beklenebilmesidir. büyük değerlerörnek boyut . Bu, tahminin gerçek değere yakınsaması gerektiği anlamına gelir. Bu değerlendirme özelliği denir ödeme gücü. Rastgele değişkenlerden bahsettiğimiz için farklı şekiller yakınsama, o zaman bu özellik tam olarak farklı şekillerde formüle edilebilir:

Sadece terimi kullanırken ödeme gücü, o zaman genellikle zayıf tutarlılığı kastederiz, yani, olasılıkta yakınsama.

Tutarlılık koşulu uygulamada kullanılan tüm tahminler için pratik olarak zorunludur. Tutarsız tahminler nadiren kullanılır.

Tarafsızlık ve asimptotik tarafsızlık

Parametre tahmini denir tarafsız, matematiksel beklentisi tahmin edilen parametrenin gerçek değerine eşitse:

.

Daha zayıf koşul asimptotik tarafsızlık, bu, tahminin matematiksel beklentisinin, örneklem büyüklüğündeki artışla parametrenin gerçek değerine yakınsadığı anlamına gelir:

.

Tarafsızlık, tahmincilerin tavsiye ettiği bir özelliktir. Bununla birlikte, önemi fazla tahmin edilmemelidir. Çoğu zaman, yansız parametre tahminleri vardır ve sonra kişi yalnızca bunları dikkate almaya çalışır. Ancak, yansız tahminlerin bulunmadığı bazı istatistiksel problemler olabilir. En ünlü örnek şudur: parametreli bir Poisson dağılımını düşünün ve parametreyi tahmin etme problemini kurun. Bu problem için yansız bir tahmincinin olmadığı kanıtlanabilir.

Derece Karşılaştırması ve Verimlilik

Aynı parametrenin farklı tahminlerini birbiriyle karşılaştırmak için aşağıdaki yöntem kullanılır: risk fonksiyonu tahminin parametrenin gerçek değerinden sapmasını ölçer ve en iyisi, bu işlevin kendisi için daha küçük bir değer aldığı değer olarak kabul edilir.

Çoğu zaman, tahminin gerçek değerden karesel sapmasının matematiksel beklentisi bir risk fonksiyonu olarak kabul edilir.

Tarafsız tahminciler için bu sadece varyanstır.

Bu risk fonksiyonunda bir alt sınır vardır. Cramer-Rao eşitsizliği.

Bu alt sınırın karşılandığı (yani mümkün olan en küçük varyansa sahip) (yansız) tahmin edicilere denir. etkili. Bununla birlikte, etkili bir tahminin varlığı problem için oldukça güçlü bir gerekliliktir ki bu her zaman böyle değildir.

Daha zayıf koşul asimptotik verimlilik , bu, yansız tahminin varyansının alt Cramer-Rao sınırına oranının 1'de bir olma eğiliminde olduğu anlamına gelir.

İncelenen dağılım hakkında yeterince geniş varsayımlar altında, maksimum olabilirlik yönteminin parametrenin asimptotik olarak verimli bir tahminini verdiğini ve etkili bir tahmin varsa, o zaman verimli bir tahmin verdiğini unutmayın.

yeterli istatistik

istatistik denir yeterli parametre için, örneğin koşullu dağılımı şartıyla, tüm parametreler için bağımlı değildir.

Yeterli istatistik kavramının önemi aşağıdakilerden kaynaklanmaktadır: onay. Yeterli bir istatistikse ve parametrenin yansız bir tahminiyse, koşullu beklenti de parametrenin yansız bir tahminidir ve varyansı, orijinal tahminin varyansına eşit veya ondan küçüktür.

Koşullu beklentinin bir fonksiyonu olan rastgele bir değişken olduğunu hatırlayın. Bu nedenle, yansız tahmin ediciler sınıfında, yalnızca yeterli istatistiğin fonksiyonları olanları dikkate almak yeterlidir (verilen problem için böyle bir istatistiğin mevcut olması şartıyla).

(Tarafsız) etkili parametre tahmini her zaman yeterli bir istatistiktir.

Yeterli bir istatistiğin örneklemde bulunan tahmini parametre ile ilgili tüm bilgileri içerdiğini söyleyebiliriz.

Yükleniyor...