ecosmak.ru

Dağıtım parametrelerinin istatistiksel değerlendirmesi. Nokta tahmini ve özellikleri Dağılım parametreleri örneklerinin istatistiksel tahminleri

Matematiksel istatistiklerdeki dağılımlar birçok istatistiksel parametreyle karakterize edilir. Çeşitli örnek verilere dayanarak bilinmeyen dağılım parametrelerini tahmin etmek, rastgele bir değişkenin dağılımlarını oluşturmaya olanak tanır.

Bilinmeyen bir dağılım parametresinin istatistiksel tahminini bulun - tahmin edilen parametrenin yaklaşık değerini verecek gözlemlenen rastgele değişkenlerin bir fonksiyonunu bulun.

İstatistiksel tahminler tarafsız, taraflı, etkili ve tutarlı olarak sınıflandırılabilir.

Tanım 1

Tarafsız Tahmin-- istatistiksel tahmin $Q^*$; örneklem büyüklüğünün herhangi bir değeri için, tahmin edilen parametreye eşit bir matematiksel beklentiye sahiptir;

Tanım 2

Önyargılı tahmin-- istatistiksel tahmin $Q^*$, örneklem büyüklüğünün herhangi bir değeri için, tahmin edilen parametreye eşit olmayan bir matematiksel beklentiye sahiptir; yani

Tanım 4

Tutarlı değerlendirme-- örneklem büyüklüğünün sonsuza doğru gittiği, olasılığın tahmin edilen $Q.$ parametresine doğru yöneldiği istatistiksel bir değerlendirme.

Tanım 5

Tutarlı değerlendirme- Örneklem büyüklüğü sonsuza doğru ilerledikçe, tarafsız tahminin varyansının sıfıra doğru yöneldiği istatistiksel bir tahmin.

Genel ve örnek ortalamalar

Tanım 6

Genel ortalama-- genel popülasyon değişkeninin değerlerinin aritmetik ortalaması.

Tanım 7

Örnek ortalama-- örnek popülasyonun değerlerinin aritmetik ortalaması.

Genel ve örnek ortalamanın değerleri aşağıdaki formüller kullanılarak bulunabilir:

  1. $x_1,\ x_2,\dots ,x_k$ seçeneğinin değerleri sırasıyla $n_1,\ n_2,\dots ,n_k$ frekanslarına sahipse, o zaman
  1. $x_1,\ x_2,\dots ,x_k$ seçeneğinin değerleri farklıysa, o zaman

Bu kavramla bağlantılı olarak ortalamadan sapma kavramı da vardır. Bu değer aşağıdaki formül kullanılarak bulunur:

Ortalama sapma aşağıdaki özelliklere sahiptir:

    $\sum(n_i\left(x_i-\overline(x)\right)=0)$

    Ortalama sapma sıfırdır.

Genel, örnek ve düzeltilmiş sapmalar

Ana parametrelerden bir diğeri genel ve örneklem varyansı kavramıdır:

Genel fark:

Örnek varyans:

Genel ve örnek standart sapmalar da bu kavramlarla ilişkilidir:

Genel varyansı tahmin etmek için düzeltilmiş varyans kavramı tanıtılmıştır:

Düzeltilmiş standart sapma kavramı da tanıtıldı:

Sorun çözümü örneği

örnek 1

Nüfus aşağıdaki dağıtım tablosuyla tanımlanır:

Resim 1.

Bunun için genel ortalamayı, genel varyansı, genel standart sapmayı, düzeltilmiş varyansı ve düzeltilmiş standart sapmayı bulalım.

Bu sorunu çözmek için önce bir hesaplama tablosu hazırlıyoruz:

Şekil 2.

$\overline(x_в)$ (örnek ortalama) değeri şu formülle bulunur:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(87)(30)=2,9\]

Aşağıdaki formülü kullanarak genel varyansı bulalım:

Genel standart sapma:

\[(\sigma )_в=\sqrt(D_в)\yaklaşık 1,42\]

Düzeltilmiş varyans:

\[(S^2=\frac(n)(n-1)D)_в=\frac(30)(29)\cdot 2,023\approx 2,09\]

Düzeltilmiş standart sapma.

Popülasyon parametrelerinin istatistiksel tahminleri. İstatistiksel hipotezler

DERS 16

Genel bir nüfusun niceliksel bir özelliğini incelemek gerekli olsun. Teorik değerlendirmelerden, özelliğin tam olarak hangi dağılıma sahip olduğunu belirleyebildiğimizi varsayalım. Bu durum, bu dağılımı belirleyen parametrelerin tahmin edilmesi sorununu ortaya çıkarmaktadır. Örneğin, incelenen özelliğin genel popülasyonda normal bir yasaya göre dağıldığı biliniyorsa, bu iki parametre normal dağılımı tamamen belirlediğinden matematiksel beklentiyi ve standart sapmayı tahmin etmek (yaklaşık olarak bulmak) gerekir. . Karakteristiğin Poisson dağılımına sahip olduğuna inanmak için nedenler varsa, bu dağılımın belirlendiği parametrenin tahmin edilmesi gerekir.

Tipik olarak, bir dağılımda araştırmacının yalnızca örnek verileri vardır, örneğin gözlemler sonucunda elde edilen niceliksel bir özelliğin değerleri (bundan sonra gözlemlerin bağımsız olduğu varsayılacaktır). Tahmin edilen parametre bu veriler aracılığıyla ifade edilir.

Bağımsız rastgele değişkenlerin değerleri olarak kabul edilmesi teorik bir dağılımın bilinmeyen bir parametresinin istatistiksel tahminini bulmanın, tahmin edilen parametrenin yaklaşık değerini veren, gözlemlenen rastgele değişkenlerin bir fonksiyonunu bulmak anlamına geldiğini söyleyebiliriz. Örneğin, aşağıda gösterileceği gibi, normal bir dağılımın matematiksel beklentisini tahmin etmek için işlevi kullanın (özelliğin gözlemlenen değerlerinin aritmetik ortalaması):

.

Bu yüzden, istatistiksel değerlendirme Teorik bir dağılımın bilinmeyen bir parametresine, gözlemlenen rastgele değişkenlerin bir fonksiyonu denir. Bilinmeyen bir popülasyon parametresinin tek bir sayı olarak yazılan istatistiksel tahminine denir. nokta. Şu nokta tahminlerini göz önünde bulundurun: taraflı ve tarafsız, etkili ve tutarlı.

İstatistiksel tahminlerin, tahmin edilen parametrelere "iyi" yaklaşımlar sunabilmesi için belirli gereksinimleri karşılaması gerekir. Bu gereksinimleri belirtelim.

Teorik dağılımın bilinmeyen bir parametresinin istatistiksel bir tahmini olsun. Hacmi örneklerken bir tahminin bulunduğunu varsayalım. Deneyi tekrarlayalım, yani genel popülasyondan aynı büyüklükte başka bir örnek çıkaracağız ve onun verilerini bir tahmin bulmak için kullanacağız, vb. Deneyi defalarca tekrarlayarak sayıları elde ediyoruz genel anlamda birbirinden farklı olacaktır. Dolayısıyla puan rastgele bir değişken olarak kabul edilebilir ve sayılar – olası anlamları olarak.

Tahminin aşırılıkla yaklaşık bir değer vermesi durumunda, örnek verilerden bulunan her sayının gerçek değerden büyük olacağı açıktır. Sonuç olarak, bu durumda rastgele değişkenin matematiksel değeri (ortalama değeri) 'den büyük olacaktır. Açıkçası, eğer dezavantajlı yaklaşık bir değer veriyorsa, o zaman .


Bu nedenle, matematiksel beklentisi tahmin edilen parametreye eşit olmayan istatistiksel bir tahminin kullanılması, sistematik (aynı işaretli) hatalara yol açar. Bu nedenle tahminin matematiksel beklentisinin tahmin edilen parametreye eşit olmasının gerekliliği doğaldır. Her ne kadar bu gereksinime uygunluk genel olarak hataları ortadan kaldırmayacak olsa da (bazı değerler büyüktür ve diğerleri küçüktür), farklı işaretlerdeki hatalar eşit sıklıkta meydana gelecektir. Ancak gereksinime uygunluk, sistematik hataların elde edilemeyeceğini garanti eder, yani sistematik hataları ortadan kaldırır.

Tarafsız matematiksel beklentisi herhangi bir örneklem büyüklüğü için tahmin edilen parametreye eşit olan istatistiksel tahmin (hata) olarak adlandırılır.

Yerinden edilmiş matematiksel beklentisi herhangi bir örneklem büyüklüğü için tahmin edilen parametreye eşit olmayan, yani istatistiksel tahmin olarak adlandırılır.

Ancak, tarafsız bir tahminin her zaman tahmin edilen parametreye iyi bir yaklaşım sağladığını varsaymak bir hata olacaktır. Aslında olası değerler ortalama değerleri etrafında geniş bir dağılım gösterebilir, yani dağılım önemli olabilir. Bu durumda, örneğin bir numunenin verilerinden elde edilen tahminin, ortalama değerden ve dolayısıyla tahmin edilen parametrenin kendisinden çok uzak olduğu ortaya çıkabilir. Dolayısıyla yaklaşık bir değer alarak büyük bir hata yapmış oluruz. Varyansın küçük olmasını istiyorsanız büyük hata yapma olasılığı ortadan kalkacaktır. Bu nedenle istatistiksel değerlendirme etkinlik şartına tabidir.

Etkili(belirli bir örneklem büyüklüğü için) mümkün olan en küçük varyansa sahip olan istatistiksel bir tahmindir.

Zengin olasılık olarak tahmin edilen parametreye yönelen istatistiksel bir tahmin diyorlar, yani eşitlik doğrudur:

.

Örneğin, tarafsız bir tahminin varyansı sıfıra yaklaşıyorsa, bu durumda böyle bir tahminin de tutarlı olduğu ortaya çıkar.

Hangi örnek özelliklerin tarafsızlık, verimlilik ve tutarlılık açısından genel ortalamayı ve varyansı en iyi tahmin ettiği sorusunu ele alalım.

Bazı niceliksel özelliklere göre ayrı bir genel popülasyonu inceleyelim.

Genel Ortaöğretim genel popülasyonun karakteristik değerlerinin aritmetik ortalamasına denir. Aşağıdaki formülle hesaplanır:

§ – genel hacim popülasyonunun karakteristiğinin tüm değerleri farklıysa;

§ – genel popülasyonun karakteristik değerlerinin sırasıyla frekansları varsa ve . Yani genel ortalama, karşılık gelen frekanslara eşit ağırlıklara sahip nitelik değerlerinin ağırlıklı ortalamasıdır.

Yorum: birimin genel popülasyonunun farklı nitelik değerlerine sahip nesneler içermesine izin verin. Bu kümeden rastgele bir nesnenin seçildiğini düşünelim. Örneğin özellik değeri olan bir nesnenin geri getirilme olasılığı açıkça eşittir. Başka herhangi bir nesne aynı olasılıkla geri alınabilir. Dolayısıyla bir özelliğin değeri, olası değerleri aynı olasılıklara sahip olan rastgele bir değişken olarak düşünülebilir. Bu durumda matematiksel beklentiyi bulmak zor değildir:

Dolayısıyla, genel popülasyonun araştırılan özelliğini rastgele bir değişken olarak düşünürsek, özelliğin matematiksel beklentisi bu özelliğin genel ortalamasına eşittir: . Bu sonuca, genel popülasyondaki tüm nesnelerin farklı nitelik değerlerine sahip olduğunu dikkate alarak ulaştık. Genel popülasyonun aynı nitelik değerine sahip birden fazla nesne içerdiğini varsayarsak aynı sonuç elde edilecektir.

Elde edilen sonucu, özelliğin sürekli dağılımıyla genel popülasyona genelleyerek genel ortalamayı, özelliğin matematiksel beklentisi olarak tanımlarız: .

Genel popülasyonu niceliksel bir özellik açısından incelemek için bir hacim örneği çıkarılsın.

Örnek ortalamaörnek popülasyonun karakteristik değerlerinin aritmetik ortalaması denir. Aşağıdaki formülle hesaplanır:

§ – numune hacminin karakteristiğinin tüm değerleri farklıysa;

§ – Örnek popülasyonun karakteristik değerlerinin sırasıyla frekansları varsa ve . Diğer bir deyişle, örnek ortalaması, karşılık gelen frekanslara eşit ağırlıklara sahip olan nitelik değerlerinin ağırlıklı ortalamasıdır.

Yorum: Bir örneğin verilerinden bulunan örnek ortalamasının belli bir sayı olduğu açıktır. Aynı popülasyondan aynı büyüklükte başka örnekler alırsanız, örnek ortalaması örnekten örneğe değişecektir. Dolayısıyla örneklem ortalaması rastgele bir değişken olarak kabul edilebilir ve bu nedenle örneklem ortalamasının dağılımlarından (teorik ve ampirik) ve bu dağılımın sayısal özelliklerinden, özellikle örneklemin matematiksel beklentisi ve varyansından bahsedebiliriz. dağıtım.

Ayrıca, genel ortalama bilinmiyorsa ve örnek veriler kullanılarak tahmin edilmesi gerekiyorsa, o zaman tarafsız ve tutarlı bir tahmin olan örneklem ortalaması, genel ortalamanın tahmini olarak alınır (bu ifadeyi kendinizin kanıtlamanızı öneririz). Yukarıdakilerden, aynı genel popülasyondan yeterince büyük hacimdeki birkaç numune için numune ortalamaları bulunursa, bunların yaklaşık olarak birbirine eşit olacağı sonucu çıkar. Bu mülk numune araçlarının stabilitesi.

İki popülasyonun varyansları aynıysa, örnek ortalamalarının genel ortalamaya yakınlığının, örnek büyüklüğünün genel popülasyon büyüklüğüne oranına bağlı olmadığına dikkat edin. Örneklem büyüklüğüne bağlıdır: örneklem büyüklüğü ne kadar büyükse, örneklem ortalaması genel ortalamadan o kadar az farklılık gösterir. Örneğin, nesnelerin %1'i bir popülasyondan seçilirse ve nesnelerin %4'ü başka bir popülasyondan seçilirse ve ilk numunenin hacmi ikinciden daha büyük çıkarsa, o zaman ilk numune ortalaması daha az farklı olacaktır. karşılık gelen genel ortalama ikinciden daha fazladır.

İstatistiksel değerlendirme soruları, matematiksel istatistiğin bilimsel metodoloji, rastgele değişkenler gibi sorunlu yönlerini tek bir bütüne bağlar. istatistiksel dağılımlar vb. Herhangi bir numune için birimlerin tam olarak kapsanmaması, ölçüm hataları ve benzeri nedenlerden kaynaklanan doğal hatalar vardır. Gerçek hayattaki bu tür hatalar, her hipoteze (özellikle ekonomik sonuçlara dayanarak formüle edilenlere) rastgele, stokastik bir karakter kazandırır. Teorik hipotezlerin öngördüğü değişken sayısından bağımsız olarak, etkinin olduğu varsayılmaktadır. çeşitli türler hatalar yalnızca tek bir bileşen kullanılarak oldukça doğru bir şekilde tanımlanabilir. Bu metodolojik yaklaşım, birden fazla parametreyi aynı anda tahmin ederken kendimizi tek boyutlu bir olasılık dağılımıyla sınırlamamıza olanak tanır.

İstatistiksel değerlendirme iki tür istatistiksel yargıdan biridir (ikinci tür hipotez testidir). Bir popülasyonun dağılımının özelliklerinin (parametrelerinin) sayısal değerlerini, bu popülasyondan alınan bir örnekten elde edilen verilere dayanarak yargılamak için kullanılan özel bir yöntemdir. Yani, bir örnek gözlemin sonuçlarına sahip olarak, genel popülasyonda bizi ilgilendiren özelliğin (değişken) dağılımının bağlı olduğu belirli parametrelerin değerlerini (en yüksek doğrulukla) tahmin etmeye çalışıyoruz. Örnek popülasyonun yalnızca bir bölümünü (bazen çok küçük bir sayı) içerdiğinden hata riski vardır. Bu risk gözlem ünitesi sayısı arttıkça azalsa da rastgele gözlem sırasında hala ortaya çıkmaktadır. Dolayısıyla örnekleme sonuçlarına göre verilen karar olasılıksal niteliktedir. Ancak istatistiksel yargıları yalnızca olasılıklara göre değerlendirmek yanlış olur. Bu yaklaşım, popülasyonun parametrelerine ilişkin doğru teorik varsayımlar oluşturmak için her zaman yeterli değildir. Daha derin bir gerekçe sağlamak için genellikle bir dizi ek karara ihtiyaç vardır. Örneğin bölgedeki işletmelerdeki ortalama vasıflı işçi sayısını mümkün olduğunca yakın tahmin etmek gerekiyor. Bu durumda normal dağılıma sahip olan popülasyondan x değişkeninin aritmetik ortalaması tahmin edilir. Bu özellik için miktar olarak numune almış olmak P birimler için şu soruyu çözmek gerekir: Örnek verilere göre genel popülasyondaki ortalamaya en yakın hangi değer alınmalıdır? Matematiksel beklentisi istenen parametreye eşit (veya ona yakın) olan bu tür birkaç nicelik vardır: a) aritmetik ortalama; b) moda; c) medyan; d) varyasyon aralığı vb. ile hesaplanan ortalama.

Olasılıksal bir bakış açısından bakıldığında, bu fonksiyonların her birinin matematiksel beklentisi (özellikle büyük örnekler için) genel ortalamaya eşit olduğundan, yukarıdaki niceliklerin her birinin istenen popülasyon parametresine (x) en iyi yaklaşımı sağladığı düşünülebilir. . Bu varsayım, aynı popülasyondan alınan bir numunenin birçok kez tekrarlanması durumunda “ortalama” doğru sonucun elde edileceği gerçeğinden kaynaklanmaktadır.

"Ortalama olarak" doğruluk, genel ortalamanın tahmininde ortaya çıkan hataların pozitif ve negatif sapmalarının tekrarlarının eşitliği ile açıklanır, yani ortalama tahmin hatası sıfıra eşit olacaktır.

Pratik koşullarda, kural olarak, bir örnek düzenlenir, bu nedenle araştırmacı daha fazla soruyla ilgilenir. doğru değerlendirme Belirli bir numunenin sonuçlarına göre istenen parametre. Böyle bir sorunu çözmek için, olasılıkların soyut hesaplamasından doğrudan çıkan sonuçlara ek olarak, popülasyonun arzu edilen parametresine tahminin en iyi yaklaşımını motive edecek ek kurallara ihtiyaç vardır.

Örnek gözlemlerden sabitleri tahmin etmenin yeterli sayıda yolu vardır. Belirli araştırma problemlerini çözmede bunlardan hangisinin en iyi olduğu istatistiksel tahmin teorisinin konusudur. Şu veya bu değerlendirmenin tabi olması gereken koşulları inceler ve belirli koşullar altında daha çok tercih edilen değerlendirmelere odaklanır. Değerlendirme teorisi, bir değerlendirmenin diğerine üstünlüğünü gösterir.

Bilindiği gibi bir örneklemden elde edilen bilgiler sonuç olarak kategorik değildir. Örneğin, incelenen 100 hayvanın sağlıklı ve 99'unun sağlıklı olduğu ortaya çıkarsa, incelenmeyen bir hayvanın şüpheli hastalığın virüsünü taşıması ihtimali vardır. Bu pek olası olmadığından hastalığın var olmadığı sonucuna varılır. Çoğu durumda, bu sonuç tamamen haklıdır.

Benzer bulgulara dayanarak pratik aktiviteler deneyci (araştırmacı) bilginin güvenilirliğine değil, yalnızca olasılığına güvenir.

Numune gözleminin diğer tarafı, daha önce de belirtildiği gibi, elde edilen numune tahminlerinin güvenilirlik derecesinin mümkün olduğu kadar objektif bir şekilde belirlenmesi sorununu çözmektedir. Bu sorunun çözümünü mümkün olan en doğru olasılıksal ifadeyle sağlamaya çalışıyorlar, yani değerlendirmenin doğruluk derecesinin belirlenmesinden bahsediyoruz. Burada araştırmacı, örneklemden elde edilen tahmin ile popülasyondaki değerinin gerçek değeri arasındaki olası tutarsızlığın sınırlarını belirler.

Tahminin doğruluğu, örnek verilerden hesaplanma şekline ve örnek popülasyondaki birimleri seçme yöntemine göre belirlenir.

Tahmin elde etme yöntemi herhangi bir hesaplama prosedürünü (yöntem, kural, cebirsel formül) içerir. Bu istatistiksel tahmin teorisinin bir önceliğidir. Seçim yöntemleri örnekleme tekniği sorularına yol açar.

Yukarıdakiler “istatistiksel değerlendirme” kavramını tanımlamamızı sağlar.

İstatistiksel değerlendirme- bu, numunenin sonuçlarından elde edilen ve popülasyonun bilinmeyen parametreleri hakkında bilinçli kararlar alma fırsatı sağlayan, popülasyonun istenen parametresinin yaklaşık değeridir.

^ "'nin teorik dağılımın bilinmeyen parametresi ^'nin istatistiksel bir tahmini olduğunu varsayalım. Aynı şeyin tekrarlanan uygulamalarına dayanmaktadır.

Genel popülasyondan elde edilen örneklem büyüklüğü tahminleri ve 2 ^ ""n,

farklı anlamlara sahip. Bu nedenle ^" tahmini şu şekilde kabul edilebilir:

rastgele değişken ve +17 iki, 3 ~ "n - olası değerleri olarak. Nasıl rastgele değer belirli bir olasılık yoğunluk fonksiyonu ile karakterize edilir. Bu fonksiyon seçici gözlem (deney) sonucu belirlendiğinden buna denir. örnekleme dağılımı. Böyle bir fonksiyon, belirli sayıda örnek kullanılarak tahminlerin her biri için olasılık yoğunluğunu açıklar.

gözlemler. ^ " istatistiksel tahmininin belirli bir veri kümesinin cebirsel bir fonksiyonu olduğunu ve böyle bir kümenin örnek bir gözlem yapılarak elde edileceğini varsayarsak, o zaman

Genel olarak tahmin şu ifadeyi alacaktır: ® n = f (Xl.X2, ^ 3, ... X t).

Örnek anketin sonunda bu işlev artık bir değerlendirme değildir Genel görünüm, ancak belirli bir değer alır, yani niceliksel bir değerlendirme (sayı) haline gelir. Başka bir deyişle, fonksiyonun yukarıdaki ifadesinden, bir örnek gözlemin sonuçlarını karakterize eden göstergelerden herhangi birinin bir tahmin olarak değerlendirilebileceği sonucu çıkmaktadır. Örnek ortalama, popülasyon ortalamasının bir tahminidir. Örnekten hesaplanan varyans veya bundan hesaplanan standart sapmanın değeri, genel popülasyonun vb. karşılık gelen özelliklerinin tahminleridir.

Daha önce de belirtildiği gibi istatistiksel tahminlerin hesaplanması, hataların ortadan kaldırılmasını garanti etmez. Mesele şu ki, ikincisi sistematik olmamalıdır. Varlıkları rastgele olmalıdır. Bu konumun metodolojik yönünü ele alalım.

Diyelim ki ^ "dezavantajlı nüfusa ait ^ tahmininin hatalı bir değerini veriyor. Bu durumda, hesaplanan her değer = 1,2,3, ..., n), değerin gerçek değerinden daha az olacaktır. $.

Bu nedenle b rastgele değişkeninin matematiksel beklentisi (ortalama değeri) b'den küçük olacaktır, yani (M(^ n). Ve tam tersine, fazla bir tahmin veriyorsa matematiksel beklenti

rastgele ^" değeri $'dan büyük olacaktır.

Matematiksel beklentisi tahmin edilen parametreye eşit olmayan istatistiksel bir tahminin kullanılması, sistematik hatalara, yani ölçüm sonuçlarını bir yönde saptıran rastgele olmayan hatalara yol açar.

Doğal bir gereklilik ortaya çıkar: Tahminin matematiksel beklentisi ^ "tahmin edilen parametreye eşit olmalıdır. Bu gereksinime uygunluk, genel olarak hataları ortadan kaldırmaz, çünkü tahminin örnek değerleri, gerçek değerinden daha büyük veya daha az olabilir. genel popülasyonun tahmini. Ancak ^ değerlerinden bir yönde veya diğerinde hatalar aynı sıklıkta meydana gelecektir (olasılık teorisine göre). Bu nedenle, bu gereksinime uygunluk, bir örnek tahminin matematiksel beklentisi olmalıdır. tahmin edilen parametreye eşit olmalıdır, sistematik (rastgele olmayan) hataların oluşmasını hariç tutmalıdır; yani

M (V) = 6.

Tahmin edilen parametrenin en iyi yaklaşımını sağlayan istatistiksel tahmincinin seçilmesi, tahmin teorisinde önemli bir problemdir. Popülasyonda incelenen rastgele değişkenin dağılımının normal dağılım yasasına karşılık geldiği biliniyorsa, örnek verileri kullanarak matematiksel beklentiyi ve standart sapmayı tahmin etmek gerekir. Bu, bu iki özelliğin tamamen normal dağılımın temelini oluşturduğu gerçeğiyle açıklanmaktadır. İncelenen rastgele değişken Poisson yasasına göre dağıtılıyorsa ^ parametresi bu dağılımı belirlediği için tahmin edilir.

Matematiksel istatistik, örnek verilerden istatistiksel tahminler elde etmek için aşağıdaki yöntemler arasında ayrım yapar: momentler yöntemi, maksimum olabilirlik yöntemi.

Momentler yöntemini kullanarak tahminler elde ederken, genel popülasyonun momentleri, örnek popülasyonun momentleri ile değiştirilir (ağırlıklandırma için olasılıklar yerine frekanslar kullanılır).

İstatistiksel bir tahminin genel bir özelliğe "en iyi yaklaşımı" vermesi için, bir takım özelliklere sahip olması gerekir. Aşağıda tartışılacaktır.

En iyi değerlendirmeyi seçebilme yeteneği, onların temel özelliklerinin bilinmesi ve değerlendirmelerin bu özelliklere göre sınıflandırılabilmesinden kaynaklanmaktadır. Matematik literatüründe "değerlendirmelerin özellikleri" bazen "değerlendirme gereklilikleri" veya "değerlendirme kriterleri" olarak da adlandırılır. İstatistiksel değerlendirmelerin temel özellikleri şunları içerir: Tarafsızlık, verimlilik, yetenek, yeterlilik.

Örneklem ortalamasının (~) ve örnek varyansının olduğunu varsayarsak

(Stv), karşılık gelen genel özelliklerin (^) tahminleridir, yani bunların matematiksel beklentileridir; Büyük miktarlar

karakteristikler (~) olarak adlandırılan örnek birimler matematiksel beklentilerine yakın olacaktır. Örnekleme birimlerinin sayısı küçükse, bu özellikler karşılık gelen matematiksel beklentilerden önemli ölçüde farklı olabilir.

Tahmin olarak seçilen örnek özelliklerin ortalaması genel özelliğin değeriyle eşleşiyorsa tahmin tarafsız olarak adlandırılır. Örnek ortalamanın matematiksel beklentisinin genel ortalamaya eşit olduğunun kanıtı (m(x) = x), ~ değerinin tarafsız bir genel olduğunu gösterir.

ortalama Seçici dağılımda (o) durum farklıdır. o

M (ST 2) = - o-2. .

matematiksel beklenti n, genele eşit değil

farklılıklar. Dolayısıyla, h, "'nin taraflı bir tahminidir. Önyargıyı ortadan kaldırmak ve tarafsız bir tahmin elde etmek için, örnek

dağılım n - 1 düzeltmesi ile çarpılır (bu, formasyondan kaynaklanır)

2 _ 2 p'de P -1 "n-1

yukarıdaki denklem: n).

Dolayısıyla küçük bir örnekle varyans şuna eşittir:

2 Tx, - ~) 2 P e (x ve - ~) 2

içeri gir= x - = -.

p p - 1 s-1

Kesir (P- 1) Bessel düzeltmesi olarak adlandırılır. Matematikçi Bessel, örnek varyansın genel varyansın taraflı bir tahmini olduğunu tespit eden ve düzeltmek için belirtilen düzeltmeyi uygulayan ilk kişiydi.

derecelendirmeler. Küçük örnekler için düzeltme (n - 1), 1'den önemli ölçüde farklılık gösterir. Gözlem birimi sayısı arttıkça hızla 1'e yaklaşır. n için<>50 tahminler arasındaki fark ortadan kalkıyor, yani

° ~ "- .Yukarıdakilerin hepsinden, aşağıdaki tarafsızlık gereklilikleri tanımları takip etmektedir.

Tarafsız Herhangi bir örneklem büyüklüğü için matematiksel beklentisi değere eşit olan istatistiksel bir tahmindir.

nüfus parametresi, yani m (^) = 9; m(x) = x.

Olasılık teorisi dersinde "matematiksel beklenti" kategorisi incelenmektedir. Bu, rastgele bir değişkenin sayısal bir özelliğidir. Matematiksel beklenti yaklaşık olarak rastgele değişkenin ortalama değerine eşittir. Ayrık bir rastgele değişkenin matematiksel beklentisi tüm olası değerlerinin ve olasılıklarının çarpımlarının toplamıdır. Rasgele değişkenin kullanıldığı n çalışmanın yapıldığını varsayalım. X w 1 kez w'nin değeri 2 çarpı Sh değeri ve çarpı X k değeri alındı.Bu durumda Sh 1 + Sh 2 + Sh 3 + ... + Sh k = n. Sonra tüm değerlerin toplamı kabul edildi x, eşit

x 1 w 1 + x 2 w 2 + x 3 w 3 + ... + x k w k

Bu değerlerin aritmetik ortalaması şöyle olacaktır:

X 1 w 1 + x 2 w 2 + x 3 w 3 + ... + x k w k - w 1^ w 2 ^ w 3 ^ ^ w k

P veya 1 p 2 p 3 p 1 s.

n bağıl frekans ^ değeri olduğundan X ^ P- x 2 vb. değerinin bağıl frekansı, yukarıdaki denklem şu şekli alacaktır:

X = X 1 No. 1 + X 2 No. 2 + X 3 No. 3 + ... + X ila H> ila

Çok sayıda örnek gözlemde bağıl frekans, olayın meydana gelme olasılığına yaklaşık olarak eşittir; yani

u>1 = L; ^ 2 = Ш = ™ к = Рк ve dolayısıyla x 2 x 1 r 1 + x 2 r 2 + X 3 g.3 + ... + X KRK. Daha sonra

x~ M(x) elde edilen hesaplama sonucunun olasılıksal anlamı, matematiksel beklentinin, rastgele değişkenin gözlemlenen değerlerinin aritmetik ortalamasına yaklaşık olarak eşit olmasıdır (ne kadar doğru olursa, örneklem o kadar büyük olur) [M (x -) = ~ 1.

Tarafsız kriter, popülasyon parametrelerinin tahmininde sistematik hataların bulunmadığını garanti eder.

Örnek tahmininin (^), değeri bir örnekten diğerine değişebilen rastgele bir değişken olduğuna dikkat edin. Popülasyon parametresi #'nin matematiksel beklentisi etrafındaki varyasyonunun (dağılımının) boyutu, st2 (^) dağılımı ile karakterize edilir.

İzin vermek içinde veİÇİNDE -- ^ parametresinin iki tarafsız tahmini, yani M (içinde") = 6 ve M (d,) = v. Varyansları V 1 (V -) Ve VGF -). Artaud'da bu iki 0 nok ile, tahmin edilen parametre etrafında daha az dağılıma sahip olanı tercih edin. Tahminin varyansı varyanstan ^" küçükse

Cn'yi tahmin ediyorsa, ilk tahmin yani ^ ", & tahmini olarak alınır.

Aynı büyüklükteki örneklerden hesaplanan ^ parametresinin olası tüm tarafsız tahmin edicileri arasında en küçük varyansa sahip olan tarafsız tahmincisine ^, etkin tahminci denir. Bu, popülasyon parametrelerinin istatistiksel tahminlerinin ikinci özelliğidir (gereksinimdir). Belirli bir dağılım yasasına tabi olarak genel nüfus parametresinin etkin tahmininin, ikinci bölümün parametresinin etkin tahmini ile örtüşmediği unutulmamalıdır.

Büyük örneklemler dikkate alınırken istatistiksel tahminlerin yapılabilirlik özelliğine sahip olması gerekir. Bir tahmin yeteneklidir ("uygun" veya "tutarlı" olarak da anılır), örnek boyutu ne kadar büyük olursa, tahmin hatasının keyfi olarak küçük bir pozitif değeri aşmama ihtimalinin de o kadar yüksek olduğu anlamına gelir.

E sayısı. 6. parametre ^'nin bir tahmini, büyük sayılar yasasına uyuyorsa, yani aşağıdaki eşitlik geçerliyse tutarlı olarak adlandırılır:

/ shg | G içeri-içe <Е} = 1.

Görebildiğimiz gibi, n için tahmin edilen parametrenin olasılığına yaklaşıyorsa istatistiksel tahmine yetenekli denir. Yani örneklemden elde edilen ve büyük sayılar kanunu gereği örneklem büyüklüğünün artmasıyla birlikte matematiksel beklentisine yaklaşan (olasılıkla örtüşen) göstergenin değeridir. Örneğin, tarafsız bir tahminin varyansı n olarak sıfıra yaklaşıyorsa, bu durumda böyle bir tahminin tutarlı olduğu ortaya çıkar, çünkü mümkün olan en küçük varyansa sahiptir (belirli bir örneklem büyüklüğü için).

Yetenekli değerlendirmeler şunlardır:

1) örnek popülasyondaki özelliğin payı, yani özelliğin genel popülasyondaki payına ilişkin bir tahmin olarak frekans;

2) genel ortalamanın tahmini olarak örnek ortalaması;

3) genel varyansın tahmini olarak örneklem varyansı;

4) genel katsayıların bir tahmini olarak örnek asimetri ve basıklık katsayıları.

Bazı nedenlerden dolayı, matematiksel istatistik literatüründe istatistiksel tahminlerin dördüncü özelliği olan yeterliliğin bir tanımını bulmak her zaman mümkün değildir. Seviye yeterli(veya kapsamlı), genel popülasyonun bilinmeyen bir parametresi hakkındaki tüm örnek bilgilerin kapsamının eksiksizliğini sağlayan (sağlayan) bir tahmindir. Dolayısıyla yeterli bir tahmin, incelenen popülasyonun istatistiksel özelliklerine ilişkin örneklemde yer alan tüm bilgileri içerir. Daha önce ele alınan üç tahminden hiçbiri, yeterli bir istatistiksel tahmin olarak, incelenen parametre hakkında gerekli ek bilgiyi sağlayamaz.

Bu nedenle, aritmetik örnek ortalaması ~, aritmetik popülasyon ortalaması x'in tarafsız bir tahminidir. Bu tahminin tarafsız faktörü şunu gösterir: Genel popülasyondan çok sayıda rastgele örnek alırsanız bunların ortalamaları *<отличались бы от генеральной средней в большую и меньшую сторону одинаково, то есть, свойство несмещенности хорошей оценки также показывает, что среднее значение бесконечно большого числа выборочных средних равно значению генеральной средней.

Simetrik bir seri dağılımında medyan, genel ortalamanın tarafsız bir tahminidir. Ve örnek popülasyonun büyüklüğünün genel popülasyona (P ~ * N) yaklaşması koşuluyla, medyan bu tür bir seri halinde olabilir ve genel ortalamanın tutarlı bir tahmini olabilir. Genel popülasyonun aritmetik ortalaması, büyük hacimli örneklerde, medyanın (Sme) ortalama karekök hatasının, örnek ortalamasının hatanın ortalama karekökünün 1,2533'üne eşit olduğu kanıtlanabilir.

). Yani Stme *. Bu nedenle, ortalama kare hatası, numunenin aritmetik ortalamasının ortalama kare hatasından daha büyük olduğundan, medyan, aritmetik popülasyon ortalamasının etkili bir tahmini olamaz. Ayrıca aritmetik ortalama, tarafsızlık ve yetenek koşullarını karşılar ve dolayısıyla en iyi tahmindir.

Böyle bir ayar da mümkündür. Bir örneğin aritmetik ortalaması, ortalama ve medyanın aynı olduğu simetrik popülasyon dağılımlarında medyanın tarafsız bir tahmini olabilir mi? Örnek ortalama, popülasyon medyanının tutarlı bir tahmini olacak mı? Her iki durumda da cevap evet olacaktır. Bir popülasyon medyanı için (simetrik dağılıma sahip), numunenin aritmetik ortalaması tarafsız ve tutarlı bir tahmin edicidir.

Sme ~ 1.2533st olduğunu hatırlayarak şu sonuca varıyoruz: medyandan ziyade numunenin aritmetik ortalaması, incelenen popülasyonun medyanı için daha etkili bir tahmindir.

Her örnek özelliği, karşılık gelen popülasyon özelliğinin en iyi tahmini olmayabilir. Tahminlerin özelliklerinin bilgisi, yalnızca tahminlerin seçilmesi değil, aynı zamanda bunların iyileştirilmesi sorununu da çözmemize olanak tanır. Örnek olarak, hesaplamaların aynı popülasyondan birkaç numunenin standart sapma değerlerinin her durumda genel popülasyonun standart sapmasından daha az olduğunu gösterdiği ve farkın büyüklüğünün belirlendiği durumu düşünebiliriz. örneklem büyüklüğüne göre. Örneklem standart sapmasını düzeltme faktörüyle çarparak popülasyon standart sapmasına ilişkin geliştirilmiş bir tahmin elde ederiz. Böyle bir düzeltme faktörü için Bessel düzeltmesi kullanılır

P bir ben P

(P - 1), yani önyargıyı ortadan kaldırmak için tahminler elde edilir "P- 1. Bu sayısal ifade, tahmin olarak kullanılan numunenin standart sapmasının, popülasyon parametresi için eksik tahmin edilen bir değer verdiğini göstermektedir.

Bilindiği gibi, örnek bir popülasyonun istatistiksel özellikleri, genel popülasyonun bilinmeyen parametrelerinin yaklaşık tahminleridir. Puanın kendisi tek bir sayı veya belirli bir puan şeklinde olabilir. Tek bir sayıyla belirlenen tahmine nokta tahmini denir. Dolayısıyla, örnek ortalaması (~), genel ortalamanın (x) tarafsız ve en iyi performans gösteren nokta tahminidir ve örnek varyansı), genel ortalamanın (x) taraflı bir nokta tahminidir.

varyans ().Örnek ortalamanın ortalama hatasını belirtirsek T <>bu durumda genel ortalamanın nokta tahmini x ± m° olarak yazılabilir. Bu, ~'nin m'ye eşit bir hatayla genel ortalama x'in bir tahmini olduğu anlamına gelir. X ve o'nun nokta istatistiksel tahminlerinin sistematik bir hataya sahip olmaması gerektiği açıktır.

ooo~~o<в 2

x ve tahmin edilen parametrelerin fazla tahmin edilmesi veya eksik tahmin edilmesi. Daha önce de belirtildiği gibi, böyle bir koşulu sağlayan tahminlere denir.

yer değiştirmemiş. Parametre hatası nedir? Birçok spesifik hatanın ortalamasıdır:

Bir popülasyon parametresinin nokta tahmini, farklı olası örnek tahminlerinden en uygun özelliklere sahip olanın ilk olarak seçilmesi ve daha sonra bu tahminin değerinin hesaplanmasıdır. İkincisinin sonuçta hesaplanan değeri, popülasyon parametresinin bilinmeyen gerçek değerine en iyi yaklaşım olarak kabul edilir. Olası bir tahmin hatasının belirlenmesine ilişkin ek hesaplamalar her zaman zorunlu değildir (belirli değerlendirme görevlerine bağlı olarak), ancak kural olarak neredeyse her zaman gerçekleştirilir.

İncelenen özelliklerin ortalaması ve bunların popülasyondaki payları için bir nokta tahmini belirleme örneklerini ele alalım.

Örnek. Bölgenin tahıl ürünleri 20.000 hektarı kapsıyor. Tarlaların %10'luk örnek araştırması ile aşağıdaki örnek özellikler elde edildi: ortalama verim - hektar başına 30 sent, verim dağılımı - 4, yüksek verimli mahsullerle ekilen alan - 1200 hektar.

Bölgedeki tahıl mahsullerinin ortalama veriminin değeri hakkında bilinmesi gerekenler ve incelenen toplam tahıl mahsulleri alanındaki yüksek verimli mahsullerin payının (özgül ağırlık) göstergesinin sayısal değeri nedir?

bölge? Yani adı geçen parametrelerin (x, z) genel popülasyonda değerlendirilmesi gerekmektedir. Tahminleri hesaplamak için elimizde:

N = 20000; - = 20000 x 0,1 = 2000; ~ = 30;<т = л / 4; № 2000,

Bilindiği gibi seçici aritmetik ortalama etkili bir tahmindir.

genel aritmetik ortalama. Böylece şu kabul edilebilir:

genel parametrenin (^) en iyi tahmini 30'dur.

Tahminin doğruluğu, ortalama (standart) hatasını bulmak gerekir:

yani. p ~ ben Nisan 2000 saat PPL

t = L - (1--) = - (1--) = 0,04

v nN i2000 2000 ^

Ortaya çıkan hata değeri, tahminin yüksek doğruluğunu gösterir. Buradaki m değeri, bu tür örneklerin birçok kez tekrarlanması durumunda parametre tahmin hatasının ortalama 0,04 olacağı anlamına gelir. Yani konunun ötesinde

Bölgedeki çiftliklerde ortalama verimin hektar başına x = 30 – 0,04 c olacağı tahmin edilmektedir.

Yüksek verimli tahıl mahsullerinin toplam tahıl alanı içindeki payına ilişkin nokta tahminini elde etmek için en iyi tahmin, numunedeki pay ¥ = 0,6 olarak alınabilir. Dolayısıyla gözlem sonuçlarına göre istenilen yapı göstergesine ilişkin en iyi tahminin 0,6 rakamı olacağını söyleyebiliriz. Hesaplamaları açıklığa kavuşturmak için bu tahminin ortalama hatasını hesaplamanız gerekir: T Ve (1 _ p) ve 0,6 (1 - 0,b) (1 = 0,01

v P Nv 2000 2000 A

Görüldüğü gibi genel özelliği tahmin etmedeki ortalama hata 0,01'dir.

Elde edilen sonuç, 2000 hektarlık tahıl hacmine sahip numunenin birçok kez tekrarlanması durumunda, işletmelerin tahıl ürünleri alanındaki yüksek verimli ürünlerin payına (özgül ağırlık) ilişkin kabul edilen tahminin ortalama hatasının olduğu anlamına gelir. bölgede ± 0,01 olacaktır. Bu durumda P = 0,6 ± 0,01. Yüzde olarak yüksek verimli mahsullerin bölgenin toplam tahıl alanı içindeki payı ortalama 60 ± I olacaktır.

Hesaplamalar, belirli bir durum için istenen yapı göstergesinin en iyi tahmininin 0,6 sayısı olacağını ve bir yöndeki ortalama tahmin hatasının yaklaşık 0,01'e eşit olacağını göstermektedir. Gördüğümüz gibi tahmin oldukça doğru.

Numunenin normal dağılıma sahip birimlerden oluşan bir popülasyondan alındığı ve b parametresinin bilinmediği durumlarda standart sapmanın nokta tahmini için bilinen birkaç yöntem vardır. Basit (hesaplaması en kolay) tahmin, numunenin varyasyon aralığının (ve °) standart tablolardan alınan ve numune boyutuna (küçük numuneler için) bağlı olan bir düzeltme faktörüyle çarpılmasıdır. Popülasyon standart sapma parametresi, serbestlik derecesi sayısı dikkate alınarak hesaplanan örnek varyansı kullanılarak tahmin edilebilir. Bu varyansın karekökü, genel standart sapmanın tahmini olarak kullanılacak değeri verir.

"Genel ortalamanın (x") tahmin edilmesinde ortalama hatanın hesaplanması bölümündeki parametre değerinin yukarıda açıklanan şekilde kullanılması.

Daha önce de belirtildiği gibi yetenek gereksinimine göre örneklem büyüklüğü arttıkça nokta tahmininin doğruluğuna olan güven de artmaktadır. Örnek olarak bir nokta tahminini kullanarak bu teorik konumu göstermek biraz zordur. Aralık tahminleri hesaplanırken örneklem büyüklüğünün tahminin doğruluğu üzerindeki etkisi açıktır. Aşağıda tartışılacaktır.

Tablo 39'da popülasyon parametrelerinin en sık kullanılan nokta tahminleri gösterilmektedir.

Tablo 39

Temel nokta tahminleri _

Farklı yöntemler kullanılarak hesaplanan tahmin değerleri büyüklük olarak aynı olmayabilir. Bu bağlamda, pratik hesaplamalarda olası seçeneklerin sıralı hesaplanmasına girilmemeli, ancak çeşitli tahminlerin özelliklerine dayanarak bunlardan birini seçmelisiniz.

Az sayıda gözlem birimi ile nokta tahmini büyük ölçüde rastgeledir ve bu nedenle pek güvenilir değildir. Bu nedenle küçük örneklerde genel popülasyonun tahmin edilen karakteristiğinden büyük ölçüde farklılık gösterebilir. Bu durum örnekleme sonuçlarına dayalı olarak genel popülasyona uzanan sonuçlarda büyük hatalara yol açmaktadır. Bu nedenle küçük örnekler için aralık tahminleri kullanılır.

Nokta tahmininden farklı olarak aralık tahmini, popülasyon parametresinin yerleştirilmesi gereken noktaların aralığını verir. Ayrıca aralık tahmini olasılığı gösterir ve bu nedenle istatistiksel analizde önemlidir.

Aralık, iki sayıyla karakterize edilen bir tahmindir; tahmin edilen parametreyi kapsayan (kapsayan) aralığın sınırları. Böyle bir tahmin, istenen parametrenin belirli bir olasılıkla yerleştirildiği belirli bir aralığı temsil eder. Aralığın merkezi örnek nokta tahmini olarak alınır.

Bu nedenle, aralık tahminleri, böyle bir tahminin küçük bir örneklem büyüklüğü ile etkisiz olduğu durumlarda, nokta tahmininin daha da geliştirilmiş halidir.

Aralık tahmini sorunu genel olarak şu şekilde formüle edilebilir: Örnek gözlem verilerine dayanarak, önceden seçilmiş bir olasılık düzeyi kullanılarak tahmin edilen parametrenin içinde yer aldığının ifade edilebileceği sayısal bir aralık oluşturmak gerekir. bu aralık.

Yeterince fazla sayıda örnekleme birimi alırsak, Lyapunov teoremini kullanarak örnekleme hatasının belirli bir a değerini aşmama olasılığını kanıtlayabiliriz;

Ve ~ "*!" A ya da I Hayır. "YA.

Özellikle, bu teorem yaklaşık eşitliklerin hatalarını tahmin etmeyi mümkün kılar:

- "R (p ve - frekans) x" x.p

Eğer ^ * 2X3..., x ~ bağımsız rastgele değişkenler ve n ise, bu durumda ortalamalarının (x) olasılığı a ile 6 arasındadır ve aşağıdaki denklemlerle belirlenebilir:

p(a)(X (e) 1 ve 2 bunlar,

_A- Eski); _ in - E (x) DE ° a

P olasılığına güven olasılığı denir.

Dolayısıyla, bir örnek tahmine dayalı olarak genel bir parametreyi tahmin etmenin güven olasılığı (güvenilirliği), eşitsizliklerin gerçekleşme olasılığıdır:

| ~ X | <а; | и, ориентир | <д

burada a, ortalama ve paya göre maksimum tahmin hatasıdır.

Verilen bu olasılıkla genel karakteristiklerin bulunabileceği sınırlara güven aralıkları (güven sınırları) adı verilir. Ve bu aralığın sınırlarına güven sınırları denir.

Güven (veya tolerans) sınırları, rastgele dalgalanmalar nedeniyle belirli bir özelliğin önemsiz bir olasılığa sahip olduğu sınırlardır (A ^ 0,5; p 2)<0,01; Л <0,001). Понятие "доверительный интервал" введено Дж.Нейман и К.Пирсоном (1950 г.). Это установленный по выборочным данным интервал, который с заданной вероятностью (доверительной вероятностью) охватывает (покрывает) настоящее, но неизвестно для нас значение параметра. Если уровня доверительной вероятности принять значения 0,95, то эта вероятность свидетельствует о том, что при частых приложениях данного способа (метода) вычислений доверительный интервал примерно в 95% случаев будет покрывать параметр. Доверительный интервал генеральной средней и генеральной доли определяется на основе приведенных выше неравенств, из которых

bundan ~ _A - x - ~ + A; Hayır. _A - g. - Hayır. + A.

Matematiksel istatistiklerde, belirli bir parametrenin güvenilirliği aşağıdaki üç olasılık düzeyinin (bazen "olasılık eşikleri" olarak da adlandırılır) değeriyle değerlendirilir: A = 0,95; ^2 = 0,99; P 3 = 0,999. ihmal edilmiş yani A 1 = 0,05;; a2 = 0,01; "3 = 0,001, anlamlılık seviyeleri veya önemlilik seviyeleri olarak adlandırılır. Verilen seviyelerden, P olasılığı ile güvenilir sonuçlar elde edilir. 3 = 0,999. Her güven olasılığı düzeyi, normalleştirilmiş sapmanın belirli bir değerine karşılık gelir (bkz. Tablo 27). Olasılık aralığı değerlerine ilişkin standart bir tablo mevcut değilse, bu olasılık, aşağıdaki formül kullanılarak belirli bir yaklaşım derecesiyle hesaplanabilir:

R (<) = - = ^ = 1 e "~ yi.

Şekil 11'de toplam alanın normal eğri ve x ekseni tarafından sınırlanan değere karşılık gelen kısımları gölgelendirilmiştir <= ± 1;<= ± 2; <= и 3 и для которых вероятности равны 0,6287, 0,9545; 0,9973. При точечном оценке рассчитывается, как уже известно, средняя ошибка выборки, при интервальном - предельная.

Birim seçim ilkelerine (tekrarlanan veya tekrarsız) bağlı olarak, örnekleme hatalarının hesaplanmasına yönelik yapısal formüller

düzeltmenin büyüklüğü (N) bakımından farklılık gösterir.

Pirinç. 11. Normal olasılık dağılım eğrisi

Tablo 40, genel parametrenin tahmin edilmesindeki hataların hesaplanmasına yönelik formülleri göstermektedir.

Örnek gözlem verilerine dayanarak genel popülasyonun parametrelerinin aralık tahmininin özel durumunu ele alalım.

Örnek. Bölgedeki çiftliklerde yapılan örnek araştırmada ineklerin günlük ortalama süt veriminin (x) 10 kg olduğu tespit edilmiştir. Safkan sığırların toplam canlı hayvan içindeki payı %80'dir. P = 0,954 güven olasılığına sahip örnekleme hatasının 0,2 kg'a eşit olduğu ortaya çıktı; özel safkan hayvanlar için %1.

Böylece genel ortalamanın alınabileceği sınırlar

Performans 9.8 olacak<х <10,2; для генеральной доли скота -79 <Р <81.

Sonuç: 0,954 olasılıkla ineklerin seçici ortalama üretkenliği ile genel üretkenliği arasındaki farkın 0,2 kg olduğu söylenebilir. Ortalama günlük süt verimi limiti 9,8 ve 10,2 kg'dır. Bölgedeki işletmelerde safkan sığırların payı (özgül ağırlık) %79 ile %81 arasında değişmekte olup, tahmin hatası %1'i geçmemektedir.

Tablo 40

Nokta ve aralık örnekleme hatalarının hesaplanması

Bir numuneyi düzenlerken gerekli numune boyutunun (n) belirlenmesi önemlidir. İkincisi, araştırılan nüfus birimlerinin çeşitliliğine bağlıdır. Çeşitlilik ne kadar fazla olursa örneklem büyüklüğü de o kadar büyük olmalıdır. Örneklem büyüklüğü ile marjinal hatası arasındaki ters ilişki. Daha küçük bir hata elde etme arzusu, örnek popülasyonun boyutunun arttırılmasını gerektirir.

Gerekli numune büyüklüğü, belirli bir olasılık düzeyi (P) ile maksimum numune alma hatasına (d) ilişkin formüllere göre belirlenir. Matematiksel dönüşümler yoluyla örneklem büyüklüğünün hesaplanmasına yönelik formüller elde edilir (Tablo 41).

Tablo 41

Gerekli numune boyutunun hesaplanması _

İstatistiksel tahminlerle ilgili olarak belirtilen her şeyin, parametreleri değerlendirmede kullanılan örnek popülasyonun, örnekleme olasılıkları sağlayan bir seçim yöntemi (yöntemi) kullanılarak elde edildiği varsayımına dayandığına dikkat edilmelidir.

Aynı zamanda, bir tahminin güven olasılığını seçerken, seviye seçiminin matematiksel bir problem olmadığı, özellikle çözülmekte olan problem tarafından belirlendiği ilkesine rehberlik edilmelidir. Bunu doğrulamak için bir örneğe bakalım.

Örnek.İki işletmede bitmiş (yüksek kaliteli) ürün üretme olasılığının P = 0,999 olduğunu, yani kusurlu ürün alma olasılığının a = 0,001 olacağını varsayalım. Matematiksel değerlendirmeler çerçevesinde, ürünün doğasına ilgi duymadan, yüksek bir kıtlık olasılığının olup olmadığı sorusunu çözmek mümkün müdür? a = 0,001? Diyelim ki bir işletme ekim makineleri üretiyor ve ikincisi mahsulleri işlemek için uçaklar üretiyor. 1000 ekim makinesinden bir tanesi arızalıysa bu tolere edilebilir, çünkü ekim makinelerinin %0,1'ini eritmek teknolojik süreci yeniden yapılandırmaktan daha ucuzdur. 1000 uçaktan bir tanesinin arızalı olması elbette operasyonu sırasında ciddi sonuçlara yol açacaktır. Yani ilk durumda evlenme olasılığı A = İkinci durumda 0,001 kabul edilebilir - hayır. Bu nedenle genel olarak hesaplamalarda ve özel olarak tahminler hesaplanırken güven olasılığı seçimi, problemin özel koşullarına göre yapılmalıdır.

Çalışmanın amacına bağlı olarak bir veya iki güven sınırının hesaplanması gerekli olabilir. Çözülen problemin özellikleri, üst veya alt sınırlardan yalnızca birinin ayarlanmasını gerektiriyorsa, bu sınırın belirlenme olasılığının, güven katsayısı 1'in aynı değeri için her iki sınırın belirlenmesinden daha yüksek olacağından emin olabilirsiniz.

Güven sınırlarının P = 0,95 olasılığına göre ayarlanmasına izin verin, yani,

vakaların %95'inde genel ortalama (x) en düşük olandan az olmayacaktır

güven aralığı x ™ - x "m ve üst güven değerinden fazla değil

aralık Xup - = x + Bu durumda, genel ortalama yalnızca a = 0,05 (veya %5) olasılıkla belirlenen sınırların ötesine geçebilir. X'in dağılımı simetrik olduğundan bu seviyenin yarısı

olasılık, yani x (x ™ - ve ikinci yarı - x ^ x "^ - olduğunda% 2,5 meydana gelecektir. Bundan, genel ortalamanın şundan daha az olabileceği sonucu çıkar: üst değer

Hvei'nin güven sınırı "- 0,975'e eşittir (yani 0,95 +0,025). Sonuç olarak, iki güven sınırıyla ihmal ettiğimizde koşullar yaratılır

x'in değeri hem x "" *.'den küçüktür, hem de Heerx'ten büyüktür. Adlandırma

Yalnızca bir güven sınırı, örneğin Xup., yalnızca bu sınırı aşanları ihmal ederiz. Güven katsayısı X'in aynı değeri için buradaki anlamlılık düzeyi a iki kat daha az çıkıyor.

Sadece aşan karakteristik değerler ise

(veya tam tersi) istenen parametrenin değeri x'e tek taraflı güven aralığı denir. Göz önünde bulundurulan değerler her iki tarafta da sınırlıysa güven aralığına iki taraflı denir. Yukarıdakilerden, hipotezlerin ve bir dizi kriterin, özellikle de X-Student testinin tek taraflı ve iki taraflı olarak değerlendirilmesi gerektiği sonucu çıkmaktadır. Bu nedenle, iki taraflı bir hipotezde, aynı X değeri için anlamlılık düzeyi, tek taraflı bir hipotezin iki katı kadar büyük olacaktır. Tek taraflı bir hipotezde anlamlılık düzeyini (ve güven düzeyini) iki taraflı bir hipotezle aynı bırakmak istiyorsak, o zaman X'in değeri daha az alınmalıdır. Bu özellik, X-Student kriterlerinin standart tabloları derlenirken dikkate alınmıştır (Ek 1).

Pratik açıdan bakıldığında, genellikle ilgi çekici olanın, genel ortalamanın olası değerinin güven aralıkları değil, daha ziyade genel ortalamanın daha büyük veya daha az olamayacağı maksimum ve minimum değerler olduğu bilinmektedir. verilen (güven) olasılıktan daha fazladır. Matematiksel istatistiklerde bunlara ortalamanın garanti edilen maksimumu ve garanti edilen minimumu denir. Adlandırılmış parametreleri belirledikten sonra

sırasıyla ve x ™ aracılığıyla şunu yazabiliriz: ХШ ™ = x +; xgemi = x ~.

Yukarıdaki formüllerde tek taraflı güven aralığının sınırları olarak genel ortalamanın garanti edilen maksimum ve minimum değerleri hesaplanırken, değer 1 tek taraflı bir kriter olarak alınır.

Örnek. 20 örnek parsel için ortalama şeker pancarı verimi 300 n/ha idi. Bu örnek ortalama karşılık gelen değeri karakterize eder

nüfus parametresi (x) 10 n/ha hatayla. Tahminlerin seçiciliğine göre genel ortalama verim, örneklem ortalaması x = 300'den büyük veya küçük olabilir. P = 0,95 olasılıkla istenilen parametrenin XIII "= 300 +1,73'ten büyük olmayacağı söylenebilir. x10 = 317,3 kg/ha.

Tek taraflı kritik bölge ve anlamlılık düzeyi ile serbestlik derecesi sayısı ^ = 20-1 için 1 değeri alınır A = 0,05 (Ek 1). Yani, P = 0,95 olasılığı ile genel ortalama verimin garanti edilen maksimum olası seviyesi 317 n/ha olarak tahmin edilmektedir, yani uygun koşullar altında ortalama şeker pancarı verimi belirlenen değeri aşmamaktadır.

Bazı bilgi dallarında (örneğin doğa bilimlerinde), tahmin teorisi istatistiksel hipotezleri test etme teorisinden daha düşüktür. İktisat biliminde istatistiksel değerlendirme yöntemleri, çeşitli pratik hesaplamaların yanı sıra araştırma sonuçlarının güvenilirliğinin kontrol edilmesinde de çok önemli bir rol oynamaktadır. Her şeyden önce bu, incelenen istatistiksel popülasyonların nokta tahmininin kullanılmasıyla ilgilidir. Mümkün olan en iyi tahminin seçilmesi nokta tahmininin temel sorunudur. Böyle bir seçimin olasılığı, istatistiksel tahminlerin temel özelliklerinin (gereksinimlerinin) bilinmesiyle belirlenir.

Genel bir nüfusun niceliksel bir özelliğini incelemek gerekli olsun. Teorik değerlendirmelerden, özelliğin tam olarak hangi dağılıma sahip olduğunu belirleyebildiğimizi varsayalım. Sorun, bu dağılımı belirleyen parametrelerin tahmin edilmesinde ortaya çıkmaktadır. Örneğin, incelenen özelliğin genel popülasyonda normal bir yasaya göre dağıldığı önceden biliniyorsa, bu iki parametre normal dağılımı tamamen belirlediğinden matematiksel beklenti ve standart sapmanın tahmin edilmesi gerekir. Bir özelliğin Poisson dağılımına sahip olduğuna inanmak için bir neden varsa, o zaman bu dağılımın belirlendiği parametrenin tahmin edilmesi gerekir. Tipik olarak yalnızca gözlemlerden elde edilen örnek veriler mevcuttur: , , ... , . Tahmin edilen parametre bu veriler aracılığıyla ifade edilir. , , ...'yi bağımsız rastgele değişkenlerin değerleri olarak düşünürsek, , ... , teorik bir dağılımın bilinmeyen bir parametresinin istatistiksel bir tahminini bulmanın, gözlemlenen rastgele değişkenlerin yaklaşık bir fonksiyonunu bulmak anlamına geldiğini söyleyebiliriz. Tahmin edilen parametrenin değeri.

Bu yüzden, istatistiksel değerlendirme Teorik bir dağılımın bilinmeyen bir parametresine, gözlemlenen rastgele değişkenlerin bir fonksiyonu denir. Bilinmeyen bir popülasyon parametresinin bir sayı kullanılarak istatistiksel olarak tahmin edilmesine denir. nokta. Aşağıdaki nokta tahminleri dikkate alınır: taraflı ve tarafsız, etkili ve tutarlı.

İstatistiksel tahminlerin, tahmin edilen parametrelere iyi yaklaşımlar sunabilmesi için belirli gereksinimleri karşılaması gerekir. Bu gereksinimleri belirtelim. Teorik dağılımın bilinmeyen bir parametresinin istatistiksel bir tahmini olsun. Bir hacim örneğinden bir tahminin bulunduğunu varsayalım. Deneyi tekrarlayalım, yani genel popülasyondan aynı büyüklükte başka bir örnek çıkaracağız ve onun verilerini kullanarak bir tahmin bulacağız, vb. Her birinden farklı olacak , , ... sayıları elde edeceğiz. diğer. Bu nedenle, tahmin rastgele bir değişken olarak düşünülebilir ve , , ... sayıları da onun olası değerleri olarak kabul edilebilir.

Tahmin, fazlalıkla yaklaşık bir değer veriyorsa, örnek verilerden bulunan sayı ( ) gerçek değerden daha büyük olacaktır. Sonuç olarak, rastgele değişkenin matematiksel beklentisi (ortalama değer) 'den büyük olacaktır, yani. Dezavantajlı yaklaşık bir değer veriyorsa, o zaman .

Bu nedenle, matematiksel beklentisi tahmin edilen parametreye eşit olmayan bir istatistiksel tahminin kullanılması sistematik hatalara yol açacaktır. Bu nedenle tahminin matematiksel beklentisinin tahmin edilen parametreye eşit olmasını şart koşmak gerekir. Gereksinime uygunluk sistematik hataları ortadan kaldırır.

Tarafsız matematiksel beklentisi tahmin edilen parametreye eşit olan istatistiksel tahmin denir;

Yerinden edilmiş matematiksel beklentisi tahmin edilen parametreye eşit olmayan istatistiksel tahmin olarak adlandırılır.

Ancak, tarafsız bir tahminin her zaman tahmin edilen parametreye iyi bir yaklaşım sağladığını varsaymak bir hatadır. Aslında olası değerler ortalama değerleri etrafında geniş bir dağılım gösterebilir, yani değerin dağılımı önemli olabilir. Bu durumda, örneğin bir numunenin verilerinden bulunan tahminin, ortalama değerinden ve dolayısıyla tahmin edilen parametrenin kendisinden çok uzak olduğu ortaya çıkabilir. Yaklaşık bir değer olarak alırsak büyük bir hata yaparız. Bir niceliğin varyansının küçük olmasını istiyorsanız büyük hata yapma olasılığı ortadan kalkacaktır. Bu nedenle istatistiksel değerlendirme verimlilik gerekliliklerine tabidir.

Etkili(belirli bir örneklem büyüklüğü için) mümkün olan en küçük varyansa sahip olan istatistiksel bir tahmindir. Büyük örnekleri değerlendirirken istatistiksel tahminlerin tutarlı olması gerekir.

Zengin olasılık olarak tahmin edilen parametreye yönelen istatistiksel tahmin olarak adlandırılır. Örneğin, eğer tarafsız bir tahminin varyansı sıfıra yaklaşıyorsa, bu durumda böyle bir tahminin tutarlı olduğu ortaya çıkar.

Hangi örnek özelliklerin tarafsızlık, verimlilik ve tutarlılık açısından genel ortalamayı ve varyansı en iyi tahmin ettiği sorusunu ele alalım.

Niceliksel bir özelliğe göre ayrı bir genel popülasyonu inceleyelim. Genel Ortaöğretim genel popülasyonun karakteristik değerlerinin aritmetik ortalamasına denir. Formüller kullanılarak hesaplanabilir veya genel hacim popülasyonunun karakteristik değerleri nerede, karşılık gelen frekanslar ve.

Niceliksel bir özelliğin bağımsız gözlemleri sonucunda genel popülasyondan karakteristik değerlere sahip bir hacim örneğinin çıkarılmasına izin verin . Örnek ortalamaörnek popülasyonun aritmetik ortalaması denir. Formüller kullanılarak hesaplanabilir veya örnek hacim popülasyonundaki karakteristik değerleri nerede, karşılık gelen frekanslar ve.

Genel ortalama bilinmiyorsa ve örnek veriler kullanılarak tahmin edilmesi gerekiyorsa, genel ortalamanın tahmini olarak tarafsız ve tutarlı bir tahmin olan örneklem ortalaması alınır. Buradan, aynı genel popülasyondan yeterince büyük boyuttaki birkaç örnekten örnek ortalamaları bulunursa, bu durumda bunların yaklaşık olarak birbirine eşit olacağı sonucu çıkar. Bu mülk numune araçlarının stabilitesi.

İki popülasyonun varyansları aynıysa, örnek ortalamalarının genel ortalamaya yakınlığının, örnek büyüklüğünün genel popülasyon büyüklüğüne oranına bağlı olmadığına dikkat edin. Bu, örneklem büyüklüğüne bağlıdır: örneklem büyüklüğü ne kadar büyük olursa, örneklem ortalaması genel ortalamadan o kadar az farklılık gösterir.

Bir popülasyonun niceliksel bir özelliğinin değerlerinin ortalama değeri etrafındaki dağılımını karakterize etmek için, özet bir özellik - genel dağılım - tanıtılır. Genel varyans popülasyonun karakteristik değerlerinin, formüller kullanılarak hesaplanan ortalama değerlerinden kare sapmalarının aritmetik ortalaması denir: , veya .

Bir numunenin kantitatif bir özelliğinin gözlemlenen değerlerinin ortalama değeri etrafındaki dağılımını karakterize etmek için, bir özet özelliği - numune varyansı - tanıtılır. Örnek varyans formüller kullanılarak hesaplanan, bir özelliğin gözlemlenen değerlerinin ortalama değerlerinden kare sapmalarının aritmetik ortalaması denir: , veya .

Dağılımın yanı sıra, genel (örneklem) popülasyonun bir özelliğinin değerlerinin ortalama değeri etrafındaki dağılımını karakterize etmek için özet bir özellik kullanılır - standart sapma. Genel standart sapma genel varyansın karekökü denir: . Numune standart sapmasıörnek varyansının karekökü denir:

Niceliksel bir karakteristiğe ilişkin bağımsız gözlemlerin bir sonucu olarak genel popülasyondan bir hacim örneği çıkarılsın. Örnek verilere dayanarak bilinmeyen genel varyansın tahmin edilmesi gerekmektedir. Örneklem varyansını genel varyansın tahmini olarak alırsak, bu tahmin sistematik hatalara yol açacak ve genel varyansın eksik tahmin edilmiş bir değerini verecektir. Bu, örneklem varyansının taraflı bir tahmin olmasıyla açıklanmaktadır; başka bir deyişle, örneklem varyansının matematiksel beklentisi, tahmin edilen genel varyansa eşit değildir, ancak eşittir .

Örnek varyansını, beklenen değeri popülasyon varyansına eşit olacak şekilde düzeltmek kolaydır. Bunu yapmak için bir kesirle çarpmanız yeterlidir. Sonuç olarak, genellikle ile gösterilen düzeltilmiş varyansı elde ederiz. Düzeltilmiş varyans, popülasyon varyansının tarafsız bir tahmini olacaktır: .

2. Aralık tahminleri.

Nokta tahmininin yanı sıra, parametre tahmininin istatistiksel teorisi, aralık tahmini konularıyla ilgilenir. Aralık tahmini problemi şu şekilde formüle edilebilir: Örnek verilere dayanarak, önceden seçilmiş bir olasılıkla tahmin edilen parametrenin bu aralık içinde yer aldığını söyleyebileceğimiz sayısal bir nötr oluşturun. Nokta tahmininin büyük ölçüde rastgele olduğu ve bu nedenle pek güvenilir olmadığı durumlarda aralık tahmini özellikle az sayıda gözlem için gereklidir.

Güven aralığı bir parametre için, birliğe yakın önceden seçilmiş bir olasılıkla parametrenin bilinmeyen bir değerini içerdiğini iddia etmenin mümkün olduğu böyle bir aralık denir, yani. . Seçilen olasılığa ilişkin sayı ne kadar küçük olursa, bilinmeyen parametrenin tahmini de o kadar doğru olur. Tersine, eğer bu sayı büyükse, o zaman bu aralık kullanılarak yapılan tahminin pratikte pek faydası yoktur. Güven aralığının uçları numunenin elemanlarına bağlı olduğundan ve değerleri numuneden numuneye değişiklik gösterebilir. Olasılığa genellikle güven olasılığı (güvenilirlik) denir. Tipik olarak, tahminin güvenilirliği önceden belirlenir ve değer olarak bire yakın bir sayı alınır. Güven olasılığının seçimi matematiksel bir problem değildir, çözülmekte olan spesifik problem tarafından belirlenir. En sık belirlenen güvenilirlik şuna eşittir; ; .

Rastgele değişkenin (niceliksel karakteristik) normal dağılması koşuluyla, standart sapmanın bilinen bir değeri için genel ortalama için türetme olmadan bir güven aralığı sunalım:

önceden belirlenmiş bir sayının bire yakın olduğu ve fonksiyon değerleri Ek 2'de verilmiştir.

Bu ilişkinin anlamı şu şekildedir: güven aralığının ( ) bilinmeyen parametreyi kapsar, tahminin doğruluğu eşittir. Sayı eşitlikten belirlenir veya . Tabloyu (Ek 2) kullanarak, Laplace fonksiyonunun değerinin karşılık geldiği argümanı bulun.

örnek 1. Rastgele değişken, bilinen bir standart sapma ile normal bir dağılıma sahiptir. Örneklem büyüklüğü ve tahminin güvenilirliği verilmişse, örneklem ortalamalarına dayalı olarak bilinmeyen genel ortalamayı tahmin etmek için güven aralıklarını bulun.

Çözüm. Hadi bulalım. Bunu ilişkiden anlıyoruz. Tabloyu kullanarak (Ek 2) şunu buluyoruz: Tahminin doğruluğunu bulalım . Güven aralıkları şöyle olacaktır: . Örneğin, eğer , o zaman güven aralığı aşağıdaki güven sınırlarına sahiptir: ; . Böylece bilinmeyen parametrenin değerleri örnek verilerle tutarlı olarak eşitsizliği karşılar .

Standart sapma değeri bilinmeyen bir özelliğin normal dağılımının genel ortalaması için güven aralığı şu ifadeyle verilir: .

Buradan güven aralığının güvenilir bir şekilde ifade edilebileceği anlaşılmaktadır. bilinmeyen parametreyi kapsar.

Verilen tablolar göz önüne alındığında olasılığın bulunabileceği ve verilen tablolar göz önüne alındığında tam tersinin bulunabileceği hazır tablolar (Ek 4) vardır.

Örnek 2. Nüfusun niceliksel özelliği normal dağılmıştır. Hacim numunesine dayanarak numune ortalaması ve düzeltilmiş standart sapma bulundu. Güvenilirliğe sahip bir güven aralığı kullanarak bilinmeyen bir genel ortalamayı tahmin edin.

Çözüm. Hadi bulalım. Tabloyu kullanarak (Ek 4) şunları buluyoruz: . Güven sınırlarını bulalım:

Yani güvenilirlikle bilinmeyen parametre güven aralığında yer alır.

3. İstatistiksel hipotez kavramı. Hipotez testi probleminin genel formülasyonu.

İstatistiksel hipotezlerin test edilmesi parametre tahmin teorisi ile yakından ilgilidir. Doğa bilimlerinde, teknolojide ve ekonomide, şu veya bu rastgele gerçeği açıklığa kavuşturmak için, genellikle istatistiksel olarak test edilebilecek, yani rastgele bir örnekteki gözlemlerin sonuçlarına dayanan hipotezlerin ifade edilmesine başvurulur. Altında istatistiksel hipotezler hipotezler, bir rastgele değişkenin dağılımının türüyle veya bireysel parametreleriyle ilgili anlamına gelir. Dolayısıyla, örneğin istatistiksel hipotez, aynı işi aynı koşullar altında yapan işçilerin emek üretkenliği dağılımının normal bir dağılım yasasına sahip olduğu yönündedir. Benzer paralel çalışan makinelerde üretilen parçaların ortalama boyutlarının birbirinden farklı olmadığı hipotezi de istatistiksel olacaktır.

İstatistiksel hipotez denir basit Rastgele değişkenin dağılımını benzersiz bir şekilde belirliyorsa, aksi takdirde hipotez denir. karmaşık.Örneğin, basit bir hipotez, bir rastgele değişkenin matematiksel beklentisi sıfıra ve varyansı bire eşit olacak şekilde normal dağıldığı varsayımıdır. Rastgele bir değişkenin varyansı bire eşit olan normal bir dağılıma sahip olduğu ve matematiksel beklentinin aralıktan bir sayı olduğu varsayılırsa, bu karmaşık bir hipotezdir. Karmaşık hipotezin başka bir örneği, sürekli bir rastgele değişkenin aralıktan bir değer alma ihtimalinin olduğu varsayımıdır; bu durumda rastgele değişkenin dağılımı, sürekli dağılım sınıfından herhangi biri olabilir.

Genellikle bir miktarın dağılımı bilinir ve bu dağılımın parametrelerinin değeri hakkındaki varsayımların bir gözlem örneği kullanılarak test edilmesi gerekir. Bu tür hipotezlere denir parametrik.

Test edilen hipoteze denir sıfır hipotezi ve belirlenir. Hipotezin yanı sıra alternatif (rakip) hipotezlerden biri de dikkate alınır. Örneğin, bir parametrenin belirli bir değere eşit olduğu hipotezi test ediliyorsa, yani : , o zaman aşağıdaki hipotezlerden biri alternatif bir hipotez olarak düşünülebilir: : ; : ; : ; : , belirtilen değer nerede, . Alternatif hipotezin seçimi problemin spesifik formülasyonuna göre belirlenir.

Bir hipotezin kabul veya reddedilmesi kararının verildiği kurala ne ad verilir? kriter. Karar, rastgele bir değişkenin gözlemlerinin bir örneğine dayanarak verildiğinden, bu durumda kriter istatistiği olarak adlandırılan uygun bir istatistiğin seçilmesi gerekir. Basit bir parametrik hipotezi test ederken: parametreyi tahmin etmek için kullanılan istatistiklerin aynısı kriter istatistikleri olarak seçilir.

İstatistiksel hipotez testi, düşük olasılıklı olayların imkansız, yüksek olasılığa sahip olayların ise güvenilir kabul edilmesi ilkesine dayanmaktadır. Bu prensip şu şekilde uygulanabilir. Numuneyi analiz etmeden önce belirli bir küçük olasılık sabitlenir. önem düzeyi. Bir istatistik değerleri kümesi olsun ve hipotezin doğru olması koşuluyla, kriter istatistiğinin düşme olasılığı eşit olacak şekilde bir alt küme olsun, yani. .

Bir gözlem örneğinden hesaplanan istatistiklerin örnek değerini ifade edelim. Kriter şu şekilde formüle edilmiştir: eğer hipotezi reddedin; varsa hipotezi kabul edin. Önceden belirlenmiş bir anlamlılık düzeyinin kullanımına dayanan bir kritere denir. önem kriteri. Hipotezi reddetme kararının verildiği kriter istatistiklerinin tüm değerlerinin kümesine denir. kritik bölge; alan denir evlat edinme alanı hipotezler.

Anlamlılık düzeyi kritik bölgenin büyüklüğünü belirler. Kritik bölgenin istatistiksel değerler kümesindeki konumu, alternatif hipotezin formülasyonuna bağlıdır. Örneğin, hipotez test edilirse: ve alternatif hipotez şu şekilde formüle edilirse: (), o zaman kritik bölge istatistik dağılımının sağ (sol) “kuyruğunda” bulunur, yani eşitsizlik biçimine sahiptir: (), buna göre olasılıklarla kabul edilen ve hipotezin doğru olması koşuluyla istatistik değerleri nerede ve nerededir. Bu durumda kriter denir tek taraflı, sırasıyla sağ elini ve sol elini kullanır. Alternatif hipotez şu şekilde formüle edilirse, kritik bölge dağılımın her iki "kuyruğunda" yer alır, yani bir dizi eşitsizlik tarafından belirlenir ve; bu durumda kriter denir iki yönlü.

İncirde. Şekil 30'da çeşitli alternatif hipotezler için kritik bölgenin konumu gösterilmektedir. Burada hipotezin doğru olması koşuluyla kriter istatistiklerinin dağılım yoğunluğu, hipotezin kabul alanıdır, .

Bu nedenle, bir anlamlılık testi kullanılarak parametrik istatistiksel hipotezin test edilmesi aşağıdaki aşamalara ayrılabilir:

1) test edilebilir () ve alternatif () hipotezleri formüle etmek;

2) bir önem düzeyi atayın; gözlem sonuçlarıyla tutarsız olduğu için; eğer öyleyse hipotezi kabul edin, yani hipotezin gözlemsel sonuçlarla çelişmediğini varsayın.

Genellikle, 4 - 7 arasındaki adımları gerçekleştirirken, miktarları tablo halinde verilen istatistikler kullanılır: normal dağılıma sahip istatistikler, Öğrenci istatistikleri, Fisher istatistikleri.

Örnek 3. Otomobil motorunun pasaport verilerine göre kişi başı yakıt tüketimi 100 kilometre kilometre 10 litre. Motor tasarımındaki değişiklik sonucunda yakıt tüketiminin azalması bekleniyor. Doğrulamak için testler yapılıyor 25 başına ortalama yakıt tüketimi örneğiyle, yükseltilmiş motora sahip rastgele seçilmiş arabalar 100 kilometre test sonuçlarına göre kilometre 9,3 litre. Yakıt tüketimi örneğinin, ortalaması ve varyansı normal dağılıma sahip bir popülasyondan alındığını varsayalım. Başlangıç ​​istatistikleri için kritik bölge hipotezinin doğru olması, yani anlamlılık düzeyine eşit olması şartıyla. Böylesine kritik bir bölgeye sahip bir kriter için birinci ve ikinci türdeki hata olasılıklarını bulun. matematiksel beklentisi eşit ve varyansı eşit olan normal bir dağılıma sahiptir. Formül (11.2)'yi kullanarak ikinci tip hata olasılığını buluyoruz:

Dolayısıyla kabul edilen kritere göre otomobillerin %13,6'sı yakıt tüketimine sahip 9 litre Açık 100 kilometre kilometre yakıt tüketimi olan araçlar olarak sınıflandırılır 10 litre.

4. Teorik ve ampirik frekanslar. Onay kriterleri.

Ampirik frekanslar- deneyim (gözlem) sonucunda elde edilen frekanslar. Teorik frekanslar formüller kullanılarak hesaplanır. Normal dağılım yasası için bunlar şu şekilde bulunabilir:

, (11.3)

Dersin özeti:

    Değerlendirme kavramı

    İstatistiksel tahminlerin özellikleri

    Nokta tahminlerini bulma yöntemleri

    Aralık parametre tahmini

    Normal dağılım gösteren bir popülasyonun bilinen varyansıyla matematiksel beklentinin güven aralığı.

    Ki-kare dağılımı ve Öğrenci t-dağılımı.

    Varyansı bilinmeyen normal dağılıma sahip bir rastgele değişkenin matematiksel beklentisi için güven aralığı.

    Normal bir dağılımın standart sapması için güven aralığı.

Kaynakça:

    Wentzel, E.S. Olasılık teorisi [Metin] / E.S. Wentzel. – M.: Yüksekokul, 2006. – 575 s.

    Gmurman, V.E. Olasılık teorisi ve matematiksel istatistik [Metin] / V.E. Gmurman. - M.: Yüksekokul, 2007. - 480 s.

    Kremer, N.Ş. Olasılık teorisi ve matematiksel istatistik [Metin] / N.Ş. Kremer - M: BİRLİK, 2002. – 543 s.

S.1. Değerlendirme kavramı

Binom, üstel ve normal gibi dağılımlar, bir veya daha fazla parametreye bağlı dağılım aileleridir. Örneğin, olasılık yoğunluğuna sahip bir üstel dağılım, bir λ parametresine bağlıdır; normal dağılım
- iki parametreden M ve σ. İncelenen problemin koşullarından genellikle hangi dağılım ailesinden bahsettiğimiz açıktır. Ancak bizi ilgilendiren dağılım özelliklerinin ifadelerinde yer alan bu dağılıma ait parametrelerin spesifik değerleri bilinmemektedir. Bu nedenle bu büyüklüklerin en azından yaklaşık değerinin bilinmesi gerekmektedir.

Genel nüfusun dağılım yasası, dağılımında yer alan parametrelerin değerlerine kadar belirlensin
bunlardan bazıları biliniyor olabilir. Matematiksel istatistiğin görevlerinden biri, bir gözlem örneğinden bilinmeyen parametrelerin tahminlerini bulmaktır.
genel nüfustan. Bilinmeyen parametrelerin tahmini, bir fonksiyonun oluşturulmasından oluşur
Bu fonksiyonun değeri tahmin edilen bilinmeyen parametreye yaklaşık olarak eşit olacak şekilde rastgele bir örnekten θ . İşlev isminde İstatistik parametre θ .

İstatistiksel değerlendirme(gelecekte basitçe değerlendirme) parametre θ Teorik dağılıma, seçim verilerine bağlı olarak yaklaşık değeri denir.

Seviye rastgele bir değişkendir çünkü bağımsız rastgele değişkenlerin bir fonksiyonudur
; Başka bir örnek yaparsanız, fonksiyon genel olarak farklı bir değer alacaktır.

İki tür tahmin vardır: nokta ve aralık.

Leke bir sayıyla belirlenen puana denir. Az sayıda gözlemle bu tahminler büyük hatalara yol açabilir. Bunlardan kaçınmak için aralık tahminleri kullanılır.

Aralık iki sayıyla belirlenen bir tahmindir - tahmin edilen değerin belirli bir olasılıkla yer aldığı aralığın uçları θ .

P. 2 İstatistiksel tahminlerin özellikleri

Boyut
isminde değerlendirme doğruluğu. Daha az
ne kadar iyi olursa, bilinmeyen parametre o kadar doğru belirlenir.

Herhangi bir parametrenin değerlendirilmesi, parametrenin gerçek değerine "yakın" olabilmesi için karşılaması gereken bir dizi gereksinime tabidir; bir anlamda “iyi huylu” bir değerlendirme olabilir. Bir tahminin kalitesi, tarafsızlık, etkinlik ve tutarlılık özelliklerine sahip olup olmadığı kontrol edilerek belirlenir.

Seviye parametre θ isminde yerinden edilmemiş(sistematik hatalar olmadan), eğer tahminin matematiksel beklentisi gerçek değerle örtüşüyorsa θ :

. (1)

Eşitlik (1) sağlanmıyorsa tahmin isminde yerinden edilmiş(sistematik hatalarla). Bu önyargı, ölçüm hatalarından, sayma hatalarından veya numunenin rastgele olmayan yapısından kaynaklanabilir. Sistematik hatalar aşırı tahmine veya eksik tahmine yol açar.

Matematiksel istatistikteki bazı problemler için birçok tarafsız tahmin bulunabilir. Genellikle en az saçılıma (dağılım) sahip olan tercih edilir.

Seviye isminde etkili parametrenin tüm olası tarafsız tahminleri arasında en küçük varyansa sahipse θ .

İzin vermek D() minimum varyanstır ve
– herhangi bir diğer tarafsız tahminin varyansı parametre θ . Daha sonra tahminin etkinliği eşittir

. (2)

Açık ki
. daha yakın
1'e kadar, değerlendirme ne kadar etkili olursa . Eğer
en
, o zaman tahmin çağrılır asimptotik olarak verimli.

Yorum: Eğer skor önyargılıysa, varyansının küçüklüğü, hatasının küçük olduğunu göstermez. Örneğin parametre tahmini olarak alındığında θ bazı sayılar sıfır varyansla bile bir tahmin elde ederiz. Ancak bu durumda hata (hata)
istediğiniz kadar büyük olabilir.

Seviye isminde zengin, eğer örneklem büyüklüğü arttıkça (
) tahmin olasılık açısından parametrenin tam değerine yakınsar θ yani eğer birisi içinse

. (3)

Değerlendirmenin geçerliliği parametre θ büyümeyle birlikte anlamına gelir Nörneklem büyüklüğü değerlendirme kalitesi gelişmektedir.

Teorem 1. Örnek ortalama, matematiksel beklentinin tarafsız ve tutarlı bir tahminidir.

Teorem 2. Düzeltilmiş örnek varyansı, varyansın tarafsız ve tutarlı bir tahminidir.

Teorem 3. Bir numunenin ampirik dağılım fonksiyonu, bir rastgele değişkenin dağılım fonksiyonunun tarafsız ve tutarlı bir tahminidir.

Yükleniyor...