ecosmak.ru

Բաշխման պարամետրերի վիճակագրական գնահատականներ: Բաշխման պարամետրերի կետային գնահատում Վիճակագրական գնահատում և դրա հատկությունները

Պատահական փոփոխականի բաշխումը (ընդհանուր բնակչության բաշխումը) սովորաբար բնութագրվում է մի շարք թվային բնութագրերով.

  • նորմալ բաշխման համար N(a, σ) մաթեմատիկական սպասումն է a և ստանդարտ շեղումը σ ;
  • միատեսակ բաշխման համար R(a,b) այն միջակայքի սահմաններն են, որոնցում դիտվում են այս պատահական փոփոխականի արժեքները:
Նման թվային բնութագրերը, որպես կանոն, անհայտ, կոչվում են բնակչության պարամետրերը . Պարամետրերի գնահատում - նմուշից հաշվարկված համապատասխան թվային բնութագիրը. Բնակչության պարամետրերի գնահատումները բաժանվում են երկու դասի. կետԵվ ընդմիջում.

Երբ գնահատականը սահմանվում է մեկ թվով, այն կոչվում է միավորի գնահատում. Կետերի գնահատում, որպես նմուշի ֆունկցիա, պատահական փոփոխական է և տատանվում է նմուշից նմուշ կրկնվող փորձերի ժամանակ։
Կետային գնահատումները ենթակա են պահանջների, որոնք նրանք պետք է բավարարեն ցանկացած իմաստով «լավ» լինելու համար: Սա անաչառություն, արդյունավետությունըԵվ վճարունակությունը.

Ինտերվալների գնահատումներորոշվում են երկու թվերով՝ գնահատված պարամետրը ընդգրկող միջակայքի ծայրերը: Ի տարբերություն կետերի գնահատումների, որոնք պատկերացում չեն տալիս, թե որքան հեռու կարող է լինել գնահատված պարամետրը դրանցից, միջակայքային գնահատումները թույլ են տալիս հաստատել գնահատումների ճշգրտությունն ու հուսալիությունը:

Որպես մաթեմատիկական ակնկալիքի, շեղման և ստանդարտ շեղման կետային գնահատումներ, օգտագործվում են ընտրանքի բնութագրերը, համապատասխանաբար, ընտրանքի միջինը, ընտրանքի շեղումը և նմուշի ստանդարտ շեղումը:

Անաչառ գույքի գնահատում.
Գնահատման ցանկալի պահանջը համակարգային սխալի բացակայությունն է, այսինքն. կրկնակի օգտագործմամբ, դրա գնահատման θ պարամետրի փոխարեն, մոտավոր սխալի միջին արժեքը զրո է. անաչառ գույքի գնահատում.

Սահմանում. Գնահատումը կոչվում է անաչառ, եթե դրա մաթեմատիկական ակնկալիքը հավասար է գնահատված պարամետրի իրական արժեքին.

Ընտրանքային թվաբանական միջինը մաթեմատիկական ակնկալիքի անաչառ գնահատումն է և ընտրանքի շեղումը - ընդհանուր շեղումների կանխակալ գնահատում Դ. Ընդհանուր շեղման անաչառ գնահատականը գնահատումն է

Գնահատման հետևողականության հատկություն.
Գնահատման երկրորդ պահանջը՝ դրա հետևողականությունը, նշանակում է գնահատման բարելավում ընտրանքի չափի մեծացմամբ:

Սահմանում. Դասարան կոչվում է հետևողական, եթե այն հակված է n→∞ գնահատված θ պարամետրին:


Հավանականության կոնվերգենցիան նշանակում է, որ ընտրանքի մեծ չափի դեպքում գնահատման մեծ շեղումների հավանականությունը իրական արժեքից փոքր է:

Արդյունավետ գնահատման հատկություն.
Երրորդ պահանջը թույլ է տալիս ընտրել լավագույն գնահատականը նույն պարամետրի մի քանի գնահատականներից:

Սահմանում. Անկողմնակալ գնահատիչը արդյունավետ է, եթե այն ունի ամենափոքր շեղումը բոլոր անաչառ գնահատողների միջև:

Սա նշանակում է, որ արդյունավետ գնահատումը նվազագույն ցրվածություն ունի պարամետրի իրական արժեքի վերաբերյալ: Նկատի ունեցեք, որ արդյունավետ գնահատիչ միշտ չէ, որ գոյություն ունի, բայց սովորաբար կարելի է ընտրել ավելի արդյունավետ գնահատող երկու գնահատողներից, այսինքն. ավելի քիչ ցրվածությամբ: Օրինակ, սովորական ընդհանուր բնակչության N(a,σ) անհայտ պարամետրի համար և՛ թվաբանական միջինը, և՛ ընտրանքի միջինը կարող են ընդունվել որպես անաչառ գնահատական: Սակայն ընտրանքի միջինի շեղումը մոտավորապես 1,6 անգամ ավելի մեծ է, քան միջին թվաբանականի շեղումը: Հետևաբար, ավելի արդյունավետ գնահատում է միջին թվաբանական միջինը:

Օրինակ #1. Գտեք մեկ սարքի կողմից որոշ պատահական փոփոխականի չափումների անաչառ գնահատական ​​(առանց համակարգային սխալների), որի չափման արդյունքները (մմ-ով)՝ 13,15,17:
Լուծում. Ցուցանիշների հաշվարկման աղյուսակ.

x|x - x cf |(x - x sr) 2
13 2 4
15 0 0
17 2 4
45 4 8

պարզ թվաբանական միջին(անաչառ ակնկալիքների գնահատում)


Ցրվածություն- բնութագրում է տարածման չափը իր միջին արժեքի շուրջ (ցրվածության չափում, այսինքն՝ միջինից շեղում - կողմնակալ գնահատում):


Տարբերության անաչառ գնահատող- շեղումների հետևողական գնահատում (ուղղված շեղում):

Օրինակ #2. Գտեք մեկ սարքի միջոցով որոշ պատահական փոփոխականի չափումների մաթեմատիկական ակնկալիքի անաչառ գնահատականը (առանց համակարգային սխալների), որի չափման արդյունքները (մմ-ով)՝ 4,5,8,9,11:
Լուծում. մ = (4+5+8+9+11)/5 = 7.4

Օրինակ #3. Գտե՛ք S 2 ուղղված շեղումը n=10 ընտրանքի չափի համար, եթե ընտրանքի շեղումը D = 180 է:
Լուծում. S 2 \u003d n * D / (n-1) \u003d 10 * 180 / (10-1) \u003d 200

վիճակագրական գնահատման բաշխման նմուշ

Գնահատումը ցանկալի արժեքի արժեքների մոտարկումն է, որը ստացվել է ընտրովի դիտարկման արդյունքների հիման վրա: Գնահատումները պատահական փոփոխականներ են: Դրանք ապահովում են ընդհանուր բնակչության անհայտ պարամետրերի վերաբերյալ ողջամիտ դատողություն կազմելու հնարավորություն։ Ընդհանուր միջինը գնահատելու օրինակ է ընդհանուր շեղման միջին ընտրանքը՝ նմուշի շեղում և այլն։

Գնահատելու համար, թե գնահատումը որքանով է «լավ» համապատասխանում համապատասխան ընդհանուր բնութագրին, մշակվել են 4 չափորոշիչներ՝ հետևողականություն, անաչառություն, արդյունավետություն և բավարարություն: Այս մոտեցումը հիմնված է այն փաստի վրա, որ գնահատման որակը որոշվում է ոչ թե դրա առանձին արժեքներով, այլ դրա բաշխման բնութագրերով՝ որպես պատահական փոփոխական:

Հավանականությունների տեսության դրույթների հիման վրա կարելի է ապացուցել, որ այնպիսի նմուշային բնութագրերից, ինչպիսիք են թվաբանական միջինը, եղանակը և միջինը, միայն թվաբանական միջինն է ընդհանուր միջինի հետևողական, անաչառ, արդյունավետ և բավարար գնահատական: Սա որոշում է մի շարք այլ նմուշների բնութագրերում թվաբանական միջինին տրված նախապատվությունը:

անաչառգնահատումը դրսևորվում է նրանով, որ ցանկացած ընտրանքի չափի համար դրա մաթեմատիկական ակնկալիքը հավասար է ընդհանուր բնակչության գնահատված պարամետրի արժեքին: Եթե ​​այս պահանջը չի բավարարվում, ապա գնահատականը տեղահանված.

Անաչառ գնահատման պայմանը նպատակաուղղված է համակարգված գնահատման սխալների վերացմանը:

Գնահատման խնդիրներ լուծելիս օգտագործում են նաև ասիմպտոտիկ անաչառ գնահատականներ, որի համար ընտրանքի չափի աճով մաթեմատիկական ակնկալիքը հակված է ընդհանուր բնակչության գնահատված պարամետրին։

վճարունակությունըվիճակագրական գնահատականները դրսևորվում են նրանով, որ ընտրանքի չափի մեծացմամբ գնահատականը ավելի ու ավելի է մոտենում գնահատված պարամետրի իրական արժեքին, կամ, ինչպես ասում են, գնահատականը, ամենայն հավանականությամբ, համընկնում է ցանկալի պարամետրին, կամ ձգտում է դրան. մաթեմատիկական ակնկալիք. Գործնական նշանակություն ունեն միայն հետևողական գնահատականները:

Սա անաչառ պարամետրի գնահատումն է, որն ունի ամենափոքր շեղումը տվյալ ընտրանքի չափի համար: Գործնականում գնահատման շեղումը սովորաբար նույնացվում է գնահատման սխալի հետ:

Ինչպես գնահատման արդյունավետության միջոցառումներվերցրեք նվազագույն հնարավոր շեղումների հարաբերակցությունը մեկ այլ գնահատականի շեղմանը:

Գնահատումը, որն ապահովում է ընտրանքում պարունակվող ամբողջ տեղեկատվության օգտագործման ամբողջականությունը ընդհանուր բնակչության անհայտ բնութագրիչի վերաբերյալ, կոչվում է. բավարար(սպառիչ):

Համապատասխանությունը վերը քննարկված վիճակագրական գնահատումների հատկություններին հնարավորություն է տալիս դիտարկել ընտրանքի բնութագրերը ընդհանուր բնակչության պարամետրերը գնահատելու համար որպես հնարավոր լավագույնը:

Մաթեմատիկական վիճակագրության ամենակարևոր խնդիրն ընտրանքային տվյալներից ընդհանուր բնակչության ցանկալի պարամետրերի առավել ռացիոնալ, «ճշմարիտ» վիճակագրական գնահատականներ ստանալն է։ Գոյություն ունեն վիճակագրական եզրակացության երկու տեսակ՝ վիճակագրական գնահատում; վիճակագրական վարկածների փորձարկում.

Վիճակագրական գնահատականներ ստանալու հիմնական խնդիրն է ընտրել և հիմնավորել լավագույն գնահատականները, որոնք ապահովում են ընդհանուր բնակչության անհայտ պարամետրերի իմաստալից գնահատման հնարավորությունը:

Անհայտ պարամետրերի գնահատման խնդիրը կարող է լուծվել երկու եղանակով.

  • 1. Անհայտ պարամետրը բնութագրվում է մեկ թվով (կետ) - օգտագործվում է կետերի գնահատման մեթոդը;
  • 2. ինտերվալի գնահատում, այսինքն՝ որոշվում է միջակայք, որում որոշ հավանականությամբ կարելի է գտնել ցանկալի պարամետրը։

Կետերի գնահատումանհայտ պարամետրը կայանում է նրանում, որ ընտրանքի գնահատման հատուկ թվային արժեքը վերցվում է որպես ընդհանուր բնակչության իրական պարամետրի լավագույն մոտարկում, այսինքն՝ ընդհանուր բնակչության անհայտ պարամետրը գնահատվում է մեկ թվով (կետով) որոշվում է նմուշից: Այս մոտեցմամբ միշտ կա սխալվելու վտանգ, ուստի միավորի գնահատումը պետք է լրացվի հավանականության որոշակի մակարդակի հնարավոր սխալի ցուցիչով:

Դրա ստանդարտ շեղումը ընդունվում է որպես միջին գնահատման սխալ:

Այնուհետև ընդհանուր միջինի միավորի գնահատումը կարող է ներկայացվել որպես ինտերվալ

որտեղ է օրինակելի թվաբանական միջինը:

Կետային գնահատման ժամանակ օգտագործվում են մի քանի մեթոդներ՝ ընտրանքային տվյալներից գնահատումներ ստանալու համար.

  • 1. մոմենտների մեթոդը, որում ընդհանուր բնակչության մոմենտը փոխարինվում է նմուշի մոմենտներով.
  • 2. նվազագույն քառակուսիների մեթոդ;
  • 3. առավելագույն հավանականության մեթոդ.

Շատ խնդիրների դեպքում պահանջվում է գտնել ոչ միայն ընդհանուր բնակչության պարամետրի թվային գնահատում, այլև գնահատել դրա ճշգրտությունն ու հուսալիությունը: Սա հատկապես կարևոր է համեմատաբար փոքր նմուշների համար: Վիճակագրական պարամետրի կետային գնահատման ընդհանրացումն այն է միջակայքի գնահատում- գտնել որոշակի հավանականությամբ գնահատված պարամետրը պարունակող թվային միջակայք:

Հաշվի առնելով այն հանգամանքը, որ նմուշի տվյալներից ընդհանուր բնութագրերը որոշելիս միշտ կա որոշակի սխալ, ավելի գործնական է որոշել հայտնաբերված կետի գնահատման մեջ կենտրոնացած միջակայքը, որի շրջանակներում գտնվում է ընդհանուր բնութագրի գնահատված պարամետրի իրական ցանկալի արժեքը. որոշակի տրված հավանականություն. Նման միջակայքը կոչվում է վստահության միջակայք:

Վստահության միջակայքթվային միջակայք է, որը տրված r հավանականությամբ ընդգրկում է ընդհանուր բնակչության գնահատված պարամետրը։ Այս հավանականությունը կոչվում է վստահություն: Վստահության հավանականություն r-ն այն հավանականությունն է, որը կարող է բավարար ճանաչվել լուծվող խնդրի շրջանակներում՝ ընտրանքային դիտարկումների հիման վրա ստացված բնութագրերի հավաստիությունը դատելու համար: արժեք

սխալվելու հավանականությունը կոչվում է նշանակության մակարդակը.

Ընդհանուր բնակչության AND պարամետրի ընտրովի (կետ) գնահատման ԵՎ * (թետա) ճշգրտությամբ ( սահմանային սխալ) D և վստահության հավանականությունը r վստահության միջակայքը որոշվում է հավասարությամբ.

Վստահության հավանականությունը r հնարավորություն է տալիս հաստատել վստահության սահմաններըՈւսումնասիրված պարամետրի պատահական տատանում Եվ տվյալ նմուշի համար:

Հետևյալ արժեքները և դրանց համապատասխան արժեքները հաճախ ընդունվում են որպես վստահության մակարդակ նշանակության մակարդակները

Աղյուսակ 1. Առավել հաճախ օգտագործվող վստահության մակարդակները և նշանակության մակարդակները

Օրինակ, 5 տոկոս նշանակության մակարդակը նշանակում է հետևյալը. 100-ից 5 դեպքում առկա է ընտրանքային տվյալների հիման վրա բնակչության բնութագրերի բացահայտման հարցում սխալ թույլ տալու վտանգ: Կամ, այլ կերպ ասած, 100-ից 95 դեպքում նմուշի հիման վրա բացահայտված ընդհանուր բնութագիրը կլինի վստահության միջակայքում:

Թող պահանջվի ուսումնասիրել, օրինակ, ընդհանուր բնակչության քանակական նշանը։ Ենթադրենք, որ տեսական նկատառումներից ելնելով հնարավոր է եղել պարզել, թե որ բաշխումն ունի առանձնահատկություն։ Բնականաբար, առաջանում է այս բաշխումը որոշող պարամետրերի գնահատման խնդիր։ Օրինակ, եթե նախապես հայտնի է, որ ուսումնասիրվող հատկանիշը սովորաբար բաշխված է ընդհանուր բնակչության մեջ, ապա անհրաժեշտ է գնահատել (մոտավորապես գտնել) մաթեմատիկական ակնկալիքը a և ստանդարտ շեղումը s, քանի որ այս երկու պարամետրերը լիովին որոշում են նորմալը: բաշխում.

Սովորաբար, հետազոտողն իր տրամադրության տակ ունի միայն նմուշային տվյալներ, օրինակ՝ քանակական հատկանիշի արժեքները x 1, x 2, ..., x n, որոնք ստացվել են n դիտարկման արդյունքում: Այս տվյալների միջոցով և արտահայտեք գնահատված պարամետրը.

Թող q * լինի տեսական բաշխման q անհայտ պարամետրի վիճակագրական գնահատականը: Տարբերել անաչառԵվ տեղահանվածգնահատականներ։

անաչառկոչվում է վիճակագրական գնահատում q*, որի մաթեմատիկական ակնկալիքը հավասար է գնահատված q պարամետրին ցանկացած ընտրանքի չափի համար, այսինքն.

Հակառակ դեպքում, այսինքն, եթե M(q *) ¹ q, հաշվարկը կոչվում է տեղահանված.

Անաչառության պահանջը նշանակում է, որ դիտարկվող արժեքների նույն ուղղությամբ q-ից համակարգված շեղում չպետք է լինի:

Կա նաև վիճակագրական գնահատման պահանջ։ արդյունավետությունը, որը ենթադրում է (տվյալ նմուշի չափի համար) ամենափոքր հնարավոր շեղումը, իսկ մեծ ընտրանքի դեպքում՝ պահանջը. վճարունակությունը, այսինքն՝ պատահական փոփոխականի դիտարկվող արժեքների գործնական համընկնումը՝ գնահատված պարամետրի հետ։

Եթե ​​վիճակագրական նյութը ներկայացվում է տատանումների շարքի տեսքով, ապա դրա հետագա վերլուծությունն իրականացվում է, որպես կանոն, որոշ հաստատուն արժեքների օգնությամբ, որոնք լիովին արտացոլում են ուսումնասիրված ընդհանուր բնակչությանը բնորոշ օրինաչափությունները:

Այս հաստատունները ներառում են միջին արժեքներ, որոնց թվում ամենակարևորն է թվաբանական միջին- այն ավելի պարզ է, քան մյուսները և իմաստով, և հատկություններով, և ստացման եղանակով:

Քանի որ ընտրանքն իրականացվում է ընդհանուր բնակչության ուսումնասիրության ժամանակ, նմուշը բնութագրող հաստատունը կոչվում է նմուշի միջինև նշվում է.

Կարելի է ցույց տալ, որ կա անաչառ գնահատողընդհանուր բնակչության նշանի միջին թվաբանական արժեքը, այսինքն

Թող որոշ հավաքածու բաժանվի մասերի - խմբերը, պարտադիր չէ, որ նույն չափը լինի: Այնուհետև կոչվում են խմբի անդամների միջին թվաբանական բաշխումները խմբի միջին ցուցանիշներըև բաշխման միջին թվաբանականը ամբողջ բնակչության վրա նույն հիմքի վրա. ընդհանուր միջին. Խմբերը կոչվում են տարանջատելեթե բնակչության յուրաքանչյուր անդամ պատկանում է միայն մեկ խմբի.

Ընդհանուր միջինը հավասար է բոլոր չհամընկնող խմբերի խմբերի միջին թվաբանականին:

Օրինակ.Հաշվարկել ձեռնարկության աշխատողների միջին աշխատավարձը ըստ աղյուսակի

Լուծում.Ըստ սահմանման, ընդհանուր միջինը

. (*)

n 1 \u003d 40, n 2 \u003d 50, n 3 \u003d 60

Թիվ 1 խանութի աշխատողների միջին աշխատավարձը: Այն գտնելու համար մենք կազմել ենք ամբողջ խանութի միջին թվաբանական աշխատավարձը՝ 75, 85, 95 և 105 (մոտ): Հարմարության համար այս արժեքները կարող են լինել. կրճատվել է հինգ անգամ (սա նրանց ամենամեծն է ընդհանուր բաժանարար): 15, 17, 19, 21: Մնացածը պարզ է բանաձևից:

Նմանատիպ գործողություններ կատարելով՝ մենք գտնում ենք.

Ստացված արժեքները փոխարինելով (*) մեջ՝ ստանում ենք

Միջինները հաստատուն արժեքներ են, որոնք որոշակի ձևով բնութագրում են բաշխումները:Որոշ բաշխումներ գնահատվում են միայն միջոցներով: Օրինակ՝ մակարդակները համեմատելու համար աշխատավարձերըԱրդյունաբերության տարբեր ճյուղերում բավական է համեմատել դրանց միջին աշխատավարձը։ Այնուամենայնիվ, միջին ցուցանիշները չեն կարող օգտագործվել՝ դատելու ոչ ամենաբարձր և ամենացածր վարձատրվող աշխատողների աշխատավարձերի մակարդակների տարբերությունները, ոչ էլ միջին աշխատավարձից ինչ շեղումներ են տեղի ունենում:

Վիճակագրության մեջ ամենամեծ հետաքրքրությունը հատկանիշի արժեքների տարածումն է դրանց միջին թվաբանականի շուրջ:Գործնականում և տեսական ուսումնասիրություններում հատկանիշի դիսպերսիան ավելի հաճախ բնութագրվում է դիսպերսիայով և ստանդարտ շեղումով։

Նմուշի շեղում D B-ն կոչվում է հատկանիշի դիտարկված արժեքների միջին արժեքից շեղման քառակուսիների թվաբանական միջին:

Եթե ​​n նմուշի չափի հատկանիշի բոլոր արժեքները х 1, х 2, … х n տարբեր են, ապա

. (3)

Եթե ​​x 1, x 2, ... x k հատկանիշի արժեքները համապատասխանաբար ունեն n 1, n 2, ... n k հաճախականություններ, և n 1 + n 2 + ... + n k \u003d n, ապա

. (4)

Եթե ​​կարիք կա, որ ցրման ինդեքսն արտահայտվի նույն միավորներով, ինչ բնորոշ արժեքները, ապա կարող եք օգտագործել ամփոփ բնութագիրը. ստանդարտ շեղում

Տարբերությունը հաշվարկելու համար սովորաբար օգտագործվում է բանաձևը

Եթե ​​բնակչությունը բաժանված է ոչ համընկնող խմբերի, ապա դրանք բնութագրելու համար կարող ենք ներկայացնել խումբ, ներխմբային, միջխմբային և ընդհանուր դիսպերսիա հասկացությունները։

Խումբշեղումը j-րդ խմբի անդամների բաշխման շեղումն է նրանց միջին - խմբի միջինի նկատմամբ, այսինքն.

որտեղ n i-ը x i արժեքի հաճախականությունն է, j խմբի ծավալն է:

Ներխմբայինշեղումը խմբային շեղումների թվաբանական միջինն է

որտեղ N j (j = 1, 2, …, m) տարանջատված խմբերի ծավալներն են:

Միջխմբայինշեղումը բոլոր չհամընկնող խմբերի խմբային միջինների քառակուսի շեղումների միջին թվաբանական միջինն է ընդհանուր միջինից, այսինքն.

.

Գեներալշեղումը ամբողջ բնակչության հատկանիշի արժեքների շեղումն է ընդհանուր միջինի նկատմամբ

,

որտեղ n i - հաճախականության արժեքը x i; - ընդհանուր միջին; n-ը ամբողջ բնակչության ծավալն է:

Կարելի է ցույց տալ, որ D ընդհանուր շեղումը հավասար է գումարին, այսինքն.

Օրինակ.Գտե՛ք հետևյալ երկու խմբերից կազմված բնակչության ընդհանուր շեղումը

Առաջին խումբ Երկրորդ խումբ
x i n i x i n i

Լուծում.Գտնենք խմբի միջինները

Գտնենք խմբի շեղումները

Գտնենք ընդհանուր միջինը

Պահանջվող ընդհանուր շեղում

Վերը դիտարկված գնահատականները սովորաբար կոչվում են մատնանշել, քանի որ այս գնահատականները որոշված ​​են մեկ թիվ. Երբ փոքր ծավալնմուշ, օգտագործվում է միջակայքի գնահատում, որը որոշվում է երկու թիվ, որը կոչվում է միջակայքի ծայրեր։

Ինտերվալային գնահատումները հնարավորություն են տալիս հաստատել ճշգրտություն և հուսալիությունվարկանիշները. Եկեք բացատրենք այս հասկացությունների իմաստը: Թող ընտրանքային տվյալներից հայտնաբերված q * վիճակագրական բնութագիրը ծառայի որպես անհայտ q պարամետրի գնահատում: Հասկանալի է, որ q * որքան ճշգրիտ կորոշի q պարամետրը, այնքան փոքր է բացարձակ արժեքը: Այլ կերպ ասած, եթե d > 0 և , ապա որքան փոքր է d-ն, այնքան ավելի ճշգրիտ կլինի գնահատումը:

Այսպիսով, d > 0 թիվը բնութագրում է ճշգրտությունգնահատականներ։ Բայց մյուս կողմից, վիճակագրական մեթոդները թույլ չեն տալիս մեզ կտրականապես պնդել, որ q* գնահատումը բավարարում է անհավասարությունը: Այստեղ մենք կարող ենք միայն խոսել հավանականություններ է, որով իրականացվում է այս անհավասարությունը։ Այս հավանականությունը g կոչվում է հուսալիություն (վստահության հավանականություն) q գնահատելով q * .

Այսպիսով, ասվածից հետևում է, որ

(*) կապը պետք է հասկանալ հետևյալ կերպ. հավանականությունը, որ միջակայքը (q * - d, q * + d) պարունակում է (ընդգրկում է) q անհայտ պարամետրը հավասար է g-ի։ Անհայտ պարամետրը տրված g հուսալիությամբ ծածկող միջակայքը (q * - d, q * + d) կոչվում է վստահության միջակայք։

Օրինակ.Պատահական X փոփոխականն ունի նորմալ բաշխում՝ հայտնի ստանդարտ շեղումով s = 3: Գտեք անհայտ մաթեմատիկական ակնկալիքը a գնահատելու վստահության միջակայքերը ընտրանքի միջինից, եթե ընտրանքի չափը n = 36 է, իսկ գնահատման հուսալիությունը տրված է g = 0,95.

Լուծում.Նշենք, որ եթե պատահական արժեք X-ը սովորաբար բաշխվում է, այնուհետև անկախ դիտարկումներից հայտնաբերված միջին նմուշը նույնպես սովորաբար բաշխվում է, և բաշխման պարամետրերն են՝ , (տես էջ 54):

Մենք պահանջում ենք, որ հարաբերությունները

.

Օգտագործելով բանաձևը (**) (տե՛ս էջ 43), X-ը փոխարինելով և s-ով , մենք ստանում ենք.

Ընդհանուր բնակչության պարամետրերի վիճակագրական գնահատականներ. Վիճակագրական վարկածներ

ԴԱՍԱԽՈՍՈՒԹՅՈՒՆ 16

Թող պահանջվի ուսումնասիրել ընդհանուր բնակչության քանակական նշանը։ Ենթադրենք, որ տեսական նկատառումներից ելնելով հնարավոր է եղել պարզել, թե որ բաշխումն ունի առանձնահատկություն։ Սա առաջացնում է այս բաշխումը որոշող պարամետրերի գնահատման խնդիր։ Օրինակ, եթե հայտնի է, որ ուսումնասիրվող հատկանիշը բաշխված է ընդհանուր բնակչության մեջ սովորական օրենքի համաձայն, ապա անհրաժեշտ է գնահատել (մոտավորապես գտնել) մաթեմատիկական ակնկալիքը և ստանդարտ շեղումը, քանի որ այս երկու պարամետրերը լիովին որոշում են նորմալ բաշխումը: . Եթե ​​հիմքեր կան ենթադրելու, որ հատկանիշն ունի Poisson բաշխում, ապա անհրաժեշտ է գնահատել պարամետրը, որը որոշում է այս բաշխումը:

Սովորաբար, բաշխման ժամանակ հետազոտողն ունի միայն ընտրանքային տվյալներ, օրինակ՝ դիտումների արդյունքում ստացված քանակական հատկանիշի արժեքները (այսուհետ՝ դիտարկումները ենթադրվում են անկախ): Այս տվյալների միջոցով և արտահայտեք գնահատված պարամետրը:

Հաշվի առնելով որպես անկախ պատահական փոփոխականների արժեքներ , կարելի է ասել, որ գտնել տեսական բաշխման անհայտ պարամետրի վիճակագրական գնահատականը նշանակում է գտնել դիտարկված պատահական փոփոխականների ֆունկցիա, որը տալիս է գնահատված պարամետրի մոտավոր արժեքը։ Օրինակ, ինչպես ցույց կտա ստորև, նորմալ բաշխման մաթեմատիկական ակնկալիքը գնահատելու համար օգտագործվում է ֆունկցիան (հատկանիշի դիտարկված արժեքների միջին թվաբանականը).

.

Այսպիսով, վիճակագրական գնահատումՏեսական բաշխման անհայտ պարամետրը կոչվում է դիտարկված պատահական փոփոխականների ֆունկցիա: Ընդհանուր բնակչության անհայտ պարամետրի վիճակագրական գնահատականը, որը գրված է որպես մեկ թիվ, կոչվում է կետ. Հաշվի առեք հետևյալ կետերի գնահատումները՝ կողմնակալ և անկողմնակալ, արդյունավետ և հետևողական:

Որպեսզի վիճակագրական գնահատումները գնահատված պարամետրերի «լավ» մոտարկումներ տան, դրանք պետք է բավարարեն որոշակի պահանջներ: Եկեք հստակեցնենք այս պահանջները.

Թող լինի տեսական բաշխման անհայտ պարամետրի վիճակագրական գնահատում։ Ենթադրենք, որ ծավալը նմուշառելիս հայտնաբերվում է գնահատական: Կրկնենք փորձը, այսինքն՝ ընդհանուր պոպուլյացիայից կհանենք նույն չափի մեկ այլ նմուշ և, օգտագործելով դրա տվյալները, կգտնենք նախահաշիվ և այլն։ Փորձը բազմիցս կրկնելով՝ ստանում ենք թվերը , որոնք, ընդհանուր առմամբ, կտարբերվեն միմյանցից։ Այսպիսով, գնահատումը կարելի է դիտարկել որպես պատահական փոփոխական, իսկ թվերը որպես հնարավոր արժեքներ:

Հասկանալի է, որ եթե գնահատումը տալիս է մոտավոր արժեք ավելցուկով, ապա նմուշների տվյալներից հայտնաբերված յուրաքանչյուր թիվ ավելի մեծ կլինի, քան .-ի իրական արժեքը: Հետևաբար, այս դեպքում պատահական փոփոխականի մաթեմատիկական (միջին արժեքը) ավելի մեծ կլինի, քան , այսինքն. Ակնհայտ է, որ եթե այն տալիս է մոտավոր արժեք թերության հետ, ապա .


Հետևաբար, վիճակագրական գնահատման օգտագործումը, որի մաթեմատիկական ակնկալիքը հավասար չէ գնահատված պարամետրին, հանգեցնում է համակարգված (մեկ նշանի) սխալների։ Այդ իսկ պատճառով բնական է պահանջել, որ գնահատման մաթեմատիկական ակնկալիքը հավասար լինի գնահատված պարամետրին: Չնայած այս պահանջին համապատասխանելը, ընդհանուր առմամբ, չի վերացնի սխալները (որոշ արժեքներ ավելի մեծ են, իսկ մյուսները՝ ավելի փոքր, քան ), տարբեր նշանների սխալները տեղի կունենան նույնքան հաճախ: Այնուամենայնիվ, պահանջին համապատասխանելը երաշխավորում է համակարգված սխալներ ստանալու անհնարինությունը, այսինքն՝ վերացնում է համակարգված սխալները։

անաչառկոչվում է վիճակագրական գնահատում (սխալ), որի մաթեմատիկական ակնկալիքը հավասար է ցանկացած ընտրանքի չափի գնահատված պարամետրին, այսինքն՝ .

Տեղահանվածկոչվում է վիճակագրական գնահատում, որի մաթեմատիկական ակնկալիքը հավասար չէ ցանկացած ընտրանքի չափի գնահատված պարամետրին, այսինքն.

Այնուամենայնիվ, սխալ կլինի ենթադրել, որ անաչառ գնահատականը միշտ տալիս է գնահատված պարամետրի լավ մոտարկում: Իրոք, հնարավոր արժեքները կարող են խիստ ցրված լինել իրենց միջինի շուրջ, այսինքն՝ շեղումը կարող է նշանակալի լինել: Այս դեպքում, օրինակ, մեկ նմուշի տվյալներից հայտնաբերված գնահատականը կարող է պարզվել, որ շատ հեռու է միջին արժեքից և, հետևաբար, հենց գնահատված պարամետրից: Այսպիսով, ընդունելով որպես մոտավոր արժեք՝ մենք մեծ սխալ կգործենք։ Եթե, այնուամենայնիվ, պահանջվում է, որ շեղումը փոքր լինի, ապա մեծ սխալ թույլ տալու հնարավորությունը կբացառվի։ Այդ իսկ պատճառով վիճակագրական գնահատման վրա դրվում է արդյունավետության պահանջ։

արդյունավետկոչվում է վիճակագրական գնահատում, որը (տվյալ նմուշի չափի համար) ունի ամենափոքր հնարավոր շեղումը:

Հարուստկոչվում է վիճակագրական գնահատում, որը, ամենայն հավանականությամբ, ձգտում է գնահատված պարամետրին, այսինքն՝ հավասարությունը ճշմարիտ է.

.

Օրինակ, եթե անկողմնակալ գնահատողի շեղումը ժամը ձգտում է զրոյի, ապա այդպիսի գնահատիչը նույնպես հետևողական է:

Մտածեք այն հարցը, թե որ նմուշի բնութագրիչները լավագույնս են գնահատում ընդհանուր միջինը և շեղումը անաչառության, արդյունավետության և հետևողականության տեսանկյունից:

Թող դիսկրետ ընդհանուր պոպուլյացիան ուսումնասիրվի որոշ քանակական հատկանիշի նկատմամբ:

Ընդհանուր միջնակարգկոչվում է ընդհանուր բնակչության հատկանիշի արժեքների թվաբանական միջին: Այն հաշվարկվում է բանաձևով.

§ - եթե ընդհանուր ծավալի բնակչության նշանի բոլոր արժեքները տարբեր են.

§ - եթե ընդհանուր բնակչության նշանի արժեքները համապատասխանաբար ունեն հաճախականություններ և . Այսինքն, ընդհանուր միջինը հատկանիշի արժեքների կշռված միջինն է՝ համապատասխան հաճախականություններին հավասար կշիռներով:

ՄեկնաբանությունԹող ծավալի պոպուլյացիան պարունակի ատրիբուտի տարբեր արժեքներով օբյեկտներ: Պատկերացրեք, որ մեկ օբյեկտ պատահականորեն ընտրված է այս հավաքածուից: Հավանականությունը, որ, օրինակ, հատկանիշի արժեք ունեցող օբյեկտը կվերցվի, ակնհայտորեն հավասար է . Ցանկացած այլ օբյեկտ կարող է արդյունահանվել նույն հավանականությամբ։ Այսպիսով, հատկանիշի արժեքը կարելի է դիտարկել որպես պատահական փոփոխական, որի հնարավոր արժեքներն ունեն նույն հավանականությունները, որոնք հավասար են . Այս դեպքում դժվար չէ գտնել մաթեմատիկական ակնկալիքը.

Այսպիսով, եթե ընդհանուր բնակչության հետազոտված նշանը դիտարկենք որպես պատահական փոփոխական, ապա նշանի մաթեմատիկական ակնկալիքը հավասար է այս նշանի ընդհանուր միջինին. Մենք ստացանք այս եզրակացությունը՝ ենթադրելով, որ ընդհանուր բնակչության բոլոր օբյեկտներն ունեն հատկանիշի տարբեր արժեքներ: Նույն արդյունքը կստացվի, եթե ենթադրենք, որ ընդհանուր պոպուլյացիան պարունակում է նույն հատկանիշի արժեք ունեցող մի քանի օբյեկտ։

Ընդհանրացնելով ընդհանուր բնակչության համար ստացված արդյունքը հատկանիշի շարունակական բաշխմամբ, մենք ընդհանուր միջինը սահմանում ենք որպես հատկանիշի մաթեմատիկական ակնկալիք. .

Թող արդյունահանվի ծավալի նմուշ՝ ընդհանուր պոպուլյացիան քանակական հատկանիշով ուսումնասիրելու համար:

Նմուշի միջինըկոչվում է ընտրանքային բնակչության հատկանիշի արժեքների միջին թվաբանական: Այն հաշվարկվում է բանաձևով.

§ - եթե ընտրանքի ծավալի բնակչության նշանի բոլոր արժեքները տարբեր են.

§ - եթե նմուշառման հավաքածուի հատկանիշի արժեքներն ունեն համապատասխանաբար հաճախականություններ և . Այսինքն, ընտրանքային միջինը հատկանիշի արժեքների միջին կշռված է համապատասխան հաճախականություններին հավասար կշիռներով:

ՄեկնաբանությունՄեկ նմուշի տվյալներից հայտնաբերված ընտրանքային միջինն ակնհայտորեն որոշակի թիվ է: Եթե ​​նույն չափի այլ նմուշներ հանենք նույն ընդհանուր պոպուլյացիայից, ապա ընտրանքի միջինը կփոխվի նմուշից նմուշ: Այսպիսով, ընտրանքի միջինը կարող է դիտվել որպես պատահական փոփոխական, և, հետևաբար, մենք կարող ենք խոսել ընտրանքի միջին բաշխումների (տեսական և էմպիրիկ) և այս բաշխման թվային բնութագրերի, մասնավորապես, ընտրանքի բաշխման միջինի և շեղումների մասին։ .

Ավելին, եթե ընդհանուր միջինը անհայտ է և պահանջվում է այն գնահատել ընտրանքի տվյալների հիման վրա, ապա ընտրանքի միջինը վերցվում է որպես ընդհանուր միջինի գնահատում, որն անաչառ և հետևողական գնահատական ​​է (մենք առաջարկում ենք ապացուցել այս հայտարարությունը մեր սեփական): Վերոնշյալից հետևում է, որ եթե միևնույն ընդհանուր պոպուլյացիայից բավականաչափ մեծ ծավալի մի քանի նմուշներ օգտագործվեն նմուշի միջոցներ գտնելու համար, ապա դրանք մոտավորապես հավասար կլինեն միմյանց: Սա սեփականությունն է նմուշի միջոցների կայունությունը.

Նկատի ունեցեք, որ եթե երկու պոպուլյացիաների շեղումները նույնն են, ապա ընտրանքային միջոցների հարևանությունը ընդհանուրներին կախված չէ ընտրանքի չափի և ընդհանուր բնակչության չափի հարաբերակցությունից: Դա կախված է ընտրանքի չափից. որքան մեծ է ընտրանքի չափը, այնքան փոքր է ընտրանքի միջինը տարբերվում ընդհանուրից: Օրինակ, եթե օբյեկտների 1%-ն ընտրված է մեկ հավաքածուից, իսկ առարկաների 4%-ը ընտրված է մեկ այլ հավաքածուից, և առաջին նմուշի ծավալը պարզվում է, որ ավելի մեծ է, քան երկրորդը, ապա առաջին նմուշի միջինը ավելի քիչ կտարբերվի. համապատասխան ընդհանուր միջինը, քան երկրորդը:

) մաթեմատիկական վիճակագրության խնդիրներ.

Ենթադրենք, որ գոյություն ունի հավանականության բաշխումների պարամետրային ընտանիք (պարզության համար կդիտարկենք պատահական փոփոխականների բաշխումը և մեկ պարամետրի դեպքը)։ Ահա թվային պարամետր, որի արժեքը անհայտ է: Պահանջվում է գնահատել այն այս բաշխման արդյունքում առաջացած արժեքների առկա նմուշով:

Գնահատման երկու հիմնական տեսակ կա. կետային գնահատականներԵվ վստահության միջակայքերը.

Կետերի գնահատում

Կետային գնահատումը վիճակագրական գնահատման տեսակ է, որտեղ անհայտ պարամետրի արժեքը մոտավոր է մեկ թվով: Այսինքն, դուք պետք է նշեք նմուշի գործառույթը (վիճակագրություն)

,

որի արժեքը կդիտարկվի որպես անհայտ իրական արժեքի մոտարկում:

Պարամետրերի կետային գնահատումների կառուցման ընդհանուր մեթոդները ներառում են առավելագույն հավանականության մեթոդը, պահերի մեթոդը, քվանտիլ մեթոդը:

Ստորև բերված են որոշ հատկություններ, որոնք կարող են ունենալ կամ չունենալ կետային գնահատումները:

վճարունակությունը

Կետային գնահատման առավել ակնհայտ պահանջներից մեկն այն է, որ կարելի է ակնկալել բավականին լավ մոտարկում պարամետրի իրական արժեքին, որը բավականաչափ տրված է: մեծ արժեքներնմուշի չափը. Սա նշանակում է, որ գնահատականը պետք է համընկնի իրական արժեքին: Այս գնահատման հատկությունը կոչվում է վճարունակությունը. Քանի որ մենք խոսում ենք պատահական փոփոխականների մասին, որոնց համար կան տարբեր տեսակներկոնվերգենցիա, ապա այս հատկությունը կարող է ճշգրիտ ձևակերպվել տարբեր ձևերով.

Պարզապես տերմինն օգտագործելիս վճարունակությունը, ապա մենք սովորաբար նկատի ունենք թույլ հետևողականությունը, այսինքն. հավանականության կոնվերգենցիա.

Հետևողականության պայմանը գործնականում պարտադիր է գործնականում օգտագործվող բոլոր գնահատումների համար: Անհամապատասխան գնահատականները հազվադեպ են օգտագործվում:

Անաչառություն և ասիմպտոտիկ անաչառություն

Պարամետրերի գնահատումը կոչվում է անաչառ, եթե դրա մաթեմատիկական ակնկալիքը հավասար է գնահատված պարամետրի իրական արժեքին.

.

Ավելի թույլ վիճակն է ասիմպտոտիկ անաչառություն, ինչը նշանակում է, որ գնահատման մաթեմատիկական ակնկալիքը համընկնում է պարամետրի իրական արժեքին ընտրանքի չափի մեծացմամբ.

.

Անաչառությունը գնահատողների առաջարկվող հատկությունն է: Այնուամենայնիվ, դրա կարևորությունը չպետք է գերագնահատել: Ամենից հաճախ գոյություն ունեն պարամետրերի անաչառ գնահատականներ, և այնուհետև փորձում են հաշվի առնել միայն դրանք: Այնուամենայնիվ, կարող են լինել որոշ վիճակագրական խնդիրներ, որոնց դեպքում չկան անաչառ գնահատականներ: Ամենահայտնի օրինակը հետևյալն է. դիտարկել Պուասոնի բաշխումը պարամետրով և սահմանել պարամետրը գնահատելու խնդիրը: Կարելի է ապացուցել, որ այս խնդրի անաչառ գնահատող չկա։

Գնահատականների համեմատություն և արդյունավետություն

Միևնույն պարամետրի տարբեր գնահատականները միմյանց հետ համեմատելու համար օգտագործվում է հետևյալ մեթոդը՝ ընտրել մի քանիսը ռիսկի գործառույթ, որը չափում է գնահատման շեղումը պարամետրի իրական արժեքից, և լավագույնը համարվում է այն, որի համար այս ֆունկցիան ավելի փոքր արժեք է ընդունում։

Ամենից հաճախ գնահատման քառակուսի շեղման մաթեմատիկական ակնկալիքը իրական արժեքից դիտարկվում է որպես ռիսկի ֆունկցիա.

Անկողմնակալ գնահատողների համար սա ուղղակի տարբերությունն է:

Այս ռիսկի ֆունկցիայի ստորին սահման կա, որը կոչվում է Կրամեր-Ռաո անհավասարություն.

(անկողմնակալ) գնահատողները, որոնց համար այս ստորին սահմանը բավարարված է (այսինքն՝ ունենալով ամենափոքր հնարավոր շեղումը), կոչվում են. արդյունավետ. Այնուամենայնիվ, արդյունավետ գնահատման առկայությունը խնդրի համար բավականին ուժեղ պահանջ է, ինչը ոչ միշտ է այդպես:

Ավելի թույլ վիճակն է ասիմպտոտիկ արդյունավետություն , ինչը նշանակում է, որ անկողմնակալ գնահատականի շեղումների հարաբերակցությունը Cramer-Rao-ի ստորին սահմանին ձգտում է միասնության:

Նկատի ունեցեք, որ ուսումնասիրվող բաշխման վերաբերյալ բավական լայն ենթադրությունների դեպքում առավելագույն հավանականության մեթոդը տալիս է պարամետրի ասիմպտոտիկ արդյունավետ գնահատում, իսկ եթե կա արդյունավետ գնահատում, ապա այն տալիս է արդյունավետ գնահատում:

Բավարար վիճակագրություն

Վիճակագրությունը կոչվում է բավարարպարամետրի համար, եթե նմուշի պայմանական բաշխումը, պայմանով, որ կախված չէ պարամետրից բոլորի համար:

Բավարար վիճակագրության հայեցակարգի կարևորությունը պայմանավորված է հետևյալով հաստատում. Եթե ​​բավարար վիճակագրություն է և պարամետրի անաչառ գնահատական ​​է, ապա պայմանական ակնկալիքը նաև պարամետրի անաչառ գնահատական ​​է, և դրա շեղումը փոքր է կամ հավասար է սկզբնական գնահատման շեղմանը:

Հիշեք, որ պայմանական ակնկալիքը պատահական փոփոխական է, որը ֆունկցիա է . Այսպիսով, անաչառ գնահատողների դասում բավական է դիտարկել միայն նրանք, որոնք բավարար վիճակագրության գործառույթներ են (պայմանով, որ տվյալ խնդրի համար կա այդպիսի վիճակագրություն):

(անկողմնակալ) արդյունավետ պարամետրի գնահատումը միշտ բավարար վիճակագրություն է:

Կարելի է ասել, որ բավարար վիճակագրությունը պարունակում է ողջ տեղեկատվությունը գնահատված պարամետրի մասին, որը պարունակվում է նմուշում:

Բեռնվում է...