Բաշխման պարամետրերի վիճակագրական գնահատականներ: Բաշխման պարամետրերի կետային գնահատում Վիճակագրական գնահատում և դրա հատկությունները
Պատահական փոփոխականի բաշխումը (ընդհանուր բնակչության բաշխումը) սովորաբար բնութագրվում է մի շարք թվային բնութագրերով.
- նորմալ բաշխման համար N(a, σ) մաթեմատիկական սպասումն է a և ստանդարտ շեղումը σ ;
- միատեսակ բաշխման համար R(a,b) այն միջակայքի սահմաններն են, որոնցում դիտվում են այս պատահական փոփոխականի արժեքները:
Երբ գնահատականը սահմանվում է մեկ թվով, այն կոչվում է միավորի գնահատում. Կետերի գնահատում, որպես նմուշի ֆունկցիա, պատահական փոփոխական է և տատանվում է նմուշից նմուշ կրկնվող փորձերի ժամանակ։
Կետային գնահատումները ենթակա են պահանջների, որոնք նրանք պետք է բավարարեն ցանկացած իմաստով «լավ» լինելու համար: Սա անաչառություն, արդյունավետությունըԵվ վճարունակությունը.
Ինտերվալների գնահատումներորոշվում են երկու թվերով՝ գնահատված պարամետրը ընդգրկող միջակայքի ծայրերը: Ի տարբերություն կետերի գնահատումների, որոնք պատկերացում չեն տալիս, թե որքան հեռու կարող է լինել գնահատված պարամետրը դրանցից, միջակայքային գնահատումները թույլ են տալիս հաստատել գնահատումների ճշգրտությունն ու հուսալիությունը:
Որպես մաթեմատիկական ակնկալիքի, շեղման և ստանդարտ շեղման կետային գնահատումներ, օգտագործվում են ընտրանքի բնութագրերը, համապատասխանաբար, ընտրանքի միջինը, ընտրանքի շեղումը և նմուշի ստանդարտ շեղումը:
Անաչառ գույքի գնահատում.
Գնահատման ցանկալի պահանջը համակարգային սխալի բացակայությունն է, այսինքն. կրկնակի օգտագործմամբ, դրա գնահատման θ պարամետրի փոխարեն, մոտավոր սխալի միջին արժեքը զրո է. անաչառ գույքի գնահատում.
Սահմանում. Գնահատումը կոչվում է անաչառ, եթե դրա մաթեմատիկական ակնկալիքը հավասար է գնահատված պարամետրի իրական արժեքին.
Ընտրանքային թվաբանական միջինը մաթեմատիկական ակնկալիքի անաչառ գնահատումն է և ընտրանքի շեղումը - ընդհանուր շեղումների կանխակալ գնահատում Դ. Ընդհանուր շեղման անաչառ գնահատականը գնահատումն է
Գնահատման հետևողականության հատկություն.
Գնահատման երկրորդ պահանջը՝ դրա հետևողականությունը, նշանակում է գնահատման բարելավում ընտրանքի չափի մեծացմամբ:
Սահմանում. Դասարան կոչվում է հետևողական, եթե այն հակված է n→∞ գնահատված θ պարամետրին:
Հավանականության կոնվերգենցիան նշանակում է, որ ընտրանքի մեծ չափի դեպքում գնահատման մեծ շեղումների հավանականությունը իրական արժեքից փոքր է:
Արդյունավետ գնահատման հատկություն.
Երրորդ պահանջը թույլ է տալիս ընտրել լավագույն գնահատականը նույն պարամետրի մի քանի գնահատականներից:
Սահմանում. Անկողմնակալ գնահատիչը արդյունավետ է, եթե այն ունի ամենափոքր շեղումը բոլոր անաչառ գնահատողների միջև:
Սա նշանակում է, որ արդյունավետ գնահատումը նվազագույն ցրվածություն ունի պարամետրի իրական արժեքի վերաբերյալ: Նկատի ունեցեք, որ արդյունավետ գնահատիչ միշտ չէ, որ գոյություն ունի, բայց սովորաբար կարելի է ընտրել ավելի արդյունավետ գնահատող երկու գնահատողներից, այսինքն. ավելի քիչ ցրվածությամբ: Օրինակ, սովորական ընդհանուր բնակչության N(a,σ) անհայտ պարամետրի համար և՛ թվաբանական միջինը, և՛ ընտրանքի միջինը կարող են ընդունվել որպես անաչառ գնահատական: Սակայն ընտրանքի միջինի շեղումը մոտավորապես 1,6 անգամ ավելի մեծ է, քան միջին թվաբանականի շեղումը: Հետևաբար, ավելի արդյունավետ գնահատում է միջին թվաբանական միջինը:
Օրինակ #1. Գտեք մեկ սարքի կողմից որոշ պատահական փոփոխականի չափումների անաչառ գնահատական (առանց համակարգային սխալների), որի չափման արդյունքները (մմ-ով)՝ 13,15,17:
Լուծում. Ցուցանիշների հաշվարկման աղյուսակ.
x | |x - x cf | | (x - x sr) 2 |
13 | 2 | 4 |
15 | 0 | 0 |
17 | 2 | 4 |
45 | 4 | 8 |
պարզ թվաբանական միջին(անաչառ ակնկալիքների գնահատում)
Ցրվածություն- բնութագրում է տարածման չափը իր միջին արժեքի շուրջ (ցրվածության չափում, այսինքն՝ միջինից շեղում - կողմնակալ գնահատում):
![](https://i0.wp.com/math.semestr.ru/group/images/variations/sestimate3.png)
Տարբերության անաչառ գնահատող- շեղումների հետևողական գնահատում (ուղղված շեղում):
![](https://i1.wp.com/math.semestr.ru/group/images/variations/sestimate5.png)
Օրինակ #2. Գտեք մեկ սարքի միջոցով որոշ պատահական փոփոխականի չափումների մաթեմատիկական ակնկալիքի անաչառ գնահատականը (առանց համակարգային սխալների), որի չափման արդյունքները (մմ-ով)՝ 4,5,8,9,11:
Լուծում. մ = (4+5+8+9+11)/5 = 7.4
Օրինակ #3. Գտե՛ք S 2 ուղղված շեղումը n=10 ընտրանքի չափի համար, եթե ընտրանքի շեղումը D = 180 է:
Լուծում. S 2 \u003d n * D / (n-1) \u003d 10 * 180 / (10-1) \u003d 200
վիճակագրական գնահատման բաշխման նմուշ
Գնահատումը ցանկալի արժեքի արժեքների մոտարկումն է, որը ստացվել է ընտրովի դիտարկման արդյունքների հիման վրա: Գնահատումները պատահական փոփոխականներ են: Դրանք ապահովում են ընդհանուր բնակչության անհայտ պարամետրերի վերաբերյալ ողջամիտ դատողություն կազմելու հնարավորություն։ Ընդհանուր միջինը գնահատելու օրինակ է ընդհանուր շեղման միջին ընտրանքը՝ նմուշի շեղում և այլն։
Գնահատելու համար, թե գնահատումը որքանով է «լավ» համապատասխանում համապատասխան ընդհանուր բնութագրին, մշակվել են 4 չափորոշիչներ՝ հետևողականություն, անաչառություն, արդյունավետություն և բավարարություն: Այս մոտեցումը հիմնված է այն փաստի վրա, որ գնահատման որակը որոշվում է ոչ թե դրա առանձին արժեքներով, այլ դրա բաշխման բնութագրերով՝ որպես պատահական փոփոխական:
Հավանականությունների տեսության դրույթների հիման վրա կարելի է ապացուցել, որ այնպիսի նմուշային բնութագրերից, ինչպիսիք են թվաբանական միջինը, եղանակը և միջինը, միայն թվաբանական միջինն է ընդհանուր միջինի հետևողական, անաչառ, արդյունավետ և բավարար գնահատական: Սա որոշում է մի շարք այլ նմուշների բնութագրերում թվաբանական միջինին տրված նախապատվությունը:
անաչառգնահատումը դրսևորվում է նրանով, որ ցանկացած ընտրանքի չափի համար դրա մաթեմատիկական ակնկալիքը հավասար է ընդհանուր բնակչության գնահատված պարամետրի արժեքին: Եթե այս պահանջը չի բավարարվում, ապա գնահատականը տեղահանված.
Անաչառ գնահատման պայմանը նպատակաուղղված է համակարգված գնահատման սխալների վերացմանը:
Գնահատման խնդիրներ լուծելիս օգտագործում են նաև ասիմպտոտիկ անաչառ գնահատականներ, որի համար ընտրանքի չափի աճով մաթեմատիկական ակնկալիքը հակված է ընդհանուր բնակչության գնահատված պարամետրին։
վճարունակությունըվիճակագրական գնահատականները դրսևորվում են նրանով, որ ընտրանքի չափի մեծացմամբ գնահատականը ավելի ու ավելի է մոտենում գնահատված պարամետրի իրական արժեքին, կամ, ինչպես ասում են, գնահատականը, ամենայն հավանականությամբ, համընկնում է ցանկալի պարամետրին, կամ ձգտում է դրան. մաթեմատիկական ակնկալիք. Գործնական նշանակություն ունեն միայն հետևողական գնահատականները:
Սա անաչառ պարամետրի գնահատումն է, որն ունի ամենափոքր շեղումը տվյալ ընտրանքի չափի համար: Գործնականում գնահատման շեղումը սովորաբար նույնացվում է գնահատման սխալի հետ:
Ինչպես գնահատման արդյունավետության միջոցառումներվերցրեք նվազագույն հնարավոր շեղումների հարաբերակցությունը մեկ այլ գնահատականի շեղմանը:
Գնահատումը, որն ապահովում է ընտրանքում պարունակվող ամբողջ տեղեկատվության օգտագործման ամբողջականությունը ընդհանուր բնակչության անհայտ բնութագրիչի վերաբերյալ, կոչվում է. բավարար(սպառիչ):
Համապատասխանությունը վերը քննարկված վիճակագրական գնահատումների հատկություններին հնարավորություն է տալիս դիտարկել ընտրանքի բնութագրերը ընդհանուր բնակչության պարամետրերը գնահատելու համար որպես հնարավոր լավագույնը:
Մաթեմատիկական վիճակագրության ամենակարևոր խնդիրն ընտրանքային տվյալներից ընդհանուր բնակչության ցանկալի պարամետրերի առավել ռացիոնալ, «ճշմարիտ» վիճակագրական գնահատականներ ստանալն է։ Գոյություն ունեն վիճակագրական եզրակացության երկու տեսակ՝ վիճակագրական գնահատում; վիճակագրական վարկածների փորձարկում.
Վիճակագրական գնահատականներ ստանալու հիմնական խնդիրն է ընտրել և հիմնավորել լավագույն գնահատականները, որոնք ապահովում են ընդհանուր բնակչության անհայտ պարամետրերի իմաստալից գնահատման հնարավորությունը:
Անհայտ պարամետրերի գնահատման խնդիրը կարող է լուծվել երկու եղանակով.
- 1. Անհայտ պարամետրը բնութագրվում է մեկ թվով (կետ) - օգտագործվում է կետերի գնահատման մեթոդը;
- 2. ինտերվալի գնահատում, այսինքն՝ որոշվում է միջակայք, որում որոշ հավանականությամբ կարելի է գտնել ցանկալի պարամետրը։
Կետերի գնահատումանհայտ պարամետրը կայանում է նրանում, որ ընտրանքի գնահատման հատուկ թվային արժեքը վերցվում է որպես ընդհանուր բնակչության իրական պարամետրի լավագույն մոտարկում, այսինքն՝ ընդհանուր բնակչության անհայտ պարամետրը գնահատվում է մեկ թվով (կետով) որոշվում է նմուշից: Այս մոտեցմամբ միշտ կա սխալվելու վտանգ, ուստի միավորի գնահատումը պետք է լրացվի հավանականության որոշակի մակարդակի հնարավոր սխալի ցուցիչով:
Դրա ստանդարտ շեղումը ընդունվում է որպես միջին գնահատման սխալ:
Այնուհետև ընդհանուր միջինի միավորի գնահատումը կարող է ներկայացվել որպես ինտերվալ
որտեղ է օրինակելի թվաբանական միջինը:
Կետային գնահատման ժամանակ օգտագործվում են մի քանի մեթոդներ՝ ընտրանքային տվյալներից գնահատումներ ստանալու համար.
- 1. մոմենտների մեթոդը, որում ընդհանուր բնակչության մոմենտը փոխարինվում է նմուշի մոմենտներով.
- 2. նվազագույն քառակուսիների մեթոդ;
- 3. առավելագույն հավանականության մեթոդ.
Շատ խնդիրների դեպքում պահանջվում է գտնել ոչ միայն ընդհանուր բնակչության պարամետրի թվային գնահատում, այլև գնահատել դրա ճշգրտությունն ու հուսալիությունը: Սա հատկապես կարևոր է համեմատաբար փոքր նմուշների համար: Վիճակագրական պարամետրի կետային գնահատման ընդհանրացումն այն է միջակայքի գնահատում- գտնել որոշակի հավանականությամբ գնահատված պարամետրը պարունակող թվային միջակայք:
Հաշվի առնելով այն հանգամանքը, որ նմուշի տվյալներից ընդհանուր բնութագրերը որոշելիս միշտ կա որոշակի սխալ, ավելի գործնական է որոշել հայտնաբերված կետի գնահատման մեջ կենտրոնացած միջակայքը, որի շրջանակներում գտնվում է ընդհանուր բնութագրի գնահատված պարամետրի իրական ցանկալի արժեքը. որոշակի տրված հավանականություն. Նման միջակայքը կոչվում է վստահության միջակայք:
Վստահության միջակայքթվային միջակայք է, որը տրված r հավանականությամբ ընդգրկում է ընդհանուր բնակչության գնահատված պարամետրը։ Այս հավանականությունը կոչվում է վստահություն: Վստահության հավանականություն r-ն այն հավանականությունն է, որը կարող է բավարար ճանաչվել լուծվող խնդրի շրջանակներում՝ ընտրանքային դիտարկումների հիման վրա ստացված բնութագրերի հավաստիությունը դատելու համար: արժեք
սխալվելու հավանականությունը կոչվում է նշանակության մակարդակը.
Ընդհանուր բնակչության AND պարամետրի ընտրովի (կետ) գնահատման ԵՎ * (թետա) ճշգրտությամբ ( սահմանային սխալ) D և վստահության հավանականությունը r վստահության միջակայքը որոշվում է հավասարությամբ.
Վստահության հավանականությունը r հնարավորություն է տալիս հաստատել վստահության սահմաններըՈւսումնասիրված պարամետրի պատահական տատանում Եվ տվյալ նմուշի համար:
Հետևյալ արժեքները և դրանց համապատասխան արժեքները հաճախ ընդունվում են որպես վստահության մակարդակ նշանակության մակարդակները
Աղյուսակ 1. Առավել հաճախ օգտագործվող վստահության մակարդակները և նշանակության մակարդակները
Օրինակ, 5 տոկոս նշանակության մակարդակը նշանակում է հետևյալը. 100-ից 5 դեպքում առկա է ընտրանքային տվյալների հիման վրա բնակչության բնութագրերի բացահայտման հարցում սխալ թույլ տալու վտանգ: Կամ, այլ կերպ ասած, 100-ից 95 դեպքում նմուշի հիման վրա բացահայտված ընդհանուր բնութագիրը կլինի վստահության միջակայքում:
Թող պահանջվի ուսումնասիրել, օրինակ, ընդհանուր բնակչության քանակական նշանը։ Ենթադրենք, որ տեսական նկատառումներից ելնելով հնարավոր է եղել պարզել, թե որ բաշխումն ունի առանձնահատկություն։ Բնականաբար, առաջանում է այս բաշխումը որոշող պարամետրերի գնահատման խնդիր։ Օրինակ, եթե նախապես հայտնի է, որ ուսումնասիրվող հատկանիշը սովորաբար բաշխված է ընդհանուր բնակչության մեջ, ապա անհրաժեշտ է գնահատել (մոտավորապես գտնել) մաթեմատիկական ակնկալիքը a և ստանդարտ շեղումը s, քանի որ այս երկու պարամետրերը լիովին որոշում են նորմալը: բաշխում.
Սովորաբար, հետազոտողն իր տրամադրության տակ ունի միայն նմուշային տվյալներ, օրինակ՝ քանակական հատկանիշի արժեքները x 1, x 2, ..., x n, որոնք ստացվել են n դիտարկման արդյունքում: Այս տվյալների միջոցով և արտահայտեք գնահատված պարամետրը.
Թող q * լինի տեսական բաշխման q անհայտ պարամետրի վիճակագրական գնահատականը: Տարբերել անաչառԵվ տեղահանվածգնահատականներ։
անաչառկոչվում է վիճակագրական գնահատում q*, որի մաթեմատիկական ակնկալիքը հավասար է գնահատված q պարամետրին ցանկացած ընտրանքի չափի համար, այսինքն.
Հակառակ դեպքում, այսինքն, եթե M(q *) ¹ q, հաշվարկը կոչվում է տեղահանված.
Անաչառության պահանջը նշանակում է, որ դիտարկվող արժեքների նույն ուղղությամբ q-ից համակարգված շեղում չպետք է լինի:
Կա նաև վիճակագրական գնահատման պահանջ։ արդյունավետությունը, որը ենթադրում է (տվյալ նմուշի չափի համար) ամենափոքր հնարավոր շեղումը, իսկ մեծ ընտրանքի դեպքում՝ պահանջը. վճարունակությունը, այսինքն՝ պատահական փոփոխականի դիտարկվող արժեքների գործնական համընկնումը՝ գնահատված պարամետրի հետ։
Եթե վիճակագրական նյութը ներկայացվում է տատանումների շարքի տեսքով, ապա դրա հետագա վերլուծությունն իրականացվում է, որպես կանոն, որոշ հաստատուն արժեքների օգնությամբ, որոնք լիովին արտացոլում են ուսումնասիրված ընդհանուր բնակչությանը բնորոշ օրինաչափությունները:
Այս հաստատունները ներառում են միջին արժեքներ, որոնց թվում ամենակարևորն է թվաբանական միջին- այն ավելի պարզ է, քան մյուսները և իմաստով, և հատկություններով, և ստացման եղանակով:
Քանի որ ընտրանքն իրականացվում է ընդհանուր բնակչության ուսումնասիրության ժամանակ, նմուշը բնութագրող հաստատունը կոչվում է նմուշի միջինև նշվում է.
Կարելի է ցույց տալ, որ կա անաչառ գնահատողընդհանուր բնակչության նշանի միջին թվաբանական արժեքը, այսինքն
Թող որոշ հավաքածու բաժանվի մասերի - խմբերը, պարտադիր չէ, որ նույն չափը լինի: Այնուհետև կոչվում են խմբի անդամների միջին թվաբանական բաշխումները խմբի միջին ցուցանիշներըև բաշխման միջին թվաբանականը ամբողջ բնակչության վրա նույն հիմքի վրա. ընդհանուր միջին. Խմբերը կոչվում են տարանջատելեթե բնակչության յուրաքանչյուր անդամ պատկանում է միայն մեկ խմբի.
Ընդհանուր միջինը հավասար է բոլոր չհամընկնող խմբերի խմբերի միջին թվաբանականին:
Օրինակ.Հաշվարկել ձեռնարկության աշխատողների միջին աշխատավարձը ըստ աղյուսակի
Լուծում.Ըստ սահմանման, ընդհանուր միջինը
. (*)
n 1 \u003d 40, n 2 \u003d 50, n 3 \u003d 60
Թիվ 1 խանութի աշխատողների միջին աշխատավարձը: Այն գտնելու համար մենք կազմել ենք ամբողջ խանութի միջին թվաբանական աշխատավարձը՝ 75, 85, 95 և 105 (մոտ): Հարմարության համար այս արժեքները կարող են լինել. կրճատվել է հինգ անգամ (սա նրանց ամենամեծն է ընդհանուր բաժանարար): 15, 17, 19, 21: Մնացածը պարզ է բանաձևից:
Նմանատիպ գործողություններ կատարելով՝ մենք գտնում ենք.
Ստացված արժեքները փոխարինելով (*) մեջ՝ ստանում ենք
Միջինները հաստատուն արժեքներ են, որոնք որոշակի ձևով բնութագրում են բաշխումները:Որոշ բաշխումներ գնահատվում են միայն միջոցներով: Օրինակ՝ մակարդակները համեմատելու համար աշխատավարձերըԱրդյունաբերության տարբեր ճյուղերում բավական է համեմատել դրանց միջին աշխատավարձը։ Այնուամենայնիվ, միջին ցուցանիշները չեն կարող օգտագործվել՝ դատելու ոչ ամենաբարձր և ամենացածր վարձատրվող աշխատողների աշխատավարձերի մակարդակների տարբերությունները, ոչ էլ միջին աշխատավարձից ինչ շեղումներ են տեղի ունենում:
Վիճակագրության մեջ ամենամեծ հետաքրքրությունը հատկանիշի արժեքների տարածումն է դրանց միջին թվաբանականի շուրջ:Գործնականում և տեսական ուսումնասիրություններում հատկանիշի դիսպերսիան ավելի հաճախ բնութագրվում է դիսպերսիայով և ստանդարտ շեղումով։
Նմուշի շեղում D B-ն կոչվում է հատկանիշի դիտարկված արժեքների միջին արժեքից շեղման քառակուսիների թվաբանական միջին:
Եթե n նմուշի չափի հատկանիշի բոլոր արժեքները х 1, х 2, … х n տարբեր են, ապա
. (3)
Եթե x 1, x 2, ... x k հատկանիշի արժեքները համապատասխանաբար ունեն n 1, n 2, ... n k հաճախականություններ, և n 1 + n 2 + ... + n k \u003d n, ապա
. (4)
Եթե կարիք կա, որ ցրման ինդեքսն արտահայտվի նույն միավորներով, ինչ բնորոշ արժեքները, ապա կարող եք օգտագործել ամփոփ բնութագիրը. ստանդարտ շեղում
Տարբերությունը հաշվարկելու համար սովորաբար օգտագործվում է բանաձևը
Եթե բնակչությունը բաժանված է ոչ համընկնող խմբերի, ապա դրանք բնութագրելու համար կարող ենք ներկայացնել խումբ, ներխմբային, միջխմբային և ընդհանուր դիսպերսիա հասկացությունները։
Խումբշեղումը j-րդ խմբի անդամների բաշխման շեղումն է նրանց միջին - խմբի միջինի նկատմամբ, այսինքն.
որտեղ n i-ը x i արժեքի հաճախականությունն է, j խմբի ծավալն է:
Ներխմբայինշեղումը խմբային շեղումների թվաբանական միջինն է
որտեղ N j (j = 1, 2, …, m) տարանջատված խմբերի ծավալներն են:
Միջխմբայինշեղումը բոլոր չհամընկնող խմբերի խմբային միջինների քառակուսի շեղումների միջին թվաբանական միջինն է ընդհանուր միջինից, այսինքն.
.
Գեներալշեղումը ամբողջ բնակչության հատկանիշի արժեքների շեղումն է ընդհանուր միջինի նկատմամբ
,
որտեղ n i - հաճախականության արժեքը x i; - ընդհանուր միջին; n-ը ամբողջ բնակչության ծավալն է:
Կարելի է ցույց տալ, որ D ընդհանուր շեղումը հավասար է գումարին, այսինքն.
Օրինակ.Գտե՛ք հետևյալ երկու խմբերից կազմված բնակչության ընդհանուր շեղումը
Առաջին խումբ | Երկրորդ խումբ | |||
x i | n i | x i | n i | |
Լուծում.Գտնենք խմբի միջինները
Գտնենք խմբի շեղումները
Գտնենք ընդհանուր միջինը
Պահանջվող ընդհանուր շեղում
Վերը դիտարկված գնահատականները սովորաբար կոչվում են մատնանշել, քանի որ այս գնահատականները որոշված են մեկ թիվ. Երբ փոքր ծավալնմուշ, օգտագործվում է միջակայքի գնահատում, որը որոշվում է երկու թիվ, որը կոչվում է միջակայքի ծայրեր։
Ինտերվալային գնահատումները հնարավորություն են տալիս հաստատել ճշգրտություն և հուսալիությունվարկանիշները. Եկեք բացատրենք այս հասկացությունների իմաստը: Թող ընտրանքային տվյալներից հայտնաբերված q * վիճակագրական բնութագիրը ծառայի որպես անհայտ q պարամետրի գնահատում: Հասկանալի է, որ q * որքան ճշգրիտ կորոշի q պարամետրը, այնքան փոքր է բացարձակ արժեքը: Այլ կերպ ասած, եթե d > 0 և , ապա որքան փոքր է d-ն, այնքան ավելի ճշգրիտ կլինի գնահատումը:
Այսպիսով, d > 0 թիվը բնութագրում է ճշգրտությունգնահատականներ։ Բայց մյուս կողմից, վիճակագրական մեթոդները թույլ չեն տալիս մեզ կտրականապես պնդել, որ q* գնահատումը բավարարում է անհավասարությունը: Այստեղ մենք կարող ենք միայն խոսել հավանականություններ է, որով իրականացվում է այս անհավասարությունը։ Այս հավանականությունը g կոչվում է հուսալիություն (վստահության հավանականություն) q գնահատելով q * .
Այսպիսով, ասվածից հետևում է, որ
(*) կապը պետք է հասկանալ հետևյալ կերպ. հավանականությունը, որ միջակայքը (q * - d, q * + d) պարունակում է (ընդգրկում է) q անհայտ պարամետրը հավասար է g-ի։ Անհայտ պարամետրը տրված g հուսալիությամբ ծածկող միջակայքը (q * - d, q * + d) կոչվում է վստահության միջակայք։
Օրինակ.Պատահական X փոփոխականն ունի նորմալ բաշխում՝ հայտնի ստանդարտ շեղումով s = 3: Գտեք անհայտ մաթեմատիկական ակնկալիքը a գնահատելու վստահության միջակայքերը ընտրանքի միջինից, եթե ընտրանքի չափը n = 36 է, իսկ գնահատման հուսալիությունը տրված է g = 0,95.
Լուծում.Նշենք, որ եթե պատահական արժեք X-ը սովորաբար բաշխվում է, այնուհետև անկախ դիտարկումներից հայտնաբերված միջին նմուշը նույնպես սովորաբար բաշխվում է, և բաշխման պարամետրերն են՝ , (տես էջ 54):
Մենք պահանջում ենք, որ հարաբերությունները
.
Օգտագործելով բանաձևը (**) (տե՛ս էջ 43), X-ը փոխարինելով և s-ով , մենք ստանում ենք.
Ընդհանուր բնակչության պարամետրերի վիճակագրական գնահատականներ. Վիճակագրական վարկածներ
ԴԱՍԱԽՈՍՈՒԹՅՈՒՆ 16
Թող պահանջվի ուսումնասիրել ընդհանուր բնակչության քանակական նշանը։ Ենթադրենք, որ տեսական նկատառումներից ելնելով հնարավոր է եղել պարզել, թե որ բաշխումն ունի առանձնահատկություն։ Սա առաջացնում է այս բաշխումը որոշող պարամետրերի գնահատման խնդիր։ Օրինակ, եթե հայտնի է, որ ուսումնասիրվող հատկանիշը բաշխված է ընդհանուր բնակչության մեջ սովորական օրենքի համաձայն, ապա անհրաժեշտ է գնահատել (մոտավորապես գտնել) մաթեմատիկական ակնկալիքը և ստանդարտ շեղումը, քանի որ այս երկու պարամետրերը լիովին որոշում են նորմալ բաշխումը: . Եթե հիմքեր կան ենթադրելու, որ հատկանիշն ունի Poisson բաշխում, ապա անհրաժեշտ է գնահատել պարամետրը, որը որոշում է այս բաշխումը:
Սովորաբար, բաշխման ժամանակ հետազոտողն ունի միայն ընտրանքային տվյալներ, օրինակ՝ դիտումների արդյունքում ստացված քանակական հատկանիշի արժեքները (այսուհետ՝ դիտարկումները ենթադրվում են անկախ): Այս տվյալների միջոցով և արտահայտեք գնահատված պարամետրը:
Հաշվի առնելով որպես անկախ պատահական փոփոխականների արժեքներ , կարելի է ասել, որ գտնել տեսական բաշխման անհայտ պարամետրի վիճակագրական գնահատականը նշանակում է գտնել դիտարկված պատահական փոփոխականների ֆունկցիա, որը տալիս է գնահատված պարամետրի մոտավոր արժեքը։ Օրինակ, ինչպես ցույց կտա ստորև, նորմալ բաշխման մաթեմատիկական ակնկալիքը գնահատելու համար օգտագործվում է ֆունկցիան (հատկանիշի դիտարկված արժեքների միջին թվաբանականը).
.
Այսպիսով, վիճակագրական գնահատումՏեսական բաշխման անհայտ պարամետրը կոչվում է դիտարկված պատահական փոփոխականների ֆունկցիա: Ընդհանուր բնակչության անհայտ պարամետրի վիճակագրական գնահատականը, որը գրված է որպես մեկ թիվ, կոչվում է կետ. Հաշվի առեք հետևյալ կետերի գնահատումները՝ կողմնակալ և անկողմնակալ, արդյունավետ և հետևողական:
Որպեսզի վիճակագրական գնահատումները գնահատված պարամետրերի «լավ» մոտարկումներ տան, դրանք պետք է բավարարեն որոշակի պահանջներ: Եկեք հստակեցնենք այս պահանջները.
Թող լինի տեսական բաշխման անհայտ պարամետրի վիճակագրական գնահատում։ Ենթադրենք, որ ծավալը նմուշառելիս հայտնաբերվում է գնահատական: Կրկնենք փորձը, այսինքն՝ ընդհանուր պոպուլյացիայից կհանենք նույն չափի մեկ այլ նմուշ և, օգտագործելով դրա տվյալները, կգտնենք նախահաշիվ և այլն։ Փորձը բազմիցս կրկնելով՝ ստանում ենք թվերը , որոնք, ընդհանուր առմամբ, կտարբերվեն միմյանցից։ Այսպիսով, գնահատումը կարելի է դիտարկել որպես պատահական փոփոխական, իսկ թվերը
որպես հնարավոր արժեքներ:
Հասկանալի է, որ եթե գնահատումը տալիս է մոտավոր արժեք ավելցուկով, ապա նմուշների տվյալներից հայտնաբերված յուրաքանչյուր թիվ ավելի մեծ կլինի, քան .-ի իրական արժեքը: Հետևաբար, այս դեպքում պատահական փոփոխականի մաթեմատիկական (միջին արժեքը) ավելի մեծ կլինի, քան , այսինքն. Ակնհայտ է, որ եթե այն տալիս է մոտավոր արժեք թերության հետ, ապա .
Հետևաբար, վիճակագրական գնահատման օգտագործումը, որի մաթեմատիկական ակնկալիքը հավասար չէ գնահատված պարամետրին, հանգեցնում է համակարգված (մեկ նշանի) սխալների։ Այդ իսկ պատճառով բնական է պահանջել, որ գնահատման մաթեմատիկական ակնկալիքը հավասար լինի գնահատված պարամետրին: Չնայած այս պահանջին համապատասխանելը, ընդհանուր առմամբ, չի վերացնի սխալները (որոշ արժեքներ ավելի մեծ են, իսկ մյուսները՝ ավելի փոքր, քան ), տարբեր նշանների սխալները տեղի կունենան նույնքան հաճախ: Այնուամենայնիվ, պահանջին համապատասխանելը երաշխավորում է համակարգված սխալներ ստանալու անհնարինությունը, այսինքն՝ վերացնում է համակարգված սխալները։
անաչառկոչվում է վիճակագրական գնահատում (սխալ), որի մաթեմատիկական ակնկալիքը հավասար է ցանկացած ընտրանքի չափի գնահատված պարամետրին, այսինքն՝ .
Տեղահանվածկոչվում է վիճակագրական գնահատում, որի մաթեմատիկական ակնկալիքը հավասար չէ ցանկացած ընտրանքի չափի գնահատված պարամետրին, այսինքն.
Այնուամենայնիվ, սխալ կլինի ենթադրել, որ անաչառ գնահատականը միշտ տալիս է գնահատված պարամետրի լավ մոտարկում: Իրոք, հնարավոր արժեքները կարող են խիստ ցրված լինել իրենց միջինի շուրջ, այսինքն՝ շեղումը կարող է նշանակալի լինել: Այս դեպքում, օրինակ, մեկ նմուշի տվյալներից հայտնաբերված գնահատականը կարող է պարզվել, որ շատ հեռու է միջին արժեքից և, հետևաբար, հենց գնահատված պարամետրից: Այսպիսով, ընդունելով որպես մոտավոր արժեք՝ մենք մեծ սխալ կգործենք։ Եթե, այնուամենայնիվ, պահանջվում է, որ շեղումը փոքր լինի, ապա մեծ սխալ թույլ տալու հնարավորությունը կբացառվի։ Այդ իսկ պատճառով վիճակագրական գնահատման վրա դրվում է արդյունավետության պահանջ։
արդյունավետկոչվում է վիճակագրական գնահատում, որը (տվյալ նմուշի չափի համար) ունի ամենափոքր հնարավոր շեղումը:
Հարուստկոչվում է վիճակագրական գնահատում, որը, ամենայն հավանականությամբ, ձգտում է գնահատված պարամետրին, այսինքն՝ հավասարությունը ճշմարիտ է.
.
Օրինակ, եթե անկողմնակալ գնահատողի շեղումը ժամը ձգտում է զրոյի, ապա այդպիսի գնահատիչը նույնպես հետևողական է:
Մտածեք այն հարցը, թե որ նմուշի բնութագրիչները լավագույնս են գնահատում ընդհանուր միջինը և շեղումը անաչառության, արդյունավետության և հետևողականության տեսանկյունից:
Թող դիսկրետ ընդհանուր պոպուլյացիան ուսումնասիրվի որոշ քանակական հատկանիշի նկատմամբ:
Ընդհանուր միջնակարգկոչվում է ընդհանուր բնակչության հատկանիշի արժեքների թվաբանական միջին: Այն հաշվարկվում է բանաձևով.
§ - եթե ընդհանուր ծավալի բնակչության նշանի բոլոր արժեքները տարբեր են.
§ - եթե ընդհանուր բնակչության նշանի արժեքները համապատասխանաբար ունեն հաճախականություններ և . Այսինքն, ընդհանուր միջինը հատկանիշի արժեքների կշռված միջինն է՝ համապատասխան հաճախականություններին հավասար կշիռներով:
ՄեկնաբանությունԹող ծավալի պոպուլյացիան պարունակի ատրիբուտի տարբեր արժեքներով օբյեկտներ: Պատկերացրեք, որ մեկ օբյեկտ պատահականորեն ընտրված է այս հավաքածուից: Հավանականությունը, որ, օրինակ, հատկանիշի արժեք ունեցող օբյեկտը կվերցվի, ակնհայտորեն հավասար է . Ցանկացած այլ օբյեկտ կարող է արդյունահանվել նույն հավանականությամբ։ Այսպիսով, հատկանիշի արժեքը կարելի է դիտարկել որպես պատահական փոփոխական, որի հնարավոր արժեքներն ունեն նույն հավանականությունները, որոնք հավասար են . Այս դեպքում դժվար չէ գտնել մաթեմատիկական ակնկալիքը.
Այսպիսով, եթե ընդհանուր բնակչության հետազոտված նշանը դիտարկենք որպես պատահական փոփոխական, ապա նշանի մաթեմատիկական ակնկալիքը հավասար է այս նշանի ընդհանուր միջինին. Մենք ստացանք այս եզրակացությունը՝ ենթադրելով, որ ընդհանուր բնակչության բոլոր օբյեկտներն ունեն հատկանիշի տարբեր արժեքներ: Նույն արդյունքը կստացվի, եթե ենթադրենք, որ ընդհանուր պոպուլյացիան պարունակում է նույն հատկանիշի արժեք ունեցող մի քանի օբյեկտ։
Ընդհանրացնելով ընդհանուր բնակչության համար ստացված արդյունքը հատկանիշի շարունակական բաշխմամբ, մենք ընդհանուր միջինը սահմանում ենք որպես հատկանիշի մաթեմատիկական ակնկալիք. .
Թող արդյունահանվի ծավալի նմուշ՝ ընդհանուր պոպուլյացիան քանակական հատկանիշով ուսումնասիրելու համար:
Նմուշի միջինըկոչվում է ընտրանքային բնակչության հատկանիշի արժեքների միջին թվաբանական: Այն հաշվարկվում է բանաձևով.
§ - եթե ընտրանքի ծավալի բնակչության նշանի բոլոր արժեքները տարբեր են.
§ - եթե նմուշառման հավաքածուի հատկանիշի արժեքներն ունեն համապատասխանաբար հաճախականություններ և . Այսինքն, ընտրանքային միջինը հատկանիշի արժեքների միջին կշռված է համապատասխան հաճախականություններին հավասար կշիռներով:
ՄեկնաբանությունՄեկ նմուշի տվյալներից հայտնաբերված ընտրանքային միջինն ակնհայտորեն որոշակի թիվ է: Եթե նույն չափի այլ նմուշներ հանենք նույն ընդհանուր պոպուլյացիայից, ապա ընտրանքի միջինը կփոխվի նմուշից նմուշ: Այսպիսով, ընտրանքի միջինը կարող է դիտվել որպես պատահական փոփոխական, և, հետևաբար, մենք կարող ենք խոսել ընտրանքի միջին բաշխումների (տեսական և էմպիրիկ) և այս բաշխման թվային բնութագրերի, մասնավորապես, ընտրանքի բաշխման միջինի և շեղումների մասին։ .
Ավելին, եթե ընդհանուր միջինը անհայտ է և պահանջվում է այն գնահատել ընտրանքի տվյալների հիման վրա, ապա ընտրանքի միջինը վերցվում է որպես ընդհանուր միջինի գնահատում, որն անաչառ և հետևողական գնահատական է (մենք առաջարկում ենք ապացուցել այս հայտարարությունը մեր սեփական): Վերոնշյալից հետևում է, որ եթե միևնույն ընդհանուր պոպուլյացիայից բավականաչափ մեծ ծավալի մի քանի նմուշներ օգտագործվեն նմուշի միջոցներ գտնելու համար, ապա դրանք մոտավորապես հավասար կլինեն միմյանց: Սա սեփականությունն է նմուշի միջոցների կայունությունը.
Նկատի ունեցեք, որ եթե երկու պոպուլյացիաների շեղումները նույնն են, ապա ընտրանքային միջոցների հարևանությունը ընդհանուրներին կախված չէ ընտրանքի չափի և ընդհանուր բնակչության չափի հարաբերակցությունից: Դա կախված է ընտրանքի չափից. որքան մեծ է ընտրանքի չափը, այնքան փոքր է ընտրանքի միջինը տարբերվում ընդհանուրից: Օրինակ, եթե օբյեկտների 1%-ն ընտրված է մեկ հավաքածուից, իսկ առարկաների 4%-ը ընտրված է մեկ այլ հավաքածուից, և առաջին նմուշի ծավալը պարզվում է, որ ավելի մեծ է, քան երկրորդը, ապա առաջին նմուշի միջինը ավելի քիչ կտարբերվի. համապատասխան ընդհանուր միջինը, քան երկրորդը:
) մաթեմատիկական վիճակագրության խնդիրներ.
Ենթադրենք, որ գոյություն ունի հավանականության բաշխումների պարամետրային ընտանիք (պարզության համար կդիտարկենք պատահական փոփոխականների բաշխումը և մեկ պարամետրի դեպքը)։ Ահա թվային պարամետր, որի արժեքը անհայտ է: Պահանջվում է գնահատել այն այս բաշխման արդյունքում առաջացած արժեքների առկա նմուշով:
Գնահատման երկու հիմնական տեսակ կա. կետային գնահատականներԵվ վստահության միջակայքերը.
Կետերի գնահատում
Կետային գնահատումը վիճակագրական գնահատման տեսակ է, որտեղ անհայտ պարամետրի արժեքը մոտավոր է մեկ թվով: Այսինքն, դուք պետք է նշեք նմուշի գործառույթը (վիճակագրություն)
,որի արժեքը կդիտարկվի որպես անհայտ իրական արժեքի մոտարկում:
Պարամետրերի կետային գնահատումների կառուցման ընդհանուր մեթոդները ներառում են առավելագույն հավանականության մեթոդը, պահերի մեթոդը, քվանտիլ մեթոդը:
Ստորև բերված են որոշ հատկություններ, որոնք կարող են ունենալ կամ չունենալ կետային գնահատումները:
վճարունակությունը
Կետային գնահատման առավել ակնհայտ պահանջներից մեկն այն է, որ կարելի է ակնկալել բավականին լավ մոտարկում պարամետրի իրական արժեքին, որը բավականաչափ տրված է: մեծ արժեքներնմուշի չափը. Սա նշանակում է, որ գնահատականը պետք է համընկնի իրական արժեքին: Այս գնահատման հատկությունը կոչվում է վճարունակությունը. Քանի որ մենք խոսում ենք պատահական փոփոխականների մասին, որոնց համար կան տարբեր տեսակներկոնվերգենցիա, ապա այս հատկությունը կարող է ճշգրիտ ձևակերպվել տարբեր ձևերով.
Պարզապես տերմինն օգտագործելիս վճարունակությունը, ապա մենք սովորաբար նկատի ունենք թույլ հետևողականությունը, այսինքն. հավանականության կոնվերգենցիա.
Հետևողականության պայմանը գործնականում պարտադիր է գործնականում օգտագործվող բոլոր գնահատումների համար: Անհամապատասխան գնահատականները հազվադեպ են օգտագործվում:
Անաչառություն և ասիմպտոտիկ անաչառություն
Պարամետրերի գնահատումը կոչվում է անաչառ, եթե դրա մաթեմատիկական ակնկալիքը հավասար է գնահատված պարամետրի իրական արժեքին.
.Ավելի թույլ վիճակն է ասիմպտոտիկ անաչառություն, ինչը նշանակում է, որ գնահատման մաթեմատիկական ակնկալիքը համընկնում է պարամետրի իրական արժեքին ընտրանքի չափի մեծացմամբ.
.Անաչառությունը գնահատողների առաջարկվող հատկությունն է: Այնուամենայնիվ, դրա կարևորությունը չպետք է գերագնահատել: Ամենից հաճախ գոյություն ունեն պարամետրերի անաչառ գնահատականներ, և այնուհետև փորձում են հաշվի առնել միայն դրանք: Այնուամենայնիվ, կարող են լինել որոշ վիճակագրական խնդիրներ, որոնց դեպքում չկան անաչառ գնահատականներ: Ամենահայտնի օրինակը հետևյալն է. դիտարկել Պուասոնի բաշխումը պարամետրով և սահմանել պարամետրը գնահատելու խնդիրը: Կարելի է ապացուցել, որ այս խնդրի անաչառ գնահատող չկա։
Գնահատականների համեմատություն և արդյունավետություն
Միևնույն պարամետրի տարբեր գնահատականները միմյանց հետ համեմատելու համար օգտագործվում է հետևյալ մեթոդը՝ ընտրել մի քանիսը ռիսկի գործառույթ, որը չափում է գնահատման շեղումը պարամետրի իրական արժեքից, և լավագույնը համարվում է այն, որի համար այս ֆունկցիան ավելի փոքր արժեք է ընդունում։
Ամենից հաճախ գնահատման քառակուսի շեղման մաթեմատիկական ակնկալիքը իրական արժեքից դիտարկվում է որպես ռիսկի ֆունկցիա.
Անկողմնակալ գնահատողների համար սա ուղղակի տարբերությունն է:
Այս ռիսկի ֆունկցիայի ստորին սահման կա, որը կոչվում է Կրամեր-Ռաո անհավասարություն.
(անկողմնակալ) գնահատողները, որոնց համար այս ստորին սահմանը բավարարված է (այսինքն՝ ունենալով ամենափոքր հնարավոր շեղումը), կոչվում են. արդյունավետ. Այնուամենայնիվ, արդյունավետ գնահատման առկայությունը խնդրի համար բավականին ուժեղ պահանջ է, ինչը ոչ միշտ է այդպես:
Ավելի թույլ վիճակն է ասիմպտոտիկ արդյունավետություն , ինչը նշանակում է, որ անկողմնակալ գնահատականի շեղումների հարաբերակցությունը Cramer-Rao-ի ստորին սահմանին ձգտում է միասնության:
Նկատի ունեցեք, որ ուսումնասիրվող բաշխման վերաբերյալ բավական լայն ենթադրությունների դեպքում առավելագույն հավանականության մեթոդը տալիս է պարամետրի ասիմպտոտիկ արդյունավետ գնահատում, իսկ եթե կա արդյունավետ գնահատում, ապա այն տալիս է արդյունավետ գնահատում:
Բավարար վիճակագրություն
Վիճակագրությունը կոչվում է բավարարպարամետրի համար, եթե նմուշի պայմանական բաշխումը, պայմանով, որ կախված չէ պարամետրից բոլորի համար:
Բավարար վիճակագրության հայեցակարգի կարևորությունը պայմանավորված է հետևյալով հաստատում. Եթե բավարար վիճակագրություն է և պարամետրի անաչառ գնահատական է, ապա պայմանական ակնկալիքը նաև պարամետրի անաչառ գնահատական է, և դրա շեղումը փոքր է կամ հավասար է սկզբնական գնահատման շեղմանը:
Հիշեք, որ պայմանական ակնկալիքը պատահական փոփոխական է, որը ֆունկցիա է . Այսպիսով, անաչառ գնահատողների դասում բավական է դիտարկել միայն նրանք, որոնք բավարար վիճակագրության գործառույթներ են (պայմանով, որ տվյալ խնդրի համար կա այդպիսի վիճակագրություն):
(անկողմնակալ) արդյունավետ պարամետրի գնահատումը միշտ բավարար վիճակագրություն է:
Կարելի է ասել, որ բավարար վիճակագրությունը պարունակում է ողջ տեղեկատվությունը գնահատված պարամետրի մասին, որը պարունակվում է նմուշում: