Лекції 2-3 Точні вибіркові розподіли. Точкові і інтервальні оцінки



Скачати 296.74 Kb.
Дата конвертації30.12.2016
Розмір296.74 Kb.

© В. М.Сидоренко, 2008



06.10.08
Лекції 2-3

2. Точні вибіркові розподіли. Точкові і інтервальні оцінки

2.1. Розподіл

2.2. Розподіл Стьюдента

2.3. Розподіл Фішера

3. Статистичні оцінки

3.1. Точкові оцінки

3.1.1. Методи точкового оцінювання

3.1.1.1. Метод моментів

3.1.1.2. Метод максимальної правдоподібності

3.1.2 Нерівність Крамера-Рао*

3.2. Оцінки параметрів деяких розподілів

3.2.1. Оцінки параметрів нормального розподілу

3.2.2. Оцінки параметрів засміченого нормального розподілу

3.2.3. Оцінки параметрів рівномірного розподілу

3.2.4. Оцінки параметрів логарифмічно нормального розподілу

3.2.5. Оцінка параметра нормального розподілу

3.2.6. Оцінка параметрів розподілу Коші

3.2.7. Оцінка параметрів біноміального розподілу

3.2.8. Оцінка параметрів пуассонівського розподілу

3.2.9. Оцінка гіпергеометричного розподілу

3.3. Інтервальні оцінки

3.3.1. Інтервальні оцінки параметрів нормального розподілу

3.3.2. Інтервальні оцінки експоненційного розподілу

3.3.3. Інтервальні оцінки рівномірного розподілу

3.3.4 Випадок логарифмічно нормального розподілу

3.3.5.Випадок довільного розподілу

Література

2.1. Розподіл
Означення 8. Нехай - незалежні нормально розподілені ВВ з параметрами (0;1). Тоді ВВ має розподіл з степенями свободи, що позначається як .

Щільність ймовірності:



, де - гамма-функція.

Числові характеристики.











Застосовується: при побудові довірчих інтервалів і перевірці статистичних гіпотез.

2.2. Розподіл Стьюдента
Означення 9. Нехай ξ і – незалежні випадкові величини, причому . Тоді ВВ має розподіл Стьюдента (t–розподіл) з ступенями свободи, що позначається як .

Щільність ймовірності:



Зауваження 6. Можна показати, що при щільність ймовірності ВВ збігається до щільності стандартного нормального розподілу , тобто

,

При розподіл Стьюдента практично не відрізняється від





,



Застосовується: При побудові довірчих інтервалів і перевірці статистичних гіпотез.

2.3. Розподіл Фішера
Означення 10. Нехай і має розподіл з та ступенями свободи відповідно. Тоді ВВ має розподіл Фішера (F-розподіл) з та ступенями свободи, що записується як .

Щільність ймовірності.


Числові характеристики:


3.Статистичні оцінки
Постановка задачі оцінювання параметрів розподілу:

Існує реалізація (вибірка) випадкової величини з розподілом . Вид розподілу відомий. Необхідно оцінити параметр за інформацією, яку несе в собі вибірка. Ніякої іншої інформації не існує.


Означення 11. Нехай існує вибірка . Точковою оцінкою невідомого параметра називається число (функція) , причому - випадкова величина, - постійне число.

Зауваження 7. Важливо вміти відповідати на питання: на скількі велика величина ? Які оцінки найкращі?

Означення 12. Оцінка є незміщеною, якщо .

Означення 13. Оцінка є асимптотично незміщеною, якщо .

Означення 14. Оцінка є конзістентною, якщо
або

Означення 15. Оцінка називається ефективною, якщо вона має мінімальну можливу дисперсію при заданому об'ємі вибірки .

Зауваження 8. Задача точкового оцінювання полягає в пошуку незміщених, конзістентних і ефективних оцінок.
3.1.1. Методи точкового оцінювання

3.1.1.1. Метод моментів
Нехай – вибірка з розподілу . Необхідно одержати оцінки для невідомих параметрів . Першим загальним методом оцінки є метод моментів, запропоновані К. Пірсоном.

Суть методу полягає в прирівнюванні певної кількості вибіркових моментів відповідним теоретичним моментам

Розглянемо кількість моментів, що дорівнює кількості невідомих параметрів та одержимо систему рівнянь
3.1.1.2. Метод максимальної правдоподібності
Метод запропонований Фішером:

Дискретні ВВ. Нехай - вибірка з дискретної випадкової величини із заданим законом розподілу . Необхідно оцінити невідомий параметр .

Позначимо через ймовірність того, що в результаті випробування випадкова величина набуде значення .



Означення 16. Функцією правдоподібності дискретної випадкової величини називається функція аргументу :

, де - фіксовані числа.

Означення 17. Оцінка знайдену за умови максимуму функції правдоподібності, тобто називається оцінкою максимальної правдоподібності.

Функції і досягають максимуму при одному і тому ж значенні, тому зручніше шукати функції .



Означення 18. Логарифмічною функцією правдоподібності називається функція

Етапи пошуку :



  1. Знаходимо ;

  2. Знаходимо критичну точку з розв'язку рівняння: ;

  3. Знаходимо . Якщо в точці , то - точка .

3.1.2. Нерівність Крамера-Рао* (самостійно)
3.2. Оцінки параметрів деяких розподілів
Розглянемо точкові оцінки для низки стандартних розподілів, що найбільш часто зустрічаються на практиці.
3.2.1. Оцінка параметрів нормального розподілу



3.2.2. Оцінки параметрів засміченого нормального розподілу [10]
Як показують дослідження останніх років ознаки виробничо-господарчої діяльності підприємств мають витягнуті в той чи інший бік розподіли з «важкими» хвостами. Тьюки показав, що по мірі віддалення істинного розподілу від нормального вибіркове середнє швидко втрачає свої властивості найкращої оцінки центру нормального розподілу.

Будемо вважати, що нормальний розподіл засмічений нормальними викидами з ти м же середнім, але зі значно більшою дисперсією.

Нехай - доля засмічення розподілу розподілом , тоді ця вибірка належить генеральній сукупності з щільністю розподілу

. (*)

Якщо при цьому спостережувана вибірка , то не є найкращою для параметра як центру розподілу.

Таким чином, якщо на основний розподіл типу накласти засмічуючий зі середнім квадратичним відхиленням, що дорівнює трьом, то Тьюкі пропоную наступну оцінку параметра :

,

де - варіаційний ряд вибірки , - усічена оцінка середнього значення, - найбільше ціле число у , . Відмітимо, що при співпадає зі середнім значенням . Відомо, що . Це дає змогу отримати довірчий інтервал для .


3.2.3. Оцінка параметрів рівномірного розподілу
, де
3.2.4. Оцінка параметрів логарифмічно нормального розподілу

Примітка: Параметри реальних ознак, підлеглих цьому закону:


  1. Довговічність виробу, експлуатованого в режимі зносу і старіння.

  2. Розмір і об'єм частинок при дробленні.



3.2.5. Оцінка параметра експоненційного розподілу
,
Примітка. Параметри реальних ознак, що мають такі розподіли:

  1. Час між збоями технічного пристрою.

  2. Довговічність виробу, що працює в режимі експлуатації.


3.2.6. Оцінка параметрів розподілу Коші

Числових характеристик не існує.

Метод прирівнювання теоретичних та емпіричних квантілів дозволяє отримати такі оцінки:



; […] - ціла частина числа.

- вибіркова медіана.

.

- вибірковий квантіль рівня 0,75, тобто, -ий член варіаційного ряду, побудованого за наявною вибіркою.
3.2.7. Оцінка параметрів біноміального розподілу


- число появ події в i-тому, що цікавить нас, спостереженні, тобто в i-тій m-кратній серії незалежних випробувань.

3.2.8. Оцінка параметрів пуассонівського розподілу


, де - число появ події, що цікавить нас, в проміжок i-тої проконтрольованої одиниці часу.

3.2.9. Оцінка параметрів гіпергеометричного розподілу

При відомому значенні параметра :



, де - зафіксована в i-тому спостереженні кількість об'єктів, що мають задані властивості серед випадкових вилучень із сукупності, що складається з об'єктів.

3.3. Інтервальні оцінки

Означення 19. Інтервальною називається оцінка, яка визначається двома числами – кінцями інтервалу.

Нехай - оцінка параметра , тобто . Ясно, що чим , тим точніша точкова оцінка . Якщо і , то чим , тим точніша оцінка. Нерівність не здійснюється суворо, а з ймовірністю .



Означення 20. Надійністю (довірчою ймовірністю) оцінки за називають ймовірність , з якою здійснюється нерівність , тобто



Означення 21. Вираз називають довірчим інтервалом, який покриває параметр , що оцінюється, з надійністю .

Розглянемо низку важливих теорем, що стосуються точних розподілів, і які лежать в основі підходів для оцінювання параметрів деяких розподілів і перевірки різних статистичних гіпотез.



Теорема 5. Якщо елементи вибірки незалежні і розподілені нормально з параметрами , то і незалежні, причому розподілено нормально з параметрами , а має розподіл з ступенями свободи.

Теорема 6. Якщо елементи вибірки незалежні і кожна з цих величин розподілена нормально з параметрами , то величина має розподіл Стьюдента з ступенями свободи.

Теорема 7. Нехай і - дві незалежні вибірки і будь-яка з цих незалежних величин має нормальний розподіл з параметрами . Тоді величина , де - вибіркова дисперсія вибірки , а - вибіркова дисперсія вибірки , має розподіл з і ступенями свободи відповідно.

3.3.1. Інтервальні оцінки параметрів нормального розподілу

I. Оцінка параметра при відомому

Нехай . Для оцінки природно використовувати згідно з теоремою 5. Для ми можемо знайти таке (квантіль), що .

Але нерівність рівносильна такій:

. ( або задаються наперед)

- інтегральна функція Лапласа.

II. Оцінка параметру при невідомому

Згідно з теоремою 6 величина розподілена за законом Стюдента з степенями свободи. Враховуючі, що



, тоді - має розподілення Стьюдента з ступенями свободи. Тому для заданої надійності ми можемо за таблицею розподілення Стюдента знайти межі . Тоді



Рис. 3.1 Критичні області розподілу



III. Оцінка параметру

Нехай . Згідно з теоремою 6 величина . Довірчий інтервал виберемо таким чином, щоб межі і забезпечили виконання умови (рис. 1);



;

;

;

;

3.3.2 Оцінка параметру експоненціального розподілення

Існує теорема про те, що має розподіл з ступенями свободи. Згідно з цим ж законом величина . Тоді інтервал оцінки може бути визначена за співвідношенням



Для визначення та використовуємо співвідношення ;



, де , - будь-які позитивні числа, менші за одиницю, причому . Тоді

;

.

;

.
3.3.3 Випадок рівномірного розподілу на відрізку з фіксованим кінцем
Нехай - вибірка випадкової величини з невідомим параметром . Нехай , при . Оцінка - конзістентна, але зміщена. Незміщеною буде оцінка . Вона є ефективна.

Розподілення величини не залежить від 0 і має вигляд:



За заданим виберемо таке, щоб .Звідси знайдемо: . Тоді .


3.3.4 Випадок логарифмічно нормального розподілу [7]
Логарифмування є одним з тривіальних функціональних перетворень вибіркових значень у випадку, коли має місце порушення передумови щодо їх нормальності. Вимога нормального закону вибіркових значень виникає всяк раз, коли постає мова про коректне застосування параметричних критеріїв згоди при перевірці статистичних гіпотез, зокрема, у дисперсійному, кореляційному та регресійному аналізі (див. нижче). Логарифмування застосовується у тих випадках, коли , . Тобто, випадкова величина має нормальний закон розподілу. Враховуючи, що , а оцінка центру розподілу , отримаємо оцінку середнього значення величини :

; (1)

Інтервальна оцінка для центру розподілу величини має вигляд



. (2)

З (2) з у рахуванням (1) отримаємо інтервальну оцінку для медіани, як центру розподілу:



. (3)

3.3.5 Випадок довільного розподілу
Нехай - довільна вибірка. При великих можна побудувати прості довірчі інтервали за умови припущення щодо нормальності на підставі ЦГТ, згідно з якою розподілення величини:

.

Якщо - конзістентна оцінка , тоді розподілення величини

і отже ; або , при . (*)

На підставі (*) розглянемо два часткових випадки.


Оцінка параметру розподілення Пуассона
Нехай - незалежні ВВ, що мають розподілення Пуассона з параметром . Тоді , - конзістентна оцінка параметру , при .
;

.
Оцінка параметру в розподілі Бернуллі
Нехай - число успіхів в іспитах Бернуллі з ймовірністю успіху в кожному іспиті дорівнює . Величина - незміщена і конзістентна оцінка параметра . Звідси при

;

де .

Тоді ;

.

I. Доповнення до параграфу про точкову оцінку параметрів розподілу

Згідно з [8]:



- конзістентна, але зміщена оцінка СКВ при .

Незміщена і конзістентна оцінка параметра нормального розподілення:



, (**)

де - гамма-функція.

Значення для приведені в таблиці:

456789 1.0851.0641.0511.0421.0361.032

При застосовується права частина формули (**).


II. Побудова довірчого інтервалу до параметру Пуасонівського розподілу[9]

Для точних інтервалів користаються тим фактом, що функція розподілу за законом Пуассона виражається у термінах - розподілу. А саме, наступна формула (стор.160):



; (***)
Довірчий інтервал.

Використовуючи (***) отримуємо довірчі інтервали для :

Для :

; (1*)

Так як ; тоді



де - квантіль рівня , - розподілення з

ступенями свободи.

Аналогічно знаходимо :

;

;

.

Приклад. Якщо на літаку, що залишає складальній цех, не вистачає однієї заклепки і якщо можливо представити, що кількість заклепок, яких не вистачає, на одному літаку розподілена за законом Пуассона, тоді 99%-ий довірчий інтервал для невідомого параметру ( тобто для середнього числа відсутніх заклепок на один літак у всій партії літаків)суть:

;

.

Д/З 1. Для

2. Побудувати довірчий інтервал з [1] для Порівняти результати.

Література

1. Чистяков В.П. Курс теории вероятностей – 2-е издание, переработанное и дополненное - М.: Наука. Главная редакция физико– математической литературы, 1982 г.-256 стр.

2. Гмурман В.Е. Теория вероятностей и математическая статистика. Учебное пособие для вузов. Издание 5-е, переработанное и дополненное М., „Вища школа”,1977г.- 497стр.

3.Айвазян С.А. и др. Прикладная статистика: Основы моделирования и первичная обработка данных. Справочное издательство /С.А.Айвазян, Н.С. Енюков, Л.Д. Мешалкин, - М.:Финансы та статистика, 1983 г.-471стр.

4. Справочник по теории вероятностей и математической статистике/ В.С. Коронюк, Н.І. Портенко, А.В. Скороход, А.Ф. Турбин, -М.: Наука. Главная редакция физико–математической литературы, 1985 г.-640 стр.

5.Турчин В.Н., Дрожжина А.В. Лабораторный практикум для курса “Теория вероятностей и математичская статистика”. Днепропетровск, Ротапринт ДГУ., 1987 г.

6. Чернова Н. І. Краткий конспект лекций по математической статистике. Новосибірськ.,1997 г.

7. Румшиский Л. З. Математическая обработка результатов эксперимента. Главная ред. физико-матем. изд-ва «Наука», 1971.

8. Справочник по вероятностным расчетам. Воениздат, 1970; 536 стр.; Г.Г.Абезгауз, А.П.Тронь, Ю.Н.Копенкин, І.А.Коровина, стр.291-292.

9. К.А.Браунли: Статистическая теория и методы в науке и технике. К.А.Браунли: перевод с английського М.С. Никулина, под редакцией Л.Н.Большик. Главная редакция физико-математической литературы издательства “Наука”,1977 г. стр.160.



10. А. М. Дубров. Обработка статистических данных методом главных компонент. М., «Статистика», 1978.




База даних захищена авторським правом ©lecture.in.ua 2016
звернутися до адміністрації

    Головна сторінка