интервал

интервал

2.8 Выбор числа интервалов

2.8 Выбор числа интервалов Число интервалов группирования, используемое при вычислении оценок параметров, построении гистограмм, вычислении статистик типа отношения правдоподобия или Пирсона колеблется в весьма размашистых пределах. Боль­шинство рекомендуемых формул для оценки числа интервалов треплет эмпи­рический характер и обыкновенно предоставляет завышенные значения. дефиниция числа интервалов связано с объемом выборки. полный линия рекомендаций из неодинаковых родников по выбору числа интервалов дан в . При выборе интервалов равновеликой длины определяющим является требова­ние, чтоб число наблюдений, угадавших в интервалы, было не слишком ма­лым и сравнимым. этакое заявка выставляют в связи с опасением, что в противном случае распределение статистики типа –распределением. При этом наиболее дробно рекомендуют, чтоб число наблюде­ний, угадавших в интервал, было не менее 10. В отмечено, что на практике позволительно, чтоб число наблюдений в крайних интервалах было менее пяти. В работах , , отданных изучению мощности критерия Пирсона, в случае унимодального распределения допускается уменьшение ожидаемых частот попадания наблюдений для одного или двух интервалов до 1 и даже ниже. Статистическое моделирование подтверждает, что и в этакий ситуации распределения статистик типа –распределениями. Во многих ключах, образцово в , можно найти упоминание эври­стической формулы Старджесса для определения “оптимального” числа ин­тервалов 2 +1=3,3 +1. В В . В , – квантиль типового нормального распределения для заданного уровня значимости. В ряде работ приводят модификации данной формулы. В , а в . В изыскании , ). , задаваемых раз­личными формулами, хватит велик. Поэтому на практике при выборе числа интервалов предельнее следуют тем, чтобы в интервалы попадало число наблюдений не менее 5-10. эдак, образцово, в рекомендациях ВНИИМет­рологии Все вышеперечисленные рекомендации опирались на домысел, что вытекает выбирать этаким образом, чтоб картина гистограммы был ровно можно теснее к плавной искривленный плотности распределения генеральной сово­купности. В показано, что уклонение гистограммы от плотности распре­деления в лучшем случае владеет порядок , достигаемый при числе ин­тервалов . Очевидно, что “оптимальное” значение зависит не всего-навсего от объема выборки, однако и от вида закона распределения и от способа группирования. При асимптотически оптимальном группировании относительно скаляр­ного параметра при 10-11 интервалах в группированной выборке сохраняется возле 98% информации, при оптимальном группировании относительно век­тора параметров (два параметра) для 15 интервалов – возле 95%. Даль­нейшее увеличение числа интервалов существенного значения не владеет. Конкретное число интервалов при асимптотически оптимальном груп­пировании выбирают, исходя из вытекающих соображений. При оптимальном группировании вероятности попадания в интервалы в повальном случае не равновелики. Обычно минимальны вероятности попадания в крайние интервалы. Поэтому 5-10 для любого интервала при опти­мальном группировании. По крайней мере, мини­мальная ожидаемая час­тота должна быть больше 1. В случае использования равновероятного груп­пирования порядок должен быть образцово этаким же, ровно и при асимптоти­чески оптимальном группировании. Все наиболее рассудительные рекомендации по выбору числа интервалов, в том числе по выбору числа интервалов в случае асимптотически оптималь­ного группирования, исходят из того, чтоб при данном приблизить плот­ность распределения ее непараметрической оценкой (гистограммой) ровно можно лучше . однако ни одни из рекомендаций, за исключением , , не под­ходят к выбору с позиций мощности критерия согласия! Не опираются на заявка построения наиболее мощного критерия при тесных конкури­рующих гипотезах. алкая знатно, что при заданном объеме выборки, заданных конкури­рующих гипотезах , выбранном способе группирования и фиксиро­ванном уровне значимости Пирсона и связи правдоподобия растягивается , . Пирсона с ростом числа интерва­лов при проверке простой гипотезы можно судить по . Через обозначена статистика, вычисляемая в соответствии с формулой . На =7,10,15,20 =500, когда гипотеза отвечает нормальному закону, а – логистическому (два весьма тесных закона). Для  группировании. Ордината тельного гроба соответ­ствующей отвесной черты определяет значение a=0,1 для отвечающего числа интер­валов. Мощность равна 1- b. ровно заметно, в полном соответствии с результа­тами работ , при увеличении числа интервалов мощность критерия па­дает. – нормальный закон, – логистический закон, =7,10,15,20 – нормальный закон, – логистический закон, =7,10,15,20 – нормальный закон, – логистический закон, =7,10,15,20 в за­ви­симости от числа интервалов при проверке сложной гипотезы иллюстрирует . тут также с ростом мощность критерия растягивается. уменьшается существенно медлительнее ( ) и она патетичнее, чем мощность критерия Пирсона. В – нормальный закон, в случае простых и сложных гипотез. В колонке 2 приведены значения мощности кри­терия Пирсона при проверке немудреный гипотезы, полученные по результа­там моделирования (экспериментально). В колонке 3 повергнуты теоретические значения мощности, вычисленные при обстоятельстве, что –распределение, а – соответствующее нецентральное распределение. Колонка 4 кормит значения мощности критерия Пирсона при проверке сложной гипотезы, полученные по плодам моделирования при использовании ОМП по негруппированным наблюдениям. В колонке 5 повергнуты теоретические значения мощности критерия Пирсона при про­верке сложной гипотезы, вычисленные при обстоятельстве, что ), а  – соответствующее нецентральное рас­пределение. В колонке 6 повергнуты значения мощности критерия Никулина, полученные в плоде моделиро­вания распределений статистики , а в колонке 7 – расчетные значения мощности этой статистики при рассматри­ваемой чете гипотез . В от 6 до 30. Проследив изменение мощности критериев при <6, можно убедиться, что, если мощность критерия Пирсона с уменьшением числа интервалов про­должает возрастать, то мощность критерия Никулина со статистикой  начинает растягиваться. Это свидетельствует о том, что для критерия Никулина имеется оптимальное число интервалов, при каком его мощность мак­симальна. В при неодинаковых объемах выборок. размеры мощности для критериев типа может быть вычислена в соответствии с формулой ,      – параметр нецентральности, определяемый формулами , или , , – заданная вероятность оплошки первого рода, – вероятность оплошки второго рода). Максимальную мощность критерии Пирсона и связи правдопо­добия зачастую обладают или при минимально мыслимом числе интервалов, определяемом условием = 1 , или при оптимальном числе интервалов, интимном к минимально вероятному. Оптимальное число интервалов для критерия Никулина обыкновенно предельнее, чем для критериев Пирсона и связи правдопо­добия, и не пре­вышает значения . a=0,1 – нормальный закон, этаким образом, выбирая число интервалов в критериях типа , следует осознавать, что увеличение их числа не приводит к росту мощности критерия. Рекомендуется выбирать число интервалов эдак, чтоб для любого интервала при оптимальном группировании выполнялось условие 10. По крайней мере, минимальная ожидаемая  частота должна быть предельнее 1. При этом следует опираться на отвечающую таблицу асимптотически опти­мального группирования из . предписания на соответствующую таблицу асимптотически оптимального группирования даны в . Снизу значение . , можно избрать оптимальное число интервалов эдак, чтоб максимизировать соотношение . ] ] ]


Похожие записи:

Последнии записи

Популярные записи

Hosted by uCoz