интервал

интервал

Фундаментальная экология: Учебные материалы: В.Д. Мятлев, Л.

им. М.В. ЛОМОНОСОВА В.Д. Мятлев, Л.А. Панченко, А. Т. Терехин 1. СЛУЧАЙНАЯ ВЫБОРКА И ЕЕ ОПИСАНИЕ 1.1. Понятие случайной выборки 1.2. Характеристики случайной выборки 2. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ 2.1. Логика статистического оценивания 2.2. Доверительные интервалы 2.2.1. Доверительный интервал для математического ожидания нормально распределенной случайной величины с известной дисперсией 2.2.2. Доверительный интервал для математического ожидания нормально распределенной случайной величины с неизвестной дисперсией 2.2.3. Доверительный интервал для неведомой дисперсии нормально распределенной случайной величины (при незнакомом математическом ожидании) 2.2.4. Доверительный интервал для незнамого параметра 2.2.5. Доверительный интервал для незнамого параметра 2.2.6. форсированный доверительный интервал для незнамого коэффициента корреляции двумерного нормального распределения 3. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 3.1. Логика проверки статистических гипотез 3.2. Проверка гипотезы о равенстве заданному числу математического ожидания нормально распределенной случайной величины с известной дисперсией 3.3. Проверка гипотезы о равенстве заданному числу математического ожидания нормально распределенной случайной величины 3.4. Проверка гипотезы о равенстве заданному числу дисперсии нормально распределенной случайной величины (одновыборочный 3.5. Проверка гипотезы о равенстве математических ожиданий двух независимых нормально распределенных случайных величин (двухвыборочный 3.6. Проверка гипотезы о равенстве дисперсий двух суверенных нормально распределенных случайных величин (двухвыборочный 3.7. форсированный критерий для проверки гипотезы о равенстве параметров двух суверенных биномиальных случайных величин (критерий для сравнения двух вероятностей) 3.8. форсированный критерий для проверки гипотезы о равенстве параметров двух суверенных пуассоновских случайных величин 3.9. форсированный критерий для проверки гипотезы о равенстве нулю коэффициента корреляции между компонентами двумерной нормально распределенной случайной величины 3.10.. Критерии согласия 3.11. Непараметрические критерии 3.11.1. Одновыборочные критерии 3.11.2. 3.11.3. Критерии однородности 3.11.4. Проверка гипотезы о независимости Задача математической статистики , в жестком понимании этого термина, заключается в разработке и применении методов описания реальных явлений вероятностными моделями, исходя из данных, полученных в плоде наблюдений за этими явлениями. В более машистом резоне математическая статистика понимается незапятнанно совокупность методов планирования экспериментов и обработки настоящих, полученных в плоде экспериментов, причем эти методы могут не покоиться на вероятностных моделях. При таковском машистом понимании вместо термина «математическая статистика» зачастую используют термин « анализ данных ». Исторически вначале сформировались методы обработки настоящих, не связанные узко с теорией вероятности, эдак называемая дескриптивная, описательная статистика . С взялась этого века начали интенсивно развиваться методы разбора настоящих, основанные на вероятностных моделях, - это, прежде итого, методы статистического оценивания и статистической проверки гипотез , о которых будет вышагивать выговор в данной книжке. неистовое развитие вычислительной техники вызвало к жизни линия новоиспеченных методов разбора. кое-какие из этих методов разработаны на основе подходов, отличных от теоретико-вероятностного (геометрические, оптимизационные и др.). Вероятностное их обоснование либо отсутствует, либо недостаточно, что затрудняет количественную оценку степени достоверности выводов и изыскание аналитическими оружиями классической математической статистики. Однако в финальные годы, также в связи с быстрым ростом производительности вычислительных машин, взялись получать распространение процедуры эдак называемого случайного моделирования (пермутационные методы, бут-стрэп), позволяющие оценить статистические свойства получаемых решений без аналитических методов. возьмемся рассмотрение методов математической статистики с ее отправного понятия - понятия случайной выборки. 1. СЛУЧАЙНАЯ ВЫБОРКА И ЕЕ ОПИСАНИЕ 1.1. Понятие случайной выборки Понятие случайной выборки узко связано с понятием случайного испытания и случайной величины, о коих шла речь в предыдущей главе. Случайная выборка мыслит собой совокупность наблюдений х , х ,..., , полученных в п суверенных случайных испытаниях. Число полученных наблюдений п зовется объемом выборки . Образно можно представить процесс получения случайной выборки незапятнанно извлечение наудачу значений из гипотетической нескончаемой  генеральной совокупности , где неодинаковые значения содержатся в пропорциях, соответствующих распределению случайной величины, и скрупулезно перемешаны между собой. Случайная размер может быть не единственно одномерной, однако и многомерной - , тогда всякая из компонент выборки  будет вектором. Конкретная случайная выборка - это просто-напросто набор значений случайной величины (скалярных или векторных). Однако при оценке информации, кою прет эта выборка, мы должны рассматривать ее незапятнанно одну из бесконечного числа потенциально мыслимых выборок объема п, т. е. как векторную п (очевидно, что в случае векторной случайной величины   сами будут векторными случайными величинами, однако во избежание чрезмерного усложнения обозначений мы доколе ограничимся одномерным случаем). Из обстоятельств получения выборки вытекает, что случайные величины имеют одинаковые функции распределения F ( x ), сходящиеся с функцией распределения исходной случайной величины . Кроме того, случайные величины  по определению случайной выборки самостоятельны, потому их совместная функция распределения равновелика творению одномерных функций распределения незапятнанно правило, информация, содержащаяся в выборке, интересует нас не столько сама по себе, сколько незапятнанно информация обо всей генеральной совокупности. Однако дабы отвечать этой мишени, выборка должна быть буквально организованной и солидной. наличествует особый раздел математической статистики - планирование выборочных обследований . Мы будем рассматривать единственно одинехонек способ получения выборки - простой случайный выбор . В принципе схема его проста: из скрупулезно перемешанной генеральной совокупности извлекается наудачу п значений. На практике, однако, подевало обстоит сложнее. Предположим, что мы отловили п взрослых животных обусловленного облика и измерили их массу. Какую генеральную совокупность представляет эта выборка? Всех зоологических настоящего облика, т. е. жительствующих в разных местах, прошедших и предбудущих? Или популяцию, обитающую в данной местности? Или популяцию, обитающую в данной местности в этот год? популярно, чем уже мы будем понимать генеральную совокупность, описываемую данной выборкой, тем теснее мы будем к истине, однако, мыслимо, тем меньший заинтересованность для нас она будет представлять. 1.2. Характеристики случайной выборки Итак, мы владеем случайную выборку х ,...,  с незнакомым распределением F ( x ) . незапятнанно нам умн/о велеть этими значениями, дабы получить зрелище о распределении F ( x ) , т.е. о генеральной совокупности, из которой извлечена эта выборка? Можно использовать следующий эвристический принцип - будем находить, что исследуемая нами генеральная совокупность домашня к гипотетической генеральной совокупности, заключающейся только из значений х ,..., , содержащихся в ней в равной пропорции, т.е. случайная величина , принимающей п значений х ,..., с вероятностями 1/ n (это, поистине, много-много информации о значениях случайной величины и их вероятностях, кою можно извлечь из выборки). Распределение случайной величины , а ее функция распределения  - эмпирической функцией распределения . Очевидно, что всякой выборке отвечает своя эмпирическая функция распределения, т.е. можно проронить, что  - случайная функция.  представляет собой ступенчатую функцию, возрастающую от 0 до 1 со скачками высью 1/ n в точках х ,..., (очевидно, если некоторое смысл повторяется k один, то ему будет отвечать один скачок величиной k / n). Можно обусловить эмпирическую функцию формулой , где - число значений выборки, не превосходящих х . образчик. - это длина лепестка случайно избранного цветка ириса многокрасочного ( Iris ). вытекающий линия чисел включает значения длин (в см Упорядочим эти значения по величине, т.е. представим их в облике эдак называемого вариационного ряда На рис. 1 представлено эмпирическое распределение случайной величины , для этой выборки, т.е. распределение случайной величины , а на рис. 2 - отвечающая эмпирическая функция распределения . Рис.1. образчик эмпирического распределения. Рис.2. Пример эмпирической функции распределения. Поскольку эмпирическая функция распределения  является оценкой для F ( x ) (можно доказать, что при вероятность того, что максимальное расхождение между  и F ( x , стремится к единице), можно взять характеристики  в качестве оценок характеристик генерального распределения. толще мы приводим полученные таковым образом формулы для кое-каких выборочных характеристик. Зная эмпирическую функцию распределения, можно найти эмпирические квантили, квартили и итерквартильную широту буквально так же, незапятнанно в случае обыкновенной (теоретической) функции распределения. А собственно, выборочная квантиль  порядка р получается как абсцисса точки пересечения горизонтальной ровный, пересекающей ось ординат в точке р, с эмпирической функцией распределения   (если пересечение не точка, а отрезок, то в качестве квантили можно взять абсциссу средины этого отрезка). Выборочные квантили , выборочную медиану , а разность  - выборочную интерквартильную широту. Еще одна характеристика разброса значений случайной величины - размах R определяется незапятнанно разность между максимальным и минимальным значением в выборке. Если наблюдается не одномерная, а двумерная случайная величина , т. е. выборка заключается из п , },{ , },…,{ , }, то можно вычислить выборочный коэффициент ковариации для целесообразно оценивать для дискретного и непрерывного генерального распределения по-различными способами. В дискретном случае оценкой моды будет смысл, столкнувшееся в выборке величайшее число раз. толще даны значения характеристик, вычисленные для ввергнутого возвышеннее образца настоящих о длинах лепестков ириса. В непрерывном случае повторяющиеся значения неплотны или вообще отсутствуют, потому вытекает расколотить диапазон изменения наблюденных значений точками , ,... , , ], ( , ], ..., ( , и в качестве выборочной моды взять средину интервала, в который попало величайшее число значений. Рис.3. Пример гистограммы. , нагоревших в интервалы =1, 2, …, , можно представить графически. Построив над всяким интервалом i , мы получим эдак называемую гистограмму . Если при построении гистограммы резать не числом значений, нагоревших в интервалы, а их сравнительной частотой в выборке , то полученная гистограмма будет выборочным аналогом плотности непрерывного распределения. В частности, сумма площадей всех столбиков гистограммы будет равна единице, незапятнанно и для плотности распределения. Очевидно, что поскольку частоты , гистограммы для численностей и частот различаются единственно масштабом шкалы по оси ординат. На рис. 3 вогнан пример гистограммы для рассмотренной возвышеннее выборки, включающей 50 длин лепестков ириса (заметим, что рис. 3 можно рассматривать незапятнанно итог переустройства рис. 1 путем группировки значений по оси ординат). . обыкновенно число интервалов разбиения выбирают из расчета, дабы в всякий интервал нагорело в посредственном не менее десяти наблюдений (при чрезвычайно малых объемах выборки это число уменьшают). Таким образом, при увеличении объема выборки п можно уменьшать длины интервалов разбиения и более детально характеризовать выборку, а следственно, и порождающее ее генеральное распределение. По сравнению с эмпирической функцией распределения гистограмма более наглядна, однако при ее построении привносится элемент субъективизма. 2. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ 2.1. Логика статистического оценивания предположим, что у нас водится случайная выборка х , х ,..., . Распределение этой случайной величины может быть либо полностью незнакомым, либо частично знатным, скажем, может быть известна функциональная фигура его распределения (вид функции распределения или плотности в непрерывном случае и формулы, определяющей вероятности раздельных значений, - в дискретном). Если распределение безвестно, то нас могут интересовать различные его характеристики - математическое ожидание, мода, медиана, дисперсия, интерквартильная широта, моменты, асимметрия, эксцесс и т.д. Если вид распределения популярен, а безвестны лишь значения определяющих его параметров, нас могут интересовать также (или даже прежде всего) значения этих параметров, скажем, параметров  в случае нормального распределения, параметра  - в случае пуассоновского, параметра - в случае биномиального. Задача оценивания незнамого параметра или характеристики  состоит в вычислении на основе значений выборки х , х ,..., , в каком-то резоне тесной к оцениваемому параметру или характеристике и называемой точечной оценкой . Фактически мы решали задачу оценивания в предыдущем разделе, поскольку рассматривали выборочные математическое ожидание, дисперсию и т.д. незапятнанно оценки незнакомых генеральных характеристик. Однако этот подход к оцениванию был скорее интуитивным, и сейчас мы отведаем его формализовать. Эта формализация притрагивается уточнения резона близости выборочной оценки . приметим, прежде итого, что  является случайной величиной, значения коей меняются от выборки к выборке. Для некоторых выборок значение , для прочих - будет отдаленным. Можно, однако, потребовать, что желая бы в среднем оценки для неодинаковых выборок группировались кругом оцениваемого параметра, т.е. дабы выполнялось условие . Оценки, удовлетворяющие этому обстоятельству называются несмещенными . Отметим, что в подвластности от контекста мы рассматриваем  - незапятнанно это было в повергнутом определении несмещенности), либо незапятнанно алгебраическую формулу для вычисления значения оценки по выборке, либо просто-напросто незапятнанно конкретное смысл, полученное для конкретной выборки. Можно доказать, употребляя свойствами математического ожидания и определением выборки, что выборочное математическое ожидание (чаще используется термин выборочное среднее . поистине, имеем (мы воспользовались также тем очевидным фактом, что распределение любой компоненты выб


Похожие записи:

Последнии записи

Популярные записи

Hosted by uCoz