Доброе время суток, уважаемые Коллеги. Старый и надоевший вопрос - а что предложите Вы для проверки выборки на нормальность распределения? Величина выбоки - 400. Самых разных методов масса, а вот результаты у всех кардинально расходятся - беда. Очень хочется, чтобы Вы присылали ссылки на алгоритмы (или сами алгоритмы), которые Вы предлогаете.
Заранее благодарю!
gobel, 25.02.2007 15:56
Ну неужели никто никогда не проверял выборку на нормальность??? Не верю!
Urrу, 25.02.2007 21:55
Насколько я помню при размере выборки приближающемся к 100 проверять данные на нормальность уже не обязательно... До 30 - Колмогоров-Смирнов тест...
gobel, 26.02.2007 21:03
Дело в том, что обязательно надо проверять - у меня на этой проверке простроен фильтр.
Guest, 24.01.2008 17:44
День добрый. Прошу помощи по поводу определения нормального распределения. Выборка из 8871 позиций (признак количественый). Критерий Коломогрова-Смирнова имеет значение d=0.04827 p<0.1, критерий Лилифора p < 0.1. Как интерпретировать эти результаты? Нормально ли распределение? PS понятное дело вопрос элементарный, но я только начал ею заниматься, потому что дальше уже без нее никак.
Guest, 25.01.2008 01:55
(gobel @ 21.02.2007 02:01)
а что предложите Вы для проверки выборки на нормальность распределения?
Критерий Шапиро-Уилка. Есть в Origin, Statistics и наверно еще где-то. Ну например
Можно конечно и самому програмку наваять а можно и по другому. Как то (на примере origin 7.0)
1. экспортируете ваши данные в программу (как аски файл например) 2. выделяете колоночку с цифирками. 3. нажимаете сверху - statistics ->descriptive statistics->normality test 4. среди появившихся внизу цифирок, находите W и чему оно равно. например 0,947 5. пишите: данное распреление является нормальным с вероятностью 0,947 согласно критерию Шапиро-Уилка.
(Urrу @ 25.02.2007 21:55)
при размере выборки приближающемся к 100 проверять данные на нормальность уже не обязательно...
Хоть и есть присказка что 'все в этом мире распределено по гаусиане' , на самом деле это не так. поэтому, собственно и придумали всякие критерии для ее проверки. Поскольку это принципиально для... и тд. А вид распределения не зависит от размера выборки, от размера выборки зависит вероятность с которой можно этот вид установить.
Den-N, 25.01.2008 22:34
Для проверки распределения на нормальность предложено более 20 критериев. В книге Ефимов А.Н. Порядковые статистики - их свойства и приложения. М.: Знание, 1980 (книга болтается в сети в djvu) на стр. 46-47 приводятся результаты анализа мощности 20 критериев в зависимости от симметрии и эксцесса распределения. Кратко результаты: 1. Для асимметричных распредлений лучше находит различия критерий Шапиро-Уилка (на первом месте в рейтинге мощности). 2. Для симметричных: эксцесс < 3 - критерий Дэвида-Хартли-Пирсона эксцесс > 3 - критерий Филлибена (на втором месте- Шапиро-Уилка) 3. Для приблизительно нормального (эксцесс приблизительно равен 3) - критерий Дэвида-Хартли-Пирсона (на втором месте- Шапиро-Уилка).
Наверное можно построить сложный фильтр, выбирающий наиболее мощный способ проверки на нормальность в зависимости от результатов предварительного анализа формы распределения (асимметрия и эксцесс). Понятно, что с момента вопроса прошел год, но уж лучше поздно чем никогда . Тогда я Ефимова еще не читал, а тут снова эту тему достали...
guest: Аня , 23.04.2009 10:03
(Guest @ 24.01.2008 17:44)
День добрый. Прошу помощи по поводу определения нормального распределения. Выборка из 8871 позиций (признак количественый). Критерий Коломогрова-Смирнова имеет значение d=0.04827 p<0.1, критерий Лилифора p < 0.1. Как интерпретировать эти результаты? Нормально ли распределение? PS понятное дело вопрос элементарный, но я только начал ею заниматься, потому что дальше уже без нее никак.
Надо высчитать критическое значение статистики. посмотреть критическое значение можно тут: И если твоё значение меньше, то всё прекрасно по этому критерию. Но при больших выборках всё-таки необходимо использовать и критерий Пирсона (хи2). Также можно критерии на асимметрию и эксцесс посмотреть. Но они сами по себе ничего не доказывают. и не являются очень мощными. все критические значения и описания критериев есть тут: ГОСТ Р ИСО 5479—2002. Единственное для критерия Шапира-уилка там критических значений мало(лишь до 50 наблюдений), но если статистика близка к 1, то можно верить, что нормально распределено.
bubnilkin, 19.06.2010 08:03
здравствуйте!
как узнать вид распределения генеральной совокупности (а не выборки)?
Это — лёгкая версия форума. Чтобы попасть на полную, щелкните здесь.