Полная версия страницы  English  

Проверка выборки на нормальность

gobel, 21.02.2007 02:01
Доброе время суток, уважаемые Коллеги. Старый и надоевший вопрос - а что предложите Вы для проверки выборки на нормальность распределения? Величина выбоки - 400. Самых разных методов масса, а вот результаты у всех кардинально расходятся - беда. Очень хочется, чтобы Вы присылали ссылки на алгоритмы (или сами алгоритмы), которые Вы предлогаете.

Заранее благодарю!
gobel, 25.02.2007 15:56
Ну неужели никто никогда не проверял выборку на нормальность??? Не верю!
Urrу, 25.02.2007 21:55
Насколько я помню при размере выборки приближающемся к 100 проверять данные на нормальность уже не обязательно... До 30 - Колмогоров-Смирнов тест...
gobel, 26.02.2007 21:03
Дело в том, что обязательно надо проверять - у меня на этой проверке простроен фильтр.
Guest, 24.01.2008 17:44
День добрый.
Прошу помощи по поводу определения нормального распределения. Выборка из 8871 позиций (признак количественый). Критерий Коломогрова-Смирнова имеет значение d=0.04827 p<0.1, критерий Лилифора p < 0.1. Как интерпретировать эти результаты? Нормально ли распределение? PS понятное дело вопрос элементарный, но я только начал ею заниматься, потому что дальше уже без нее никак.
Guest, 25.01.2008 01:55
(gobel @ 21.02.2007 02:01)
Ссылка на исходное сообщение а что предложите Вы для проверки выборки на нормальность распределения?

Критерий Шапиро-Уилка. Есть в Origin, Statistics и наверно еще где-то.
Ну например

http://www.statplus.net.ua/ru/help/source/a_bst_norm.htm

Можно конечно и самому програмку наваять а можно и по другому. Как то (на примере origin 7.0)

1. экспортируете ваши данные в программу (как аски файл например)
2. выделяете колоночку с цифирками.
3. нажимаете сверху - statistics ->descriptive statistics->normality test
4. среди появившихся внизу цифирок, находите W и чему оно равно. например 0,947
5. пишите: данное распреление является нормальным с вероятностью 0,947 согласно критерию Шапиро-Уилка.

(Urrу @ 25.02.2007 21:55)
Ссылка на исходное сообщение при размере выборки приближающемся к 100 проверять данные на нормальность уже не обязательно...

Хоть и есть присказка что 'все в этом мире распределено по гаусиане' , на самом деле это не так. поэтому, собственно и придумали всякие критерии для ее проверки. Поскольку это принципиально для... и тд.
А вид распределения не зависит от размера выборки, от размера выборки зависит вероятность с которой можно этот вид установить.
Den-N, 25.01.2008 22:34
Для проверки распределения на нормальность предложено более 20 критериев. В книге Ефимов А.Н. Порядковые статистики - их свойства и приложения. М.: Знание, 1980 (книга болтается в сети в djvu) на стр. 46-47 приводятся результаты анализа мощности 20 критериев в зависимости от симметрии и эксцесса распределения. Кратко результаты:
1. Для асимметричных распредлений лучше находит различия критерий Шапиро-Уилка (на первом месте в рейтинге мощности).
2. Для симметричных:
эксцесс < 3 - критерий Дэвида-Хартли-Пирсона
эксцесс > 3 - критерий Филлибена (на втором месте- Шапиро-Уилка)
3. Для приблизительно нормального (эксцесс приблизительно равен 3) - критерий Дэвида-Хартли-Пирсона (на втором месте- Шапиро-Уилка).

Наверное можно построить сложный фильтр, выбирающий наиболее мощный способ проверки на нормальность в зависимости от результатов предварительного анализа формы распределения (асимметрия и эксцесс). Понятно, что с момента вопроса прошел год, но уж лучше поздно чем никогда smile.gif . Тогда я Ефимова еще не читал, а тут снова эту тему достали...
guest: Аня , 23.04.2009 10:03
(Guest @ 24.01.2008 17:44)
Ссылка на исходное сообщение  День добрый.
Прошу помощи по поводу определения нормального распределения. Выборка из 8871 позиций (признак количественый). Критерий Коломогрова-Смирнова имеет значение d=0.04827 p<0.1, критерий Лилифора  p < 0.1. Как интерпретировать эти результаты? Нормально ли распределение? PS понятное дело вопрос элементарный, но я только начал ею заниматься, потому что дальше уже без нее никак.


Надо высчитать критическое значение статистики.
посмотреть критическое значение можно тут: http://modeling.at.ua/publ/6-1-0-22
И если твоё значение меньше, то всё прекрасно по этому критерию.
Но при больших выборках всё-таки необходимо использовать и критерий Пирсона (хи2). Также можно критерии на асимметрию и эксцесс посмотреть. Но они сами по себе ничего не доказывают. и не являются очень мощными.
все критические значения и описания критериев есть тут: ГОСТ Р ИСО 5479—2002. Единственное для критерия Шапира-уилка там критических значений мало(лишь до 50 наблюдений), но если статистика близка к 1, то можно верить, что нормально распределено.
bubnilkin, 19.06.2010 08:03
здравствуйте!

как узнать вид распределения генеральной совокупности (а не выборки)?
Это — лёгкая версия форума. Чтобы попасть на полную, щелкните здесь.
Invision Power Board © 2001-2012 Invision Power Services, Inc.