Проверенная гипотеза это что

Проверка гипотез: что это такое и как сделать тест для вашей маркетинговой кампании?

Что такое проверка гипотез?

Если говорить проще, то это процесс наблюдения и формирования вопросов на основе собранной информации, и попытки ответить на него с помощью научных методик.

Прелесть этого тестированияв том, что оно проводится постепенно, есть время на обдумывание, а еще каждый этап фиксируется в записи. И хотя проверка гипотез — не новое явление, сейчас о нем немного забыли. Поэтому, если вы будете использовать методику в своей стратегии, можете рассчитывать на хорошее конкурентное преимущество. Итак, как же проводить тестирование? Разберемся, но сначала рассмотрим методологию.

Что такое гипотеза?

Это вопрос, основанный на конкретном наблюдении, которое вам нужно доказать. Чтобы вопрос стал гипотезой, он должен быть непременно доказуем — это основное условие. Например, вы можете доказать, что изменение заголовка в рекламном объявлении увеличит конверсию на 20%, но не сможете проверить вопрос «Поможет ли изменение заголовка увеличить конверсию?». Другими словами, гипотеза должна быть конкретной, а не расплывчатой.

Вот отличный пример.

Допустим, у вас есть десять постов в блоге. Два очень успешны. Они получают массу просмотров и шеров в социальных сетях. Вы заметили, что в успешных статьях больше изображений и более короткие абзацы, чем в других, менее успешных публикациях.

Тогда ваша гипотеза может быть следующей: «Будут ли другие статьи с большими изображениями и лучшим форматированием получать такое же внимание?»

Затем вы можете запустить тесты, чтобы оценить точность вашей гипотезы. Это и есть проверка гипотезы.

Почему A / B-тестирование и многовариантное тестирование тоже классифицируется как проверка гипотез

Проверенная гипотеза это что

Такие популярные методы, как A / B-тестыи многовариантное тестирование, считаются проверкой гипотез.

Например, если вы запускаете рекламу для ретаргетинга, можете спросить, подходит ли ваше изображение, а также демографические настройки. Затем запустить A / B и многовариантные тесты, чтобы увидеть, есть ли увеличение трафика и продаж.

Проверенная гипотеза это что

Нулевая гипотеза и альтернативная гипотеза

Это термин из логической статистики, из которой также вытекает проверка гипотез. Нулевая гипотеза — утверждение, которое относится к гипотезе, которую вы пытаетесь доказать.

Например, если вы увеличиваете количество изображений в статьях блога с целью повышения количества просмотров, нулевая гипотеза — то, что не произойдет никаких изменений.

Это не тот результат, на который вы надеетесь, но он дает вам представление о том, что вы пытаетесь опровергнуть.

Проверенная гипотеза это что

Как использовать проверку гипотез правильно

Шаг 1: Решите, что тестировать

Выберете элементы, которые хотите улучшить. Как только у вас появится «испытуемый», считайте, что эксперимент начался.

Шаг 2: Определите свою гипотезу

В этом суть проверки гипотез. Вопрос, который вы зададите, чтобы затем попытаться его доказать.

Если реклама не конвертируется, вы можете спросить, достаточно ли убедителен креатив. Если ваши электронные письма не открываются, вы можете задаться вопросом, есть ли проблема в шаблоне или, наоборот, в его отсутствии.

Вопросы, которые вы зададите, станут основой для экспериментов.

Шаг 3: Определите ваши переменные

Используете ли вы A / B или многовариантное тестирование, или какой-либо другой способ тестирования гипотез, не важно. Выясните, какие изменения вы хотите внести, а затем начните тесты.

Шаг 4: Проверьте свои гипотезы

С вашей первоначальной гипотезой, нулевой гипотезой и альтернативной гипотезой, которую вы только что получили, начните процесс тестирования.

Шаг 5: Рассчитайте свои результаты, проанализируйте и действуйте

Дайте каждому тесту время, чтобы сгенерировать адекватные данные. Не спешите. Вносить изменения в зависимости от прихотей или эмоций — совсем не лучшее решение.

Вместо этого следуйте фактам. Если ваши гипотезы действительно подтвердятся, вы получите доказательство того, что ваши изменения работают

Если нулевые или альтернативные гипотезы доказаны, найдите другие переменные.

После того, как вы получили результаты тестов по рекламе, вашей посадочной странице и готовы к запуску рекламной кампании, запускайте ее. Например, через программатик платформу. Зарегистрируйтесь прямо сейчас.

Источник

BYYD. Блог

Проверка гипотез: что это такое и как сделать тест для вашей маркетинговой кампании?

Проверенная гипотеза это что

При попытке оптимизировать свою стратегию, вы можете столкнуться с таким понятием, как проверка гипотез. Этот термин звучит научно и может показаться сложным, но действительно может помочь в улучшении маркетинга компании и получения большого количества конверсий. Наиболее хорошо проверка гипотез работает с B2B-компаниями.

Что такое проверка гипотез?

Если говорить проще, то это процесс наблюдения и формирования вопросов на основе собранной информации, и попытки ответить на него с помощью научных методик.

Прелесть этого тестирования в том, что оно проводится постепенно, есть время на обдумывание, а еще каждый этап фиксируется в записи. И хотя проверка гипотез — не новое явление, сейчас о нем немного забыли. Поэтому, если вы будете использовать методику в своей стратегии, можете рассчитывать на хорошее конкурентное преимущество. Итак, как же проводить тестирование? Разберемся, но сначала рассмотрим методологию.

Что такое гипотеза?

Это вопрос, основанный на конкретном наблюдении, которое вам нужно доказать. Чтобы вопрос стал гипотезой, он должен быть непременно доказуем — это основное условие. Например, вы можете доказать, что изменение заголовка в рекламном объявлении увеличит конверсию на 20%, но не сможете проверить вопрос «Поможет ли изменение заголовка увеличить конверсию?». Другими словами, гипотеза должна быть конкретной, а не расплывчатой.

Вот отличный пример.

Допустим, у вас есть десять постов в блоге. Два очень успешны. Они получают массу просмотров и шеров в социальных сетях. Вы заметили, что в успешных статьях больше изображений и более короткие абзацы, чем в других, менее успешных публикациях.

Тогда ваша гипотеза может быть следующей: «Будут ли другие статьи с большими изображениями и лучшим форматированием получать такое же внимание?»

Затем вы можете запустить тесты, чтобы оценить точность вашей гипотезы. Это и есть проверка гипотезы.

Почему A / B-тестирование и многовариантное тестирование тоже классифицируется как проверка гипотез

Проверенная гипотеза это что

Такие популярные методы, как A / B-тесты и многовариантное тестирование, считаются проверкой гипотез.

Например, если вы запускаете рекламу для ретаргетинга, можете спросить, подходит ли ваше изображение, а также демографические настройки. Затем запустить A / B и многовариантные тесты, чтобы увидеть, есть ли увеличение трафика и продаж.

Проверенная гипотеза это что

Нулевая гипотеза и альтернативная гипотеза

Это термин из логической статистики, из которой также вытекает проверка гипотез. Нулевая гипотеза — утверждение, которое относится к гипотезе, которую вы пытаетесь доказать.

Например, если вы увеличиваете количество изображений в статьях блога с целью повышения количества просмотров, нулевая гипотеза — то, что не произойдет никаких изменений.

Это не тот результат, на который вы надеетесь, но он дает вам представление о том, что вы пытаетесь опровергнуть.

Проверенная гипотеза это что

Как использовать проверку гипотез правильно

Шаг 1: Решите, что тестировать

Выберете элементы, которые хотите улучшить. Как только у вас появится «испытуемый», считайте, что эксперимент начался.

Шаг 2: Определите свою гипотезу

В этом суть проверки гипотез. Вопрос, который вы зададите, чтобы затем попытаться его доказать.

Если реклама не конвертируется, вы можете спросить, достаточно ли убедителен креатив. Если ваши электронные письма не открываются, вы можете задаться вопросом, есть ли проблема в шаблоне или, наоборот, в его отсутствии.

Вопросы, которые вы зададите, станут основой для экспериментов.

Шаг 3: Определите ваши переменные

Используете ли вы A / B или многовариантное тестирование, или какой-либо другой способ тестирования гипотез, не важно. Выясните, какие изменения вы хотите внести, а затем начните тесты.

Шаг 4: Проверьте свои гипотезы

С вашей первоначальной гипотезой, нулевой гипотезой и альтернативной гипотезой, которую вы только что получили, начните процесс тестирования.

Шаг 5: Рассчитайте свои результаты, проанализируйте и действуйте

Дайте каждому тесту время, чтобы сгенерировать адекватные данные. Не спешите. Вносить изменения в зависимости от прихотей или эмоций — совсем не лучшее решение.

Вместо этого следуйте фактам. Если ваши гипотезы действительно подтвердятся, вы получите доказательство того, что ваши изменения работают

Если нулевые или альтернативные гипотезы доказаны, найдите другие переменные.

После того, как вы получили результаты тестов по рекламе, вашей посадочной странице и готовы к запуску рекламной кампании, запускайте ее. Например, через программатик платформу. Зарегистрируйтесь прямо сейчас.

Источник

Интуитивное объяснение проверки гипотез и p-значение

Привет, Хабр! Представляю вашему вниманию перевод статьи «An intuitive explanation of Hypothesis Testing and P-Values» автора Joos Korstanje.

Несколько лет назад я делал свою первую фриланс-работу по статистике для компании по доставке фруктов и овощей. Двадцать четыре часа в день поступающие продукты от фермеров до того, как были отправлены в супермаркеты, проходили через отдел по контролю за качеством. Выбор продуктов осуществлялся случайно работниками данного отдела.

В годовом отчёте они заметили, что качество в этом году ниже, чем качество в прошлом: разница составила примерно половину пункта по шкале от 1 до 10.

Потом пригласили меня. Я должен был ответить на вопрос:

Являются ли эти 0,5 пунктов существенной разницей?

Если вы не знаете статистику, то этот вопрос может показаться вам странным. Но не беспокойтесь: цель этой статьи показать вам как можно ответить на этот вопрос, используя проверку гипотез, также называемое статистическим выводом.

Игра в числа: вклад одного яблока

Представьте себе, что вы проверяете яблоко на предмет хорошее оно или плохое, используя случайную выборку яблок из очень большой коробки с яблоками. В изображении ниже мы видим реальный эффект размера выборки на измерения: эффект одного яблока очень существенен для маленьких выборок и становится менее и менее значимым, чем больше размер выборки.

Проверенная гипотеза это что

Вклад одного яблока зависит от размера выборки.

Понимание влияния размера выборки — это первый базис для понимания проверки гипотез. Мы можем начать утверждать, что 0.5 на 2 яблоках будет как разница в 1 яблоко, очень маленькая. Но на 100 яблоках, 0.5 будет представлять собой разницу в 50 яблок: очень большая разница!

На малых выборках 0.5 пункта это небольшая разница, но на больших выборках 0.5 это разница большая.

Насколько большая должна быть выборка: проверка гипотез и значимость как ответ

Есть несколько способов, чтобы ответить на данный вопрос, но в этой статье я собираюсь погрузиться в статистический вывод или проверку гипотез.

Проверка гипотез — это семейство статистических методов используемых, чтобы понять, как выборка наблюдаемых объектов может использоваться, чтобы принять или отвергнуть заранее поставленную гипотезу. Проверка гипотез используется для решения многих задач, в основном в научных исследованиях и как ключевой метод в онлайн маркетинге (А\Б тестирование).

Математики разработали проверку гипотез таким образом, что существует определённая процедура для поиска истины.

Проверка гипотез позволяет только проверить гипотезы, но не разработать их.

Из коробки, в которой 100 яблок (назовём её генеральной совокупностью), мы возьмём выборку из 8 яблок. В этом году из 8 яблок 5 оказались гнилыми (62%), а в выборке прошлого года из 8 яблок было только 4 гнилых (50%). Мы хотим использовать проверку гипотез, чтобы определить стал ли процент гнилых яблок в этом году больше, чем в прошлом.

Проверка гипотез — это математическая альтернатива для измерения генеральной совокупности. Благодаря этим вычислениям мы можем обобщить измерения небольшой выборки на большую генеральную совокупность. Так мы проделываем меньше работы.

Проверенная гипотеза это что

Случайно набранная выборка имеет такой же процент гнилых яблок, как и генеральная совокупность, при условии, что набранная выборка достаточно велика.

Математики придумали способ, как обобщить вывод, основанный на выборке, на генеральную совокупность.

Этот способ начинается с формулировки чёткой исследовательской гипотезы. К сожалению, математика работает только в том случае, если у нас уже есть представление о том, что мы хотим проверить.

Основная гипотеза для нашего примера:

Процент гнилых яблок в генеральной совокупности в этом году, больше чем в прошлом.

Фактическая проверка гипотезы

Математика проверки гипотез образует баланс между результатом измерений выборки с числом наблюдений. Результатом будет p-значение.

Эти вычисления проходят через использование распределений: почти для каждой воображаемой ситуации был выведен математический закон, который описывает ожидаемый результат.

Для вопросов вида «да/нет», таких как вопрос о наших гнилых яблоках (гнилые/не гнилые), применяется закон подбрасывания монетки. Это самый простой пример математического закона: 50% выпадения решки, 50% орла.

Также очень просто это может быть представлено, как стандартное математическое распределение, которое скажет нам о вероятности наблюдений. Для примера, 7 орлов выпало из 10 подбрасываний монетки. Это называется биноминальным распределением и может быть изображено так:

Проверенная гипотеза это что
биноминальное распределение 10 подбрасываний монетки.

В этой статье я буду далек от тяжёлой математики, но важно знать, что мы можем использовать математические формулы для оценки того, является ли наблюдаемый процент далеким от ожидаемого процента.

В конце этой статьи я дам вам список часто используемых формул проверки гипотез для различных случаев и после объясню, как их использовать. Но сначала я объясню интерпретацию проверки гипотез.

Результат проверки гипотез: p-value

За проверкой гипотез есть математический баланс между наблюдаемыми значениями и размером выборки. В конце вычислений каждый существующий вариант тестирования гипотез выдаст стандартизированную оценку, которая позволит сравнить результат, даже когда математика не совсем одинакова.

P-value это стандартный способ, чтобы сформулировать результат проверки гипотез и использовать его в любых других тестах.

P-value это число между 0 и 1, которое говорит нам, если разница между нашим наблюдениями выборок, и наши гипотезы сильно различаются. Опорное значение – это 0.05.

Разница статистически значима, если p-value меньше 0.05.
И разница статистически не значима, если p-value больше 0.05.

Мы сделали 10 подбрасываний монетки.
Наша гипотеза: мы ожидаем 5 решек.
Наши наблюдения: мы получили 6 решек.
Вычисление p-value дало 0.518, что больше, чем 0.05.
Наш вывод: разница статистически не значима.
Наша интерпретация: результат соответствует гипотезе.

Мы сделали 10 подбрасываний монетки
Наша гипотеза: мы ожидаем 5 решек.
Наш результат: мы получили 10 решек.
Наше p-value — 0.0, что меньше чем 0.05.
Наше заключение: разница статистически значима
Наша интерпретация: результат не соответствует гипотезе.

Мы проверили 10 яблок.
Наша гипотеза: мы ожидаем 1 гнилое яблоко.
Наш результат: мы получили 1 гнилых яблок.
Наше p-value — 1.0 что больше, чем 0.05.
Наше заключение: разница статистически не значима
Наша интерпретация: результат соответствует гипотезе.

Мы проверили 10 яблок.
Наша гипотеза: мы ожидаем 1 гнилое яблоко.
Наш результат: мы получили 5 гнилых яблок.
Наше p-value — 0.0114 что меньше, чем 0.05.
Наше заключение: разница статистически значима
Наша интерпретация: результат не соответствует гипотезе.

Заключение

В этой статье я дал интуитивную интерпретацию общей структуры статистических погрешностей или проверки гипотез. Я надеюсь, что теперь вы лучше понимаете проверку гипотез, и чем она может быть вам полезна.

Я не уходил глубоко в математические доказательства и в специфичные детали. В таблице ниже приведен список самых частых проверок гипотез, которые я рекомендую для дальнейшего изучения.

Название тестаАльтернативная гипотезе
Тест одной выборкиЗначение пременной отлично от ожидаемого значения
Тест двух выборокЗначение двух групп различно
ANOVAЗначение больше чем двух групп различно
Пропорциональная z проверкаПроцент успеха переменной из двух возможных вариантов отлично от ожидаемого значения
Двухпропарциаоная z-проверкаПроцент успеха переменной с двумя исходами различно между двумя группами

Список с альтернативными гипотезами для некоторых проверок гипотез.

Я надеюсь эта статья будет полезна для вас, и желаю вам удачи в дальнейших исследованиях проверки гипотез.

Источник

Мир статистических гипотез

В современном мире мы обладаем все большим и большим объемом данных о событиях, происходящих вокруг. Зачастую у нас появляются вопросы, на которые хотелось бы быстро ответить на основе имеющейся информации, для этого как нельзя лучше подходит процесс, связанный с проверкой статистических гипотез. Однако, многие считают, что это занятие подразумевает под собой большое число вычислений и в принципе довольно сложно для понимания. На самом деле, алгоритм проверки гипотез достаточно прост, а для осуществления расчетов с каждым годом появляется все больше и больше готовых инструментальных средств, не требующих от человека глубоких познаний в области. Далее я попытаюсь показать, что мало того, что процесс проверки гипотез может быть полезным, так и осуществляется достаточно быстро и без серьезных усилий.

Проверенная гипотеза это что

Статистические гипотезы и области их применения

Проверка статистических гипотез является важнейшим классом задач математической статистики. С помощью данного инструмента можно подтвердить или отвергнуть предположение о свойствах случайной величины путем применения методов статистического анализа для элементов выборки. Если в предыдущем предложении какие-либо термины являются не совсем понятными, ниже можно найти пояснение на простом языке.

Для проверки статистических гипотез зачастую применяются статистические тесты, о которых будет рассказано далее.

Алгоритм проверки статистической гипотезы

В обобщенном виде алгоритм выглядит таким образом:

Формулировка основной (H0) и альтернативной (H1) гипотез

Выбор уровня значимости

Выбор статистического критерия

Определения правила принятия решения

Итоговое принятие решения на основе исходной выборки данных

Данные шаги являются унифицированными и схему можно использовать почти во всех случаях. Далее подробнее рассмотрим пример работы данного алгоритма на конкретных данных.

Пример проверки статистической гипотезы

Итак, как вы, наверное, догадались по вышеприведенным примерам, будем проверять гипотезу о том, что имеется существенное различие между числом созданных европейских AI-стартапов в 2019-м и 2020-м годах. Пример достаточно простой, чтобы было проще разобраться в ходе работы алгоритма.

Проверка гипотезы о законе распределения

Для данных 2019-го года проверим нормальность распределения.

H0: случайная величина распределена нормально

H1: случайная величина не распределена нормально

Пусть уровень значимости alpha = 0.05 (как и в 95-ти процентах статистических тестов). Определение уровня значимости достойно отдельного поста, так что не будем заострять на нем внимание.

Будет использован критерий Шапиро-Уилка.

Проверенная гипотеза это что, Проверенная гипотеза это что, Проверенная гипотеза это что, Проверенная гипотеза это что;

Можно сравнить статистику W с критическим значением Wкрит. Критическое значение чаще всего приведено в готовых таблицах (по строкам/столбцам там отмечен объем выборки и уровень значимости, а на пересечении как раз-таки и лежит Wкрит.). Если W>Wкрит., то не отвергаем H0 и наоборот. Но это не очень удобно, поэтому чаще используется второй способ.

Разнообразие статистических критериев

Как мы увидели на примере, важным шагом в проверке статистической гипотезы является выбор критерия. В примере выше я использовала лишь два статистических критерия, но по факту их гораздо больше, так сказать, на все случаи жизни. Данные критерии важно знать и четко нужно осознавать, когда и какой можно применить. Многие из них направлены на сравнение центров распределений случайных величин, например, сравнение средних, медиан, равенство параметра распределения какому-либо числу и т. д. В основном они делятся на параметрические (знаем закон распределения случайной величины) и непараметрические.

Для вашего удобства внизу (рис. 3) приведена таблица с основными, с моей точки зрения, критериями сравнения центров распределения и их классификацией. Надеюсь, она будет вам полезна, ее можно дополнять и расширять по вашему желанию.

Источник

Проверка статистических гипотез: основные понятия и примеры

Статистические гипотезы: основные понятия. Шаги проверки гипотез

Например, необходимо выяснить, значительно ли отличается средний объём продаж после проведения рекламной кампании от среднего объёма продаж после проведения рекламной кампании. Если ответ на этот вопрос положителен, то можно сделать вывод о том, что изменения являются результатом рекламной кампании.

Выводы, полученные путём проверки статистических гипотез, носят вероятностный характер: они принимаются с некоторой вероятностью. Статистическая гипотеза может быть также предположением о свойствах двух совокупностей, если, например, в ходе мероприятий имело место воздействие только на одну совокупность и необходимо сделать вывод о том, было ли это воздействие результативным.

Шаги проверки статистических гипотез следующие:

Рассмотрим эти шаги и связанные с ними понятия подробнее.

Статистические гипотезы: основная и альтернативная

Приведём примеры того, как формулируются основная и альтернативная гипотезы.

Пример 1. До и после проведения рекламной кампании были собраны данные о среднем объём продаж.

Основная гипотеза H 0 : средний объём продаж до проведения рекламной кампании незначительно отличается от среднего объёма продаж после проведения рекламной кампании.

Альтернативная гипотеза H 1 : средний объём продаж изменился после проведения рекламной кампании.

Пример 2. После изменения конфигурации компьютерной сети были собраны случайным образом 200 замеров скорости передачи сообщений.

Основная гипотеза H 0 : изменение конфигурации не имело эффекта.

Альтернативная гипотеза H 1 : эффект от изменения статистически значим.

Статистические критерии для проверки гипотез

По значению этой характеристики принимается решение, принимать основную гипотезу или нет. Статистические критерии бывают двух видов:

Свойства статистического критерия:

Уровень значимости α, ошибки первого и второго рода

При проверке гипотезы всегда существует вероятность того, что будет сделано ошибочное заключение. Существуют два рода ошибки.

Со значением уровня значимости связано значение уровня доверия p.

Пример 3. В лаборатории фармацевтического предприятия делается контрольный замер на соответствие контрольного состава лекарственных препаратов стандарту. Какие варианты гипотез могут быть предложены?

В первом случае, принимая во внимание, что вероятность принятия основной гипотезы высока, мы имеем высокий риск нежелательных последствий принятия неверной гипотезы. Во втором случае, даже если мы будем вынуждены принять гипотезу, что лекарственные препараты не соответствуют стандарту, а на самом деле имеет место ошибка второго рода, придётся провести дополнительные контрольные замеры и более тщательно провести анализ химического состава. В любом случае, это повлечёт за собой более тщательный анализ, а риск нежелательных последствий может оказаться не столь значимым.

По причинам, которые мы выяснили в примере 3, статистические гипотезы часто формулируются следующим образом: «статистическая значимость между факторами незначима», «выборки незначимо отличаются по своим свойствам», «фактор не имеет значимого влияния на исследуемый процесс».

Нахождение границ области принятия гипотезы

В случае, если используется односторонний критерий, ОПГ включает в себя подмножество положительных значений критерия. В таком случае у критерия есть только одна критическая область.

В случае, если используется двусторонний критерий, который может принимать как положительные, так и отрицательные значения, у него имеются две критические области: подмножество отрицательных и подмножество положительных значений критерия, при которых гипотеза не может быть принята.

На этом шаге требуется найти такое подмножество значений критерия, к которому значение выбранного критерия будет принадлежать с вероятностью p. Точнее, необходимо найти крайние значения критерия в этом подмножестве.

Поэтому процедура нахождения границ области принятия гипотезы сводится к решению следующей задачи:

вероятность того, что значения критерия принадлежат области принятия гипотезы,

левое и правое критические значения области принятия гипотезы (критические точки).

Проверенная гипотеза это что

Проверенная гипотеза это что

Проверенная гипотеза это что

Проверенная гипотеза это что

Проверенная гипотеза это что

Проверенная гипотеза это что

То есть задача решается путём взятия обратной функции от прямой функции распределения.

Обратным значением функции распределения с аргументом b Проверенная гипотеза это чтоявляется такое значение случайной величины a, при котором выполняется следующее условие:

Проверенная гипотеза это что.

В случае с односторонним критерием получаем следующую формулу для нахождения критической точки:

Проверенная гипотеза это что.

Вне зависимости от типа критерия для того, чтобы найти квантили функции распределения, которому подчиняется критерий, необходимо знать параметры этой функции (например, если критерий подчиняется нормальному закону, то его параметрами являются математическое ожидание и стандартное отклонение). Значение параметров оценивается на выборках.

Вывод о принятии или отвержении основной гипотезы

В случае, если значение критерия, найденное на выборочных значениях наблюдений принадлежит области принятия гипотезы, делается вывод о том, что нет возможности отвергнуть основную гипотезу.

В случае, если критерий принадлежит критической области, делается вывод о том, что нет возможности принять основную гипотезу. В таком случае принимается альтернативная гипотеза.

На рисунке ниже синим цветом изображена ось всевозможных значений критерия R, другие обозначения иллюстрируют попадание значения критерия в область принятия гипотезы или критическую область.

Проверенная гипотеза это что

Для того, чтобы быть в большей степени уверенности в своих суждениях о верности или неверности гипотезы, предпочитают применять несколько критериев и сравнивать результаты. Если в нескольких случаях критерий не смог попасть в область принятия гипотезы, то говорят, что получили согласованный результат и скорее всего гипотеза является ложной.

Проверка гипотезы о среднем генеральной совокупности

Часто бывает необходимо проверить, значимо ли отличается средний показатель совокупности от некоторого заданного значения, например, стандарта. В этом случае основная и альтернативная гипотезы могут быть записаны так:

Проверенная гипотеза это что;

Проверенная гипотеза это что.

При проверке гипотезы о среднем выборки в качестве статистического критерия часто применяется t-критерий Стьюдента, однако следует помнить, что этот критерий применим лишь тогда, когда данные выборки подчиняются нормальному закону распределения. Критические значения критерия, соответственно выбранному уровню значимости α и степени свободы v можно найти в приложениях книг по статистике, а если гипотеза проверяется с помощью компьютерной программы, например, STATISTICA, то программа выбирает его.

Проверенная гипотеза это что— среднее выборки,

Проверенная гипотеза это что— некоторое заданное среднее значение, например, стандарт,

Проверенная гипотеза это что— критическое значение t-критерия Стьюдента.

Пример 4. Производитель кваса решил выяснить, работает ли устройство заполнения бутылок соответственно стандарту. Основная и альтернативные гипотезы сформулированы так:

Проверенная гипотеза это что

Проверенная гипотеза это что

Для проверки случайным образом выбрали 20 бутылок, средний незаполненный уровень составил Проверенная гипотеза это чтомм, стандартное отклонение Проверенная гипотеза это чтомм.

Получаем фактическое значение статистического критерия:

Проверенная гипотеза это что.

Критическое значение t-критерия Стьюдента:

Проверенная гипотеза это что.

Так как Проверенная гипотеза это что, то есть фактическое значение статистического критерия меньше критического значения, то фактическое значение попадает в область принятия гипотезы. Следовательно, нет возможности отвергнуть основную гипотезу о том, что средний уровень незаполненности бутылки незначимо отличается от 50 мм.

Проверка гипотезы о виде закона распределения выборки

Статистические гипотезы для этой проверки формулируются следующим образом.

Основная гипотеза H 0 : распределение выборки незначимо отличается от предполагаемого (нормальное, экспоненциальное и др.).

Альтернативная гипотеза H 1 : распределение выборки значимо отличается от предполагаемого.

Критерий согласия показывает степень отличия эмпирической функции распределения (то есть значения, полученного из выборки) от гипотетической (теоретической, то есть предполагаемой до наблюдения). Чем меньше значение критерия, тем больше степень похожести эмпирического и теоретического распределений.

Применяются критерий хи-квадрат Пирсона и критерий Колмогорова-Смирнова. Однако существуют ограничения этих критериев. Для критерия хи-квадрат: в каждом интервале должно быть не менее 10 наблюдений. Для критерия Колмогорова-Смирнова: объём выборки должен быть более 50.

Формула оценки значения критерия хи-квадрат Пирсона:

Проверенная гипотеза это что,

Значение критерия Колмогорова-Смирнова рассчитывается следующим образом:

Проверенная гипотеза это что,

Проверенная гипотеза это что— эмпирическая функция распределения,

Проверенная гипотеза это что— теоретическая функция распределения.

Область принятия гипотезы:

Проверенная гипотеза это что,

Проверенная гипотеза это что,

Даже при проверке статистической гипотезы на компьютере область принятия гипотезы в этом случае нужно рассчитывать самостоятельно.

Пример 5. Имеются данные некоторой выборки. Используя критерии хи-квадрат и Колмогорова-Смирнова, при уровне значимости α=0,05 проверить гипотезы о

а) нормальном распределении;

б) равномерном распределении.

Решение.

а) Получены следующие значения критериев:

критерий хи-квадрат: 2,72 (число степеней свободы: 4; границы ОПГ: (0; 5,99));

критерий Колмогорова-Смирнова: 0,08 (границы ОПГ: (0; 0,18)).

Вывод относительно проверяемой гипотезы: с вероятностью 95% принимается основная гипотеза о том, что генеральная совокупность распределена по нормальному закону.

б) Получены следующие значения критериев:

критерий хи-квадрат: 8,45 (число степеней свободы: 3; границы ОПГ: (0; 5,99));

критерий Колмогорова-Смирнова: 0,21 (границы ОПГ: (0; 0,18)).

Вывод относительно проверяемой гипотезы: с вероятностью 95% отвергается основная гипотеза о том, что генеральная совокупность распределена по равномерному закону.

Проверка гипотезы об однородности выборок

Существует два вида гипотез об однородности выборок. Может быть проверена однородность выборок «в слабом»: выборки однородны «в слабом», если незначимо отличаются их параметры, прежде всего, среднее. Может быть проверена однородность выборок «в сильном»: выборки однородны «в сильном», если незначимо отличаются их законы распределения.

С помощью критерия Стьюдента проверяется гипотеза об однородности выборок «в слабом». В этом случае основная гипотеза формулируется следующим образом: математическое ожидание первой выборки незначимо отличается от математического ожидания второй выборки. Формально это записывается так: Проверенная гипотеза это что.

Критерий рассчитывается по формуле:

Проверенная гипотеза это что

Проверенная гипотеза это чтои Проверенная гипотеза это что— дисперсии первой и второй выборок;

Критерий может принимать значения от минус бесконечности до плюс бесконечности. Чем ближе значения критерия к нулю, тем больше вероятность, что основная гипотеза будет верной (при этом знак не имеет значения).

При проверке гипотезы об однородности выборок с помощью критерия Стьюдента необходимо помнить, что к выборкам выдвигаются допущение, нарушение которых не позволяет применить критерий:

Пример 6. Имеются данные некоторой выборки. По ним в пакете программных средств STATISTICA вычислены следующие показатели:

Среднее 1-й выборкиСреднее 2-й выборкиt-критерийЧисло степеней свободыp-level
19,6028,21-1,38480,17

Область принятия гипотезы при уровне значимости α = 0,05 : (-2,01; 2,01)

Сделать вывод об однородности выборок.

Значение t-критерия попадает в область принятия гипотезы. Может быть принята основная гипотеза о том, что математическое ожидание первой выборки незначимо отличается от математического ожидания второй выборки. Таким образом, проверена гипотеза об однородности выборок в слабом.

С помощью критерия Колмогорова-Смирнова проверяется гипотеза об однородности выборок «в сильном», то есть о том, что функции распределения выборок незначимо отличаются друг от друга. За основу критерия Колмогорова-Смирнова выступает статистика

Проверенная гипотеза это что

максимальная по модулю разность между двумя функциями распределения выборок x и y.

Критерий рассчитывается по формуле

Проверенная гипотеза это что

Границы области принятия гипотезы определяются следующим образом:

Проверенная гипотеза это что.

Если критерий принадлежит области принятия гипотезы, то при заданном уровне значимости α нет возможности её отвергнуть, следовательно, принимается гипотеза о том, что выборки однородны «в сильном».

Гипотезы об однородности выборок могут быть выдвинуты как в исследованиях поведения человека, так и технических науках.

Пример 7. По данным некоторой выборки получены следующие показатели:

Макс. отриц. разностьМакс. полож. разностьЗначение критерия K.S.p-level
-0,20,080,117>10

Область принятия гипотезы при уровне значимости α = 0,05 : (0; 0,189)

Сделать вывод об однородности выборок.

Значение критерия попадает в область принятия гипотезы. Следовательно, принимается основная гипотеза о том, что функции распределения двух выборок незначимо отличаются. Таким образом, выборки однородны «в сильном».

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *