| Термин | Определение |
| Доверительный уровень | Вероятность (обычно 90%, 95% или 99%), с которой интервал содержит истинное значение параметра |
| Ошибка выборки | Половина ширины доверительного интервала |
| Критическое значение | Величина из таблицы распределения (z или t), соответствующая выбранному доверительному уровню |
- Выборочное среднее (x̄)
- Стандартное отклонение (σ или s)
- Объем выборки (n)
- Выбранный доверительный уровень
- Определите выборочное среднее x̄
- Выберите доверительный уровень (1-α)
- Найдите z-значение для α/2
- Рассчитайте стандартную ошибку: σ/√n
- Вычислите границы интервала: x̄ ± z*(σ/√n)
| Шаг | Формула |
| 1 | Вычислите выборочное среднее x̄ |
| 2 | Рассчитайте стандартное отклонение выборки s |
| 3 | Найдите t-значение для (n-1) степеней свободы |
| 4 | Вычислите границы: x̄ ± t*(s/√n) |
CI = p̂ ± z*√(p̂(1-p̂)/n
- p̂ - выборочная доля
- z - критическое значение нормального распределения
- n - объем выборки
- Рассчитайте стандартную ошибку: SE = √(p̂(1-p̂)/n
- Добавьте поправку: 1/(2n) к каждой границе
- Убедитесь, что значения остаются в диапазоне [0,1]
| Тип данных | Функция |
| Нормальное распределение | scipy.stats.norm.interval() |
| t-распределение | scipy.stats.t.interval() |
| Доля | statsmodels.stats.proportion.proportion_confint() |
- t.test()$conf.int - для среднего
- prop.test()$conf.int - для доли
- confint() - для параметров моделей
| Параметр | Влияние на ширину |
| Объем выборки | Уменьшает при увеличении n |
| Доверительный уровень | Увеличивает при повышении |
| Разброс данных | Увеличивает при большем σ |
- Определите желаемую точность (максимальную ошибку)
- Оцените стандартное отклонение (по пилотным данным)
- Используйте формулу: n = (z*σ/E)²
- Увеличьте выборку на 10-15% для компенсации возможных потерь
- Утверждение, что параметр "попадает" в интервал (параметр фиксирован, интервал случаен)
- Смешение доверительного уровня с вероятностью покрытия
- Игнорирование предположений о распределении данных
"При многократном повторении эксперимента, 95% построенных таким образом доверительных интервалов будут содержать истинное значение параметра."
Пример расчета
| Параметр | Значение |
| Выборочное среднее | 50 |
| Стандартное отклонение | 10 |
| Объем выборки | 100 |
| 95% ДИ | 48.04 - 51.96 |
Доверительные интервалы являются мощным инструментом статистического вывода, позволяющим оценить точность оценок параметров.