Термин · Глоссарий B2B-ПО

Степени свободы (Degrees of Freedom)

Q: Почему при расчёте выборочной дисперсии делят на n−1, а не на n?

Потому что оценивая среднее, мы «теряем» одну степень свободы. Деление на n−1 даёт несмещённую оценку генеральной дисперсии.

Q: Как df влияет на p-value в t-тесте?

Чем меньше df, тем «тяжелее» хвосты t-распределения, тем больше нужно отличие средних для достижения того же p-value. Малые df = меньше статистической мощи.

Q: Что такое степени свободы в нейронных сетях?

Число обучаемых параметров (весов). Большее число параметров увеличивает выразительность модели, но и риск переобучения на малых данных.

Q: Как рассчитать df для ANOVA?

Между группами: K−1 (K – число групп). Внутри групп: N−K (N – общее число наблюдений). Суммарно: N−1.

Q: Влияет ли df на выбор статистического критерия?

Да. При df > 30 t-распределение практически совпадает с нормальным, и можно использовать z-критерий. При df < 30 необходим t-критерий.

Степени свободы (Degrees of Freedom, df) – число независимых значений, которые могут свободно изменяться при оценке статистических параметров. Ключевой параметр при применении t-критерия, F-критерия, хи-квадрат и ANOVA в аналитике и машинном обучении.

Буква «С» В категориях: 3 Платформ: 6+

Введение

Степени свободы (Degrees of Freedom, df) – фундаментальный статистический параметр, определяющий количество независимых данных, «свободных» для вариации при оценке параметров модели. Концепция была формализована Рональдом Фишером в 1920-х годах и с тех пор стала неотъемлемым элементом любого статистического анализа: от t-критерия Стьюдента до нейросетевых архитектур, где она связана с ёмкостью модели.

История и контекст

Сам термин ввёл в оборот Рональд Фишер, разрабатывая методы дисперсионного анализа (ANOVA). Карл Пирсон ранее ошибался в расчётах chi-square теста, не учитывая потерю одной степени свободы на оценку среднего. Фишер исправил эту ошибку в 1922 году, заложив основу современной статистики. Сегодня df используется в прикладном анализе данных, BI-инструментах, ML-фреймворках и научных вычислениях.

Как это работает

Интуиция: если у вас есть выборка из n наблюдений и вы оценили выборочное среднее, то из n наблюдений уже только n−1 могут «свободно» меняться – последнее значение полностью определено остальными и средним. Отсюда df = n − 1 для выборочной дисперсии.

t-критерий (одновыборочный): df = n − 1.
t-критерий (двухвыборочный): df = n₁ + n₂ − 2 (при равных дисперсиях).
Хи-квадрат тест: df = (r − 1)(c − 1), где r – строки, c – столбцы таблицы сопряжённости.
Линейная регрессия: df для остатков = n − k − 1, где k – число предикторов.
ANOVA: df между группами = K − 1; df внутри групп = N − K.

В нейронных сетях термин используется в более широком смысле: число свободных параметров модели (весов) определяет её «ёмкость» и склонность к переобучению.

Где применяется

A/B-тестирование – определение статистической значимости различий между группами с помощью t-тестов.
Machine Learning – ANOVA для оценки значимости признаков; чи-квадрат для категориальных переменных.
BI и отчётность – инструменты типа Power BI, Tableau и OWOX BI автоматически рассчитывают df при построении статистических моделей.
Биомедицина и фармация – клинические испытания используют df для выбора критериев при малых выборках.
Финансовый анализ – оценка регрессионных моделей волатильности и риска.

Преимущества и ограничения

Правильный учёт df обеспечивает несмещённые оценки дисперсии и верные p-value. Игнорирование df (например, деление на n вместо n−1) даёт смещённые оценки, что в медицинских или финансовых расчётах может иметь серьёзные последствия. Ограничение: при малых df (n < 30) t-распределение существенно отличается от нормального, и использование z-критерия некорректно.

Связь с другими понятиями

Степени свободы неразрывно связаны с описательной аналитикой (descriptive analytics), диагностической аналитикой (diagnostic analytics) и методами машинного обучения. В контексте регрессионных моделей df напрямую влияет на adjusted R² – метрику качества модели, учитывающую число предикторов.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Степени свободы».

Платформы класса «Степени свободы»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Job BestFitMe

Система оценки кандидатов при приеме на работу

Цена по запросу

Подробнее →

ФО

ФотоКоллаж

Цена по запросу

Подробнее →

ПрограмБанк.БизнесАнализ

Управление предприятием

ПрограмБанк.БизнесАнализ — российская BI-платформа в архитектуре хранилища данных для финансовых организаций....

Цена по запросу

★ 4.7

Подробнее →

Конфигуратор для IP-ПАК

Программный конфигуратор для интеллектуального программно-аппаратного комплекса видеонаблюдения (IP-ПАК). Уста...

Цена по запросу

Подробнее →

КЦ

Комплексное цифровое решение по управлению инфраструктурой Amelia 2.0

Управление предприятием

Комплексная цифровая платформа для управления эксплуатацией объектов недвижимости (Facility Management / CAFM)...

Цена по запросу

★ 4.2

Подробнее →

1С:КРС

Управление предприятием

Отраслевое решение на платформе 1С:Предприятие 8 для автоматизации зоотехнического и племенного учёта в хозяйс...

Цена по запросу

★ 4.7

Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Степени свободы».

Данные и аналитика Машинное обучение BI-платформы

Где применяется

Отрасли, в которых «Степени свободы» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Здравоохранение и медицина

Финансы и финтех

Фармацевтика

Наука и НИИ

Частые вопросы про Степени свободы

Почему при расчёте выборочной дисперсии делят на n−1, а не на n?

Потому что оценивая среднее, мы «теряем» одну степень свободы. Деление на n−1 даёт несмещённую оценку генеральной дисперсии.

Как df влияет на p-value в t-тесте?

Чем меньше df, тем «тяжелее» хвосты t-распределения, тем больше нужно отличие средних для достижения того же p-value. Малые df = меньше статистической мощи.

Что такое степени свободы в нейронных сетях?

Число обучаемых параметров (весов). Большее число параметров увеличивает выразительность модели, но и риск переобучения на малых данных.

Как рассчитать df для ANOVA?

Между группами: K−1 (K – число групп). Внутри групп: N−K (N – общее число наблюдений). Суммарно: N−1.

Влияет ли df на выбор статистического критерия?

Да. При df > 30 t-распределение практически совпадает с нормальным, и можно использовать z-критерий. При df < 30 необходим t-критерий.

О термине

Название Степени свободы

English Degrees of Freedom

Раздел Глоссарий

Категорий 3

Отраслей 4

Платформа на связи

Подберём решение по этому классу

Поможем выбрать платформу Степени свободы под бюджет и стек, сравним аналоги, дадим демо у вендора.

Подобрать решение Сравнить

Категории

Данные и аналитика Машинное обучение BI-платформы

Применение по отраслям

Здравоохранение и медицина Финансы и финтех Фармацевтика Наука и НИИ

Другие термины

Демон Интерактивная визуализация доступность Инженер по компьютерному зрению Токенизация карты

Весь глоссарий

Алфавитный указатель

А Б В Г Д Е Ж З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Э Ю Я

Введение

История и контекст

Как это работает

Где применяется

Преимущества и ограничения

Связь с другими понятиями

Связанные термины

Платформы класса «Степени свободы»

Job BestFitMe

ФотоКоллаж

ПрограмБанк.БизнесАнализ

Конфигуратор для IP-ПАК

Комплексное цифровое решение по управлению инфраструктурой Amelia 2.0

1С:КРС

Категории каталога

Где применяется

Частые вопросы про Степени свободы

Почему при расчёте выборочной дисперсии делят на n−1, а не на n?

Как df влияет на p-value в t-тесте?

Что такое степени свободы в нейронных сетях?

Как рассчитать df для ANOVA?

Влияет ли df на выбор статистического критерия?

Контур Крипто

Искусственный интеллект в медицине

Контур Маркет + ОФД — интегрированная платформа для розничной торговли