Коэффициент детерминации
Материал из MachineLearning.
 (Новая: В статистике '''коэффициентом детерминации''', <tex>R^2</tex>, называется величина, показывающа...)  | 
				|||
| Строка 1: | Строка 1: | ||
| - | + | '''Коэффициентом детерминации''', <tex>R^2</tex>, называется величина, показывающая, какая доля [[дисперсия|дисперсии]] выборки определяется параметрами выбранной модели.  | |
== Определение ==  | == Определение ==  | ||
| - | Существует несколько альтернативных определений '''коэффициента детерминации''', однако в случае [[  | + | Существует несколько альтернативных определений '''коэффициента детерминации''', однако в случае [[Регрессионный анализ|линейной регрессии]] все они эквивалентны: <tex>R^2</tex> тогда равен квадрату [[коэффициент корреляции|коэффициента корреляции]].   | 
Пусть выборка имеет значения <tex>y_i</tex>, и ей соответствуют модельные данные <tex>f_i</tex>; <tex>\bar{y}</tex> и <tex>\bar{f}</tex> - средние значения наблюдаемых и модельных данных. Тогда введем следующие обозначения:  | Пусть выборка имеет значения <tex>y_i</tex>, и ей соответствуют модельные данные <tex>f_i</tex>; <tex>\bar{y}</tex> и <tex>\bar{f}</tex> - средние значения наблюдаемых и модельных данных. Тогда введем следующие обозначения:  | ||
| - | <tex>SS_{\rm tot}=\sum_i (y_i-\bar{y})^2,</tex> общая сумма квадратов отклонения (пропорциональная   | + | <tex>SS_{\rm tot}=\sum_i (y_i-\bar{y})^2,</tex> общая сумма квадратов отклонения (пропорциональная дисперсии);  | 
<tex>SS_{\rm reg}=\sum_i ({f_i}-\bar{f})^2,</tex> регрессионная сумма квадратов отклонений (объяснимая моделью);  | <tex>SS_{\rm reg}=\sum_i ({f_i}-\bar{f})^2,</tex> регрессионная сумма квадратов отклонений (объяснимая моделью);  | ||
| Строка 27: | Строка 27: | ||
* [http://en.wikipedia.org/wiki/Coefficient_of_determination Wikipedia]  | * [http://en.wikipedia.org/wiki/Coefficient_of_determination Wikipedia]  | ||
| - | [[Категория:   | + | [[Категория: Регрессионный анализ]]  | 
Версия 18:09, 26 апреля 2009
Коэффициентом детерминации, , называется величина, показывающая, какая доля дисперсии выборки определяется параметрами выбранной модели.
Определение
Существует несколько альтернативных определений коэффициента детерминации, однако в случае линейной регрессии все они эквивалентны:  тогда равен квадрату коэффициента корреляции. 
Пусть выборка имеет значения , и ей соответствуют модельные данные 
; 
 и 
 - средние значения наблюдаемых и модельных данных. Тогда введем следующие обозначения:
 общая сумма квадратов отклонения (пропорциональная дисперсии);
 регрессионная сумма квадратов отклонений (объяснимая моделью);
, сумма квадратов ошибок.
Общее определение коэффициента детерминированности:
Дробь  показывает отношение не объясненных моделью вариаций к общим вариациям, так что введенное таким образом определение ясно отражает суть понятия коэффициент детерминации.
Интерпретация
 содержит информацию о том, насколько хорошо модель подходит под исходные данные. Например, в случае решения задачи регрессии коэффициент детерминации покажет, насколько график модельных значений совпадает с графиком наблюдаемых значений: если 
, то эти графики совпадают. Однако само по себе значение коэффициента детерминированности не может свидетельствовать о том, что модель выбрана правильно.

