Конкордация Кенделла
Материал из MachineLearning.
 (дополнение)  | 
				 (переработка)  | 
			||
| Строка 1: | Строка 1: | ||
{{TOCright}}  | {{TOCright}}  | ||
| - | '''Конкордация Кенделла''' - это непараметрический статистикий тест. Он обычно используется для измерения статистической связи между несколькими выборками. И если для корреляции Пирсона используется дополнительное предположение о нормальности выборок и сравниваются одновременно только две выборки, то в конкордации Кенделла нет предположения о виде распределении и используется любое количество выборок.  | + | '''Конкордация Кенделла''' - это непараметрический статистикий тест. Он обычно используется для измерения статистической связи между несколькими выборками. И если для [[Корреляция Пирсона|корреляции Пирсона]] используется дополнительное предположение о нормальности выборок и сравниваются одновременно только две выборки, то в конкордации Кенделла нет предположения о виде распределении и используется любое количество выборок.  | 
| Строка 11: | Строка 11: | ||
==Определение==  | ==Определение==  | ||
| - | + | Пусть заданы <tex>k\ (k \ge 2)</tex> выборок <tex>x_1=(x_1^1,\ \cdots,x_n^1),\cdots,\ x_k=(x_1^k,\cdots,x_n^k)</tex>. Они все одинаковой длина <tex>n</tex>.  | |
| - | + | Для нахождения статистической связи между несколькими выборками Кенделлом был предложен '''ранговый коэффициент конкордации'''   | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | Для нахождения статистической связи между несколькими выборками Кенделлом был предложен '''  | + | |
<tex>W=\frac{12}{k^2 (n^3-n)}\sum_{i=1}^{n}(\sum_{j=1}^{k}R_{ij}-\frac{k(n+1)}{2})^2</tex>,  | <tex>W=\frac{12}{k^2 (n^3-n)}\sum_{i=1}^{n}(\sum_{j=1}^{k}R_{ij}-\frac{k(n+1)}{2})^2</tex>,  | ||
| Строка 25: | Строка 19: | ||
где <tex>R_{ij}\in\{1,\cdots,n\}</tex> - ранг <tex>i</tex>-го элемента в  <tex>X_j</tex> выборке.  | где <tex>R_{ij}\in\{1,\cdots,n\}</tex> - ранг <tex>i</tex>-го элемента в  <tex>X_j</tex> выборке.  | ||
| - | Опишем некоторые '''  | + | Коэффициент конкордации принимает значения от 0 до 1. Причём он равен 1 при максимальной согласованности и равен 0 при максимальной несогласованности.  | 
| + | |||
| + | |||
| + | Опишем некоторые '''свойства:'''  | ||
1) <tex>W\in[0,1]</tex>  | 1) <tex>W\in[0,1]</tex>  | ||
Причём <tex>W=1</tex> тогда и только тогда, когда <tex>R_{ij}=R_{il} \ \forall i,j,l</tex>  | Причём <tex>W=1</tex> тогда и только тогда, когда <tex>R_{ij}=R_{il} \ \forall i,j,l</tex>  | ||
| + | |||
| + | То, что <tex>W</tex> не принимает отрицательных значений, объясняется тем, что в отличие от случая парных связей для <tex>k\geq 3</tex> выборок противоположность согласованности утрачивается: упорядочения могут полностью совпадать, но не могут полностью не совпадать.  | ||
2)'''Коэффициент конкордации (согласованности) Кенделла''' может быть представлен  | 2)'''Коэффициент конкордации (согласованности) Кенделла''' может быть представлен  | ||
| Строка 43: | Строка 42: | ||
==Статистическая проверка наличия корреляции==  | ==Статистическая проверка наличия корреляции==  | ||
| - | [[Нулевая гипотеза|'''  | + | Проверяется [[Нулевая гипотеза|'''гипотеза''']] <tex>H_0</tex>: выборки <tex>X_1,\cdots,\ X_k</tex> независимы.  | 
| + | |||
| + | ===Статистика===  | ||
| + | <tex>n(k-1)W</tex>  | ||
| + | |||
| + | имеет распрелеление хи-квадрат с <tex>(n-1)</tex> степенью свободы при больших <tex>n</tex>  | ||
| + | |||
| + | ===Критерий===  | ||
| + | При <tex>n(k-1)W>\chi_{n-1,\alpha}^2</tex> нулевая гипотеза об отсутствии статистической связи между выборками должна быть отвергнута с [[Уровень значимости|уровнем значимости]] критерия, равным <tex>\alpha</tex>.  | ||
| + | <tex>\chi_{n-1,\alpha}^2</tex> - <tex>\alpha</tex> - [[Квантиль|квантиль]] хи-квадрат распределения с <tex>(n-1)</tex> степенью свободы.  | ||
| - | |||
| - | |||
==Литература==  | ==Литература==  | ||
Текущая версия
 
  | 
Конкордация Кенделла - это непараметрический статистикий тест. Он обычно используется для измерения статистической связи между несколькими выборками. И если для корреляции Пирсона используется дополнительное предположение о нормальности выборок и сравниваются одновременно только две выборки, то в конкордации Кенделла нет предположения о виде распределении и используется любое количество выборок.
Пример задачи
(инвестиционные проекты)
Пусть имеется  объектов (инвестиционных проектов). В экспертный совет по принятию этих проектов входят 
 человек. Каждый эксперт выставляет оценки каждому проекту в ранговых шкалах. Требуется выяснить, насколько согласны между собой эксперты.
Определение
Пусть заданы  выборок 
. Они все одинаковой длина 
.
Для нахождения статистической связи между несколькими выборками Кенделлом был предложен ранговый коэффициент конкордации
,
где  - ранг 
-го элемента в  
 выборке.
Коэффициент конкордации принимает значения от 0 до 1. Причём он равен 1 при максимальной согласованности и равен 0 при максимальной несогласованности.
Опишем некоторые свойства:
1) 
Причём 
 тогда и только тогда, когда 
То, что  не принимает отрицательных значений, объясняется тем, что в отличие от случая парных связей для 
 выборок противоположность согласованности утрачивается: упорядочения могут полностью совпадать, но не могут полностью не совпадать.
2)Коэффициент конкордации (согласованности) Кенделла может быть представлен
где  - коэффициент корреляции Спирмена
 - среднее арифметическое Спирмена
При  получаем, что 
т.е. коэффициент конкордации 
 линейно зависит от коэффициента корреляции Спирмена 
 
Статистическая проверка наличия корреляции
Проверяется гипотеза : выборки 
 независимы.
Статистика
имеет распрелеление хи-квадрат с  степенью свободы при больших 
Критерий
При  нулевая гипотеза об отсутствии статистической связи между выборками должна быть отвергнута с уровнем значимости критерия, равным 
.
 - 
 - квантиль хи-квадрат распределения с 
 степенью свободы.
Литература
- Лагутин М. Б. Наглядная математическая статистика:Учебное пособие.-М.: БИНОМ. Лаборатория знаний, 2007.-472с.
 
См. также
Ссылки
- Kendall's W (Wikipedia)
 

