Чем корреляция отличается от ковариации

Автор sasam, Фев. 22, 2024, 09:57

« назад - далее »

sasam

Что такое ковариация? простыми словами об измерении взаимосвязи между переменными. Как корреляция отличается от ковариации? понятное объяснение для начинающих

CHIZARIK


Ковариация и корреляция - это два статистических понятия, которые измеряют степень взаимосвязи между двумя переменными. Давайте разберемся с каждым из этих терминов более подробно

Ковариация (Covariance)



Ковариация измеряет степень того, как две переменные изменяются вместе. Если две переменные растут вместе, ковариация положительна; если одна увеличивается, а другая уменьшается, ковариация отрицательна; если нет явной закономерности, то ковариация близка к нулю.

Формула ковариации для двух переменных X и Y
Cov

(

X

,

Y

)

=



i

=

1



n



(

X

i





X

ˉ



)

(

Y

i





Y

ˉ



)



n





\text{Cov}(X, Y) = \frac{\sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y})}{n}









Cov



(

X

,



Y

)



=











n



















i

=

1









n

























(

X



i



























X





ˉ













)

(

Y



i



























Y





ˉ













)




































где X

i





X_i









X



i































 и Y

i





Y_i









Y



i































 - значения переменных X и Y соответственно, X

ˉ





\bar{X}











X





ˉ





















 и Y

ˉ





\bar{Y}











Y





ˉ





















 - средние значения переменных.





Корреляция (Correlation)



Корреляция также измеряет степень взаимосвязи между двумя переменными, но она нормализована и находится в пределах [-1, 1]. Корреляция показывает не только наличие взаимосвязи, но и её направление (положительное или отрицательное).

Формула коэффициента корреляции (обычно используется коэффициент Пирсона)
Corr

(

X

,

Y

)

=

Cov

(

X

,

Y

)



σ

X





σ

Y









\text{Corr}(X, Y) = \frac{\text{Cov}(X, Y)}{\sigma_X \cdot \sigma_Y}









Corr



(

X

,



Y

)



=











σ



X

























σ



Y





































Cov



(

X

,

Y

)




































где σ

X





\sigma_X









σ



X































 и σ

Y





\sigma_Y









σ



Y































 - стандартные отклонения переменных X и Y соответственно.







Пример


Предположим, у нас есть две переменные количество часов, проведенных студентом за учебой (X), и его оценка по экзамену (Y). Давайте рассмотрим две ситуации

Сценарий 1



Если студент, который много учился, получает высокую оценку, и наоборот, когда студент мало учился, он получает низкую оценку, то ковариация будет положительной.





Сценарий 2



Если студент, который много учился, получает низкую оценку, и наоборот, когда студент мало учился, он получает высокую оценку, то ковариация будет отрицательной.







В обоих сценариях, если мы вычислим корреляцию, она также покажет направление и силу этой связи, предоставляя нам более нормализованный показатель взаимосвязи между этими двумя переменными.