본문 바로가기

수학 개념정리/확률과 통계 개념정리

분산과 표준편차



[분산과 표준편차]


오늘은 분산과 표준편차에 

대해서 알아보겠습니다.


분산과 표준편차는 주어진 값들이

얼마나 흩어져 있는가

나타내는 지표입니다.


아래 그림을 한번 보겠습니다.



이해를 돕기 위해서

사격 표적지를 가져와봤습니다.

좌측처럼 흩어져 있는 것을

산포가 크다고 하며 이는

분산/표준편차가 큰것을 의미합니다.


반대로 우측처럼 한곳에 모여있는 것을

산포가 작다고 하며 이것은

분산/표준편차가 작은 것을 의미합니다.


즉 얼마나 흩어져 있느냐를

나타내는 것이 분산/표준편차의 의미입니다.


또한 얼마나 흩어져 있느냐만 중요할 뿐

특정값과 가까운지 아닌지는

(표적에서는 중앙에 맞았는지 안맞았는지)

분산/표준편차와는 무관합니다.


그럼 좀 더 수치적으로 이해하기 위해서

숫자로 예를 들어보겠습니다.

아래 두 숫자의 집합을 보겠습니다.


 집합B를 보면 평균인 5를

중심으로 모여있고

집합A는 B에 비해서

흩어져있는 걸 알 수 있습니다.

그러므로 분산은 A가 더 크며

상세 수치는 아래와 같습니다.


차례차례 설명해보면

편차는 해당값에서 평균을 뺀 값입니다.

즉 해당값이 평균에서 

얼마나 떨어져있나를 보여줍니다.


전체적으로 값들이 얼마나 떨어져있나를

나타내기 위해서 이 편차들의 평균을

구해보고 싶은데

그냥 구하면 + - 가 있으므로 0이 됩니다.


따라서 부호에 따른 상쇄를 없애기위해

각 편차에 제곱을 해준뒤

그 값들의 평균을 구해줍니다.

이 값이 바로 분산이 됩니다.



마지막으로 표준편차는

이 분산에 루트를 씌어준 값입니다.

부호를 없애주기 위해서

제곱을 해준것을 보완하는 개념도 있고

실제로 분산값을 쓰다보면

값자체가 너무 커지기 때문에

표준편차라는 값을 만들었습니다.


(다른 의미도 더 있는지는 공부중입니다.)


그렇다면 집합B의 값도 구해보겠습니다.

예상대로라면 집합 A보다

더 작은 값이 나와야합니다.

아래를 보겠습니다.


예상한대로 집합B의

분산 및 표준편차가 작게 나왔습니다.

결론적으로 기억해둘 것은


분산과 표준편차는

얼마나 흩어져 있는가를 나타낸다


분산은 편차의 제곱의 평균

표준편차는 분산의 제곱근




 


'수학 개념정리 > 확률과 통계 개념정리' 카테고리의 다른 글

분산 공식의 변형  (0) 2016.09.01
분산 공식  (9) 2016.08.29
독립시행의 확률 공식  (0) 2016.08.11
조건부 확률의 의미  (0) 2016.08.09
확률의 의미  (0) 2016.08.07