카카오 2018 예선전 문제를 푸는 도중 '편차, 분산, 표준편차'에 대한 내용이 나와 정리하려 합니다.

 

표준편차

자료의 관찰값이 얼마나 흩어져 있는지를 나타내는 값 중 하나로, 같은 의미의 단어로 '산포도(ScatterPlot)'가 있습니다.

이전에 대시보드를 구축할 때, 메인이 되는 데이터를 산포도(Scatter) 그래프로 표현했던 적이 있었습니다. 그 당시에 "산포도가 무슨 뜻이지?" 하고 대충 넘겼던 적이 있는데, 뜻하지 않게 답을 찾았습니다..

 

표준편차에 대해 알기 위해 다음의 2가지 개념이 필요합니다.

    1. 편차: 관측값에서 평균을 뺀 값

    2. 분산: 편차의 제곱의 평균

 

예를 들어, [2, 5, 6, 8, 9] 라는 순차열이 있다면 각각의 관측값들의 편차는 다음과 같습니다.

    평균값: $$\frac{2 + 5 + 6 + 8 + 9}{5} = 6$$

    편차: $$(2-6), (5-6), (6-6), (8-6), (9-6)$$

    분산:  $$\frac{(2-6)^2+(5-6)^2+(6-6)^2+(8-6)^2+(9-6)^2}{5}$$

 

 

위에서 구한 분산 값을 가지고 표준편차를 구할 수 있습니다.

    표준편차: $$\sqrt{ \frac{(2-6)^2 + (5-6)^2 + (6-6)^2 + (8-6)^2 + (9-6)^2}{5} }$$

 

 

 

'Algorithm' 카테고리의 다른 글

[Math] 호도법, 라디안(radian)  (0) 2019.10.17
[Math] 삼각비  (0) 2019.10.15