[Math] 편차, 분산, 표준편차
2019.08.27
카카오 2018 예선전 문제를 푸는 도중 '편차, 분산, 표준편차'에 대한 내용이 나와 정리하려 합니다. 표준편차 자료의 관찰값이 얼마나 흩어져 있는지를 나타내는 값 중 하나로, 같은 의미의 단어로 '산포도(ScatterPlot)'가 있습니다. 이전에 대시보드를 구축할 때, 메인이 되는 데이터를 산포도(Scatter) 그래프로 표현했던 적이 있었습니다. 그 당시에 "산포도가 무슨 뜻이지?" 하고 대충 넘겼던 적이 있는데, 뜻하지 않게 답을 찾았습니다.. 표준편차에 대해 알기 위해 다음의 2가지 개념이 필요합니다. 1. 편차: 관측값에서 평균을 뺀 값 2. 분산: 편차의 제곱의 평균 예를 들어, [2, 5, 6, 8, 9] 라는 순차열이 있다면 각각의 관측값들의 편차는 다음과 같습니다. 평균값: $$\fr..