Summary를 통해 알 수 있는 자료의 대표값(평균, 중위수, 최빈값, 사분위수)과 퍼짐 정도를 나타내는 산포도
평균이 무조건 좋지 많은 않다는것을 알게 한 건 아마 통계학을 배우고부터 일 것이다.
우리 학과는 시험 보고 난 뒤 평균과 중위수 분포를 알려주셨다. 혹시 다른 학과도 그런가?
대표값 | 평균 | 이상값 존재시 좋은 대표값이 될 수 없다. 가중평균(가중의 합으로 나누기)을 통해 이상값 약점 보완 |
중위수 | 순서에 따라 정해져서 확장성없다. 극단값의 영향을 덜 받는다. |
|
사분위수 | 오름차순 후 자료의 25%(1)/50%(2)/75%(3)에 해당되는 값 | |
최빈값 | 자료값들이 모두 동일한 경우 불합리 |
산포도 | 범위 | 자료의 최대값-최소값 정보의 손실이 크다 범위 보완 사분위범위 제3사분위수-제1사분위수 |
편차 | 자료값과 평균의 차이 | |
분산 | 평균편차 보완![]() 모분산 ![]() 표본분산 |
|
표준편차 | 모표준편차 = √모분산 표본표준편차 = √표본분산 |
|
변동계수 | 표준편차를 평균으로 나눈값 상대적 산포도의 척도 단위가 다른 집단간 산포도를 보기 위함 |
|
표준측도 | 자료값에서 평균을 빼고 표준편차로 나눈값 특정 자료값이 평균으로부터 표준편차의 몇 배인지 보기 위함 표준측도가 클수록 값이 평균보다 큼 |