본문 바로가기

Data/통계학

좀 더 세밀한 자료 파악

Summary를 통해 알 수 있는 자료의 대표값(평균, 중위수, 최빈값, 사분위수)과 퍼짐 정도를 나타내는 산포도

평균이 무조건 좋지 많은 않다는것을 알게 한 건 아마 통계학을 배우고부터 일 것이다.

우리 학과는 시험 보고 난 뒤 평균과 중위수 분포를 알려주셨다. 혹시 다른 학과도 그런가?

 

대표값  평균  이상값 존재시 좋은 대표값이 될 수 없다.
 가중평균(가중의 합으로 나누기)을 통해 이상값 약점 보완
 중위수  순서에 따라 정해져서 확장성없다.
 극단값의 영향을 덜 받는다.
 사분위수  오름차순 후 자료의 25%(1)/50%(2)/75%(3)에 해당되는 값
 최빈값  자료값들이 모두 동일한 경우 불합리
산포도  범위  자료의 최대값-최소값
 정보의 손실이 크다

 범위 보완 사분위범위 제3사분위수-제1사분위수
 편차  자료값과 평균의 차이
 분산  평균편차 보완

 모분산


 표본분산

 표준편차  모표준편차 = √모분산
 표본표준편차 = √표본분산
 변동계수  표준편차를 평균으로 나눈값
 상대적 산포도의 척도
 단위가 다른 집단간 산포도를 보기 위함
 표준측도  자료값에서 평균을 빼고 표준편차로 나눈값
 특정 자료값이 평균으로부터 표준편차의 몇 배인지 보기 위함
 표준측도가 클수록 값이 평균보다 큼

 

'Data > 통계학' 카테고리의 다른 글

확률변수와 분포  (0) 2023.03.30
집합과 확률  (0) 2023.03.30
자료를 수집하고 정리하자 통계학스럽게  (0) 2023.03.23
통계학이란?  (0) 2023.03.22