통계학 (문단 편집)

=== 공통 ===
 * 모집단(population)은 관측 대상이 되는 전체 집단이다.
 * [[표본]](sample)은 모 집단에서 일부만 조사한 것이다.
 * [[모 평균]](population mean) μ는 [[모 집단]]의 평균이다. 모두 더한 후 전체 데이터 수 n으로 나눈다. [[확률 변수]]의 [[기댓값]]이다.
 * [[표본 평균]](sample mean) [math( \bar{x} )]는 표본의 평균이다. 모두 더한 후 n으로 나눈다.
 * [[모 분산]](population variance) σ^^2^^은 모집단의 분산이다. 관측값에서 [[모 평균]]을 빼고 그것을 제곱한 값을 모두 더하여 전체 데이터 수 n으로 나눈 것이다.
 * [[표본 분산]](sample variance) s^^2^^은 표본의 분산이다. 관측값에서 [[표본 평균]]을 빼고 제곱한 값을 모두 더한 것을 n-1로 나눈 것이다.
 * [[모 표준 편차]](population standard deviation) σ는 모 집단의 표준 편차이다. 모 분산 σ^^2^^에 제곱근을 씌워서 구한다.
 * [[표본 표준 편차]](sample standard deviation) s는 표본의 표준 편차이다. 표본 분산 s^^2^^에 제곱근을 씌워서 구한다.
 * [[평균 절대 편차]](average absolute deviation 또는 mean absolute deviation)는 관측값에서 평균을 빼고, 그 차이값에 [[절대값]]을 취하고, 그 값들을 모두 더하여 전체 데이터 갯수로 나눠준 것이다. 절대값 편차의 평균이라고 생각하면 된다.
 * [[중앙값 절대 편차]](median absolute deviation)는 관측값에서 중앙값을 빼고, 그 차이에 [[절댓값]]을 취한 값들의 중앙값을 구한다.
 * [[최소 절대 편차]](least absolute deviation)는 [[회귀 분석]](regression analysis)에 사용된다.
 * [[공분산]](covariance): 2개의 [[확률 변수]]의 상관정도를 나타내는 값이다. [[확률 변수]] X의 증감에 따른 확률 변수 Y의 증감의 경향에 대한 측도이다.
 * [[상관 계수]](correlation coefficient): 두 [[변인]]간의 관계를 나타내는 측도이다. [[피어슨 상관 계수]](Pearson correlation coefficient 또는 Pearson's r)를 가장 많이 사용한다. [[공분산]]은 X와 Y의 단위에 의존하는 양이므로 단위와는 무관한 측도를 얻기 위하여 공분산을 X와 Y의 [[표준 편차]]의 곱으로 나누어서 얻은 값이 상관 계수이다. 상관 계수 X와 Y의 선형 관계의 강도에 대한 측도이다.
 * [anchor(왜도)]왜도(skewness) 또는 왜곡도: 그래프가 왼쪽이나 오른쪽으로 치우친 정도이다.
 * 첨도(kurtosis): 그래프가 위로 뾰족한 정도이다.
 * [[확률 변수]](random variable): 표본 공간에서 정의된 실수 값 함수이다.
 * [[확률 분포]](probability distribution): 확률 변수 X의 발생 가능성의 정도이다. [[이산 확률 분포]]와 [[연속 확률 분포]]가 있다.
 * [[이산 확률 변수]](random variable of discrete type): 확률 변수 X가 취할 수 있는 모든 값을 x1, x2, x3, ... 처럼 셀 수 있을 때 X를 이산 확률 변수라고 한다.
 * [[확률 질량 함수]](probability mass function): 이산 확률 변수 X가 취할 수 있는 값 x1, x2, x3, ... 의 각각에 대해서 확률 P(X=x1), P(X=x2), P(X=x3), ... 을 대응시켜주는 관계이다.
 * [[연속 확률 변수]](random variable of continuous type): 적절한 구간 내의 모든 값을 취하는 확률 변수이다.
 * [[확률 밀도 함수]](probability density function): 연속 확률 변수 X에 관한 확률을 결정하는 함수 f(x)이다.
 * [[표본 분포]](sampling distribution 또는 finite-sample distribution): 크기 n의 [[확률 표본]](random sample)의 [[확률 변수]](random variable)의 [[분포]](distribution)이다.
 * [[기댓값]](expected value)은 통계에서는 평균과 같다고 생각하면 된다. 가능한 값마다 확률을 곱해서 모두 더한 것이다. 확률 변수 X의 평균으로 보통 E(X)라고 쓴다.
 * [[자유도]](degrees of freedom): "변인의 수 빼기 제약"이다.
 * [[베이즈 정리]](Bayes' theorem): 이미 알려진 확률(사전 [[확률]])을 통해, 알고 싶은 다른 확률(사후 [[확률]])을 예측할 때 쓴다.

저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,
기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.
이 동의는 철회할 수 없습니다.

통계학 (문단 편집)

캡챠