[기초통계] 범주형 자료 분석

업데이트:

범주형 자료 분석

오즈(odds)

오즈($\pi$)는 다음과 같은 식을 따릅니다.

\[\Omega = \frac{\pi}{1-\pi}\]

오즈의 분모는 실패할 확률을 뜻하고 분자는 성공할 확률을 뜻합니다. 즉, 오즈란 실패할 확률과 성공할 확률의 비율차이라고 할 수 있는데요.

$\Omega > 1$ 이면 성공할 확률이 실패할 확률보다 높다는 뜻입니다. 예를 들면, $\pi=0.75$인 경우, $\Omega=0.75/0.25 = 3$이 되고 이 말은 성공이 실패보다 3배 더 발생한다는 뜻입니다. 반대로 $\Omega=1/3$인 경우는 실패가 성공보다 3배 더 발생한다는 뜻입니다.

상대위험률과 오즈비

구분 결과 1 결과 2
그룹 1 n11 n12 n1+
그룹 2 n21 n22 n2+
n+1 n+2 n

오즈비(odds ratio)란 해당 시간이 발생하지 않은 확률에 대해 그 사건이 발생한 확률의 비율로 정의된다.

상대위험률(relative risk) RR = $ \frac{n11/n1+}{n21/n2+} $

오즈비(odds ratio) OR = $ \frac{(n11/n+1)/(n21/n+1)}{(n12/n+2)/(n22/n+2)} = \frac{n11n22}{n12n21}$

오즈비란 결국 ‘오즈의 비’라는 뜻이죠. 분자분모에 모두 오즈가 들어갑니다.

카이제곱 검정

동질성검정(homogeneity test)

H0 : 실제약을 복용할 때와 위약을 복용했을 때의 발병 비율은 같다.

독립성검정(independence test)

H0 : 실제약 복용여부와 발병 여부는 서로 독립이다.

그룹 수 = I, 결과 수 = J 일 때,

\[H0: p_{1j} = p_{2j} = \dots = p_{Ij} \, (j=1,2, ..., J)\] \[\hat{p_{j}} = \frac{n_{+j}}{n}\] \[E_{ij} = n_{i+}\hat{p_{j}} = \frac{n_{i+}}{n}\] \[\chi^{2} = \sum_{i=1}^{I}\sum_{j=1}^{J}\frac{(n_{ij} - E_{ij})^{2}}{E_{ij}}\]