[기초통계] 초기하분포 의미 및 개념 정리

업데이트:

초기하분포 의미 및 개념 정리

참고링크

머신러닝 딥러닝 선형대수 기초통계 최적화
k-means 신경망이란 고유값,고유벡터 확률변수 컨벡스 셋
k-최근접이웃 성능함수 행렬식 확률분포 컨벡스 함수
선형회귀 신경망 학습 내적 모집단과 표본 라그랑주 듀얼
로지스틱회귀 교차연결 기저 평균과 분산 KKT 조건
릿지,라쏘회귀 합성곱 신경망 랭크, 차원 공분산, 상관계수 ROC 커브
의사결정나무 배치, 에포크 차이 선형변환 최대가능도추정 크로스 밸리데이션
서포트벡터머신 텐서플로기초(1) 직교행렬 베르누이,이항분포 실루엣 스코어
원클래스 SVM 텐서플로기초(2) 고유값분해 기하,음이항분포  
LDA seq2seq 특이값분해 초기하분포  
GMM opencv기초   포아송분포  
부스팅 resnet   정규분포  
사이킷런 실습 다각형내부판별   감마분포  
  엣지판별   지수분포  
      카이제곱분포  
      베타분포  
      균일분포  



1. 초기하분포 정의

초기하분포(hypergeometric distribution)란 비복원추출에서 N개 중에 M개가 원하는 것이고, K번 추출했을때 원하는 것 x개가 뽑힐 확률의 분포이다.

figure01

2. 복원추출/비복원추출이란

항아리에 5개의 공이 들어있고 그 중 하나씩 뽑는 상황을 가정해봅시다. 복원추출이란 항아리에서 공을 뽑은 이후 다음 공을 뽑기 전에 이전에 뽑은 공을 다시 항아리속으로 집어넣는 것이고, 비복원추출이란 한번 공을 뽑으면 다시 공을 집어넣지 않고 다음 공을 뽑는 것입니다. 이 둘은 얼핏차이 없어보이지만 큰 차이가 있습니다. 항아리에 공이 5개 있으므로 비복원추출의 경우 뽑을 수 있는 최대 횟수가 5회입니다. 즉 뽑을수있는 횟수에 제한이 있다는 뜻이죠. 반면 복원추출을 할 경우 공을 뽑은 후 다시 항아리속에 넣기 때문에 뽑을 수 있는 횟수가 무한대입니다. 즉, 뽑을 수 있는 횟수가 무제한이라는 것입니다.

3. 이항분포와의 관계

따라서 비복원추출을 가정하는 상황에서는 초기하분포를 사용해야하며, 복원추출을 가정하는 상황에서는 이항분포를 사용해야 합니다.

참고. 확률분포간 관계도

figure100