본문 바로가기
통계학

연속확률변수와 확률밀도함수

by 이징이 2024. 9. 15.

연속확률변수(Continuous random variable)와 확률밀도함수(Probability density function; PDF)에 대해 소개하고자 한다. 

 

1. 연속확률변수(Continuous random variable)

연속확률변수는 확률변수가 취할 수 있는 값의 수가 셀 수 없이 많을 때 X를 연속형 확률변수라 한다.

ex)  동전 2개를 던져서 앞면이 나오는 경우의 수인 이산확률변수는 X가 취할 수 있는 값의 수가 0, 1, 2로 셀 수 있다. 하지만 몸무게, 시간, 키, 온도 같은 경우에는 취할 수 있는 값의 수를 셀 수 없다. 

 

연속확률변수의 경우, 확률을 계산할 때 특정한 값에 대한 확률이 0이다. 즉, 연속확률변수는 무한히 많은 실수 값을 가질 수 있기 때문에, 그중에서 하나의 특정 값을 가질 확률은 무한히 작은 값, 0이 된다는 것이다.

ex)  특정한 사람이 170cm일 확률을 구한다고 생각해 보자. 특정 사람이 키가 정확히 170cm일 확률이 0이라는 것은, 연속확률변수의 성질에 따른 결과이다. 연속확률변수는 실수의 연속적인 값들(예: 160.0001, 160.0002,... 179.9999 등)을 가질 수 있다. 이렇게 연속적으로 존재하는 무한한 값 중 하나를 딱 집어서 선택할 확률은 이론적으로 0에 가까운 값이 된다는 것이다. 

 

따라서 연속확률변수의 경우에는 특정 값이 아니라 어떤 구간에서 값이 존재할 확률을 계산하는 것이 더 의미가 있다.

ex)  특정한 사람이 170cm일 확률은 0이지만, 한 사람의 키가 169.9cm에서 170.1cm 사이일 확률은 계산할 수 있다.

 

  • 연속확률변수에서 확률의 관심은!! 특정한 값일 때의 확률이 아니라 a≤X≤b인 구간이다!!

 

또한 연속확률변수를 정의할 때, CDF가 연속이라는 조건이 중요하다. 연속확률변수는 특정 값에 대해서는 확률이 0이지만, 범위에 대한 확률은 계산할 수 있으며, 작은 값의 변화에 대해서도 확률이 연속적으로 변한다는 뜻이므로 CDF가 끊기거나 불연속적인 점이 없다. 

 

2. 확률밀도함수(Probability density function; PDF)

확률밀도함수(Probability Density Function, PDF)는 연속 확률변수의 확률 분포를 설명하는 함수로, 연속형 확률변수의 값을 특정 구간 내에서 가질 확률의 분포를 나타낸다.

 

확률밀도함수 f(x)는 X의 CDF인 F(x)의 도함수로 정의된다. 즉, PDF는 CDF의 기울기,

PDF인 

 

  • PDF인 

 

이제 CDF와 PDF의 관계를 알았다. PDF를 통해서 확률을 구하기 위해서는 PDF를 적분해 누적분포함수 CDF로 돌아가야 한다.

 

따라서 연속 확률변수

  • 연속확률변수는 한 점에서의 확률이 0이기 때문에 P(a≤X≤b)=P(a<X≤b)=P(a≤X<b)=P(a<X<b)가 성립한다. 

 

연속형 확률변수 X의 PDF f(x)는 항상 다음을 만족해야 한다.

 

  • 모든 x에 대해서 확률밀도함수 f(x)≥0이어야 한다. 
  • 함수

3. 연속확률변수의 기댓값

연속 확률변수