본문 바로가기

분류 전체보기23

포아송분포(Poisson distribution)와 지수분포(Exponential distribution) 포아송분포와 지수분포를 각각 알아보고, 포아송분포와 지수분포의 관계에 대해서 알아보도록 하자. 1. 포아송분포(Poisson distribution)포아송 분포(Poisson distribution)는 주어진 시간이나 공간 내에서 어떤 사건이 발생하는 횟수를 모델링하는 확률 분포이다. 특히, 사건이 발생하는 평균 횟수가 알려져 있을 때 유용하게 사용된다. 포아송 분포는 사건이 독립적이고, 평균 발생률이 일정한 상황에서 적합하다.ex) 주어진 시간 동안 콜센터로 들어오는 전화의 수, 특정 지역에서 발생하는 교통사고의 수 등이 포아송 분포로 모델링 될 수 있다. 양의 실수 λ에 대해 확률변수 X가 다음과 같은 확률질량함수를 가질 때, X는 모수가 λ인 포아송분포를 따른다고 정의하고 X ~ poi(λ)로 표기.. 2024. 9. 19.
정규분포(Normal distribution)와 표준정규분포표 정규분포는 통계학에서 가장 널리 사용되는 확률분포 중 하나로, 데이터가 평균을 중심으로 좌우 대칭을 이루는 종 모양의 분포를 가진다. 많은 자연현상이나 사회 현상에서 측정된 데이터가 정규분포를 따르는 경우가 많기 때문에, 이 분포는 데이터 분석과 통계학에서 매우 중요하다. 정규분포를 이해하기 위해서 먼저, 정규분포의 특수한 케이스인 표준정규분포를 이해하고 넘어가는 것이 좋다. 1. 표준정규분포(Standard normal distribution) 연속확률변수 Z의 확률밀도함수 PDF가 아래와 같은 형태일 때 Z는 표준정규분포를 따른다고 정의한다. 표준정규분포는 평균이 0이고 분산이 1이며 Z~N(0,1)로 표기한다. ϕ(z)는 표준정규분포의 확률밀도함수, Φ(z)는 표준정규분포의 누적분포함수를 말한다.표.. 2024. 9. 19.
연속확률변수와 확률밀도함수 연속확률변수(Continuous random variable)와 확률밀도함수(Probability density function; PDF)에 대해 소개하고자 한다.  1. 연속확률변수(Continuous random variable)연속확률변수는 확률변수가 취할 수 있는 값의 수가 셀 수 없이 많을 때 X를 연속형 확률변수라 한다.ex)  동전 2개를 던져서 앞면이 나오는 경우의 수인 이산확률변수는 X가 취할 수 있는 값의 수가 0, 1, 2로 셀 수 있다. 하지만 몸무게, 시간, 키, 온도 같은 경우에는 취할 수 있는 값의 수를 셀 수 없다.  연속확률변수의 경우, 확률을 계산할 때 특정한 값에 대한 확률이 0이다. 즉, 연속확률변수는 무한히 많은 실수 값을 가질 수 있기 때문에, 그중에서 하나의 특정.. 2024. 9. 15.
R 데이터 생성방법(Factor, DataFrame) / Data in R #5 R에서 주로 사용하는 데이터의 종류는 4가지가 있습니다. R에서 데이터를 생성하는 방법과 각각의 속성은 무엇인지 알아보겠습니다. 1. vector 2. factor 3. data.frame 4. list 1. vector vector는 데이터 분석의 가장 기본 단위이며, 하나의 열로 구성된 1차원구조이다. 집단=그룹=범주로 되어 있지 않다. 1.1 R에서 vector 만드는 방법 1) c() : concatenate c (값, 값, 값, 값,......) 값들이 규칙이 없을 때 numeric, character, logical vector를 만듦 ex) income end : 1씩 감소 start = end : start = end numeric vector만 만듦 1씩 증가되거나 1씩 감소되는 경우에 .. 2023. 12. 21.