통계학20 상관계수의 정의와 역할, 피어슨 상관계수(Pearson Correlation Coefficient)와 스피어만 순위 상관계수(Spearman's Rank Correlation Coefficient)의 계산 방법 상관계수와 공분산의 정의와 역할, 그리고 피어슨 상관계수(Pearson Correlation Coefficient)와 스피어만 순위 상관계수(Spearman's Rank Correlation Coefficient), 켄달의 타우 (Kendall's Tau) 상관계수를 알아보며 이들이 데이터 분석에서 어떻게 활용되는지 자세히 알아보겠습니다. 또한 공분산과 상관계수의 역할을 비교하며 각각의 개념에 대해 깊이 있게 이해해 보시기 바랍니다. 1. 상관계수의 정의상관계수는 특정한 관계가 두 변수 사이에 존재하는지와 그 관계의 강도를 나타내는 측정값입니다. 예를 들어, 키와 몸무게가 높은 상관관계를 보인다면, 키가 커질수록 몸무게도 커지는 경향이 있다고 해석할 수 있습니다. 상관계수는 이러한 관계의 방향(양의 관계.. 2024. 11. 15. 포아송분포(Poisson distribution)와 지수분포(Exponential distribution) 포아송분포와 지수분포를 각각 알아보고, 포아송분포와 지수분포의 관계에 대해서 알아보도록 하자. 1. 포아송분포(Poisson distribution)포아송 분포(Poisson distribution)는 주어진 시간이나 공간 내에서 어떤 사건이 발생하는 횟수를 모델링하는 확률 분포이다. 특히, 사건이 발생하는 평균 횟수가 알려져 있을 때 유용하게 사용된다. 포아송 분포는 사건이 독립적이고, 평균 발생률이 일정한 상황에서 적합하다.ex) 주어진 시간 동안 콜센터로 들어오는 전화의 수, 특정 지역에서 발생하는 교통사고의 수 등이 포아송 분포로 모델링 될 수 있다. 양의 실수 λ에 대해 확률변수 X가 다음과 같은 확률질량함수를 가질 때, X는 모수가 λ인 포아송분포를 따른다고 정의하고 X ~ poi(λ)로 표기.. 2024. 9. 19. 정규분포(Normal distribution)와 표준정규분포표 정규분포는 통계학에서 가장 널리 사용되는 확률분포 중 하나로, 데이터가 평균을 중심으로 좌우 대칭을 이루는 종 모양의 분포를 가진다. 많은 자연현상이나 사회 현상에서 측정된 데이터가 정규분포를 따르는 경우가 많기 때문에, 이 분포는 데이터 분석과 통계학에서 매우 중요하다. 정규분포를 이해하기 위해서 먼저, 정규분포의 특수한 케이스인 표준정규분포를 이해하고 넘어가는 것이 좋다. 1. 표준정규분포(Standard normal distribution) 연속확률변수 Z의 확률밀도함수 PDF가 아래와 같은 형태일 때 Z는 표준정규분포를 따른다고 정의한다. 표준정규분포는 평균이 0이고 분산이 1이며 Z~N(0,1)로 표기한다. ϕ(z)는 표준정규분포의 확률밀도함수, Φ(z)는 표준정규분포의 누적분포함수를 말한다.표.. 2024. 9. 19. 연속확률변수와 확률밀도함수 연속확률변수(Continuous random variable)와 확률밀도함수(Probability density function; PDF)에 대해 소개하고자 한다. 1. 연속확률변수(Continuous random variable)연속확률변수는 확률변수가 취할 수 있는 값의 수가 셀 수 없이 많을 때 X를 연속형 확률변수라 한다.ex) 동전 2개를 던져서 앞면이 나오는 경우의 수인 이산확률변수는 X가 취할 수 있는 값의 수가 0, 1, 2로 셀 수 있다. 하지만 몸무게, 시간, 키, 온도 같은 경우에는 취할 수 있는 값의 수를 셀 수 없다. 연속확률변수의 경우, 확률을 계산할 때 특정한 값에 대한 확률이 0이다. 즉, 연속확률변수는 무한히 많은 실수 값을 가질 수 있기 때문에, 그중에서 하나의 특정.. 2024. 9. 15. 이전 1 2 3 4 5 다음