본문 바로가기

통계학16

정규분포(Normal distribution)와 표준정규분포표 정규분포는 통계학에서 가장 널리 사용되는 확률분포 중 하나로, 데이터가 평균을 중심으로 좌우 대칭을 이루는 종 모양의 분포를 가진다. 많은 자연현상이나 사회 현상에서 측정된 데이터가 정규분포를 따르는 경우가 많기 때문에, 이 분포는 데이터 분석과 통계학에서 매우 중요하다. 정규분포를 이해하기 위해서 먼저, 정규분포의 특수한 케이스인 표준정규분포를 이해하고 넘어가는 것이 좋다. 1. 표준정규분포(Standard normal distribution) 연속확률변수 Z의 확률밀도함수 PDF가 아래와 같은 형태일 때 Z는 표준정규분포를 따른다고 정의한다. 표준정규분포는 평균이 0이고 분산이 1이며 Z~N(0,1)로 표기한다. ϕ(z)는 표준정규분포의 확률밀도함수, Φ(z)는 표준정규분포의 누적분포함수를 말한다.표.. 2024. 9. 19.
연속확률변수와 확률밀도함수 연속확률변수(Continuous random variable)와 확률밀도함수(Probability density function; PDF)에 대해 소개하고자 한다.  1. 연속확률변수(Continuous random variable)연속확률변수는 확률변수가 취할 수 있는 값의 수가 셀 수 없이 많을 때 X를 연속형 확률변수라 한다.ex)  동전 2개를 던져서 앞면이 나오는 경우의 수인 이산확률변수는 X가 취할 수 있는 값의 수가 0, 1, 2로 셀 수 있다. 하지만 몸무게, 시간, 키, 온도 같은 경우에는 취할 수 있는 값의 수를 셀 수 없다.  연속확률변수의 경우, 확률을 계산할 때 특정한 값에 대한 확률이 0이다. 즉, 연속확률변수는 무한히 많은 실수 값을 가질 수 있기 때문에, 그중에서 하나의 특정.. 2024. 9. 15.
시계열 데이터(Longitudinal Data) 시계열 데이터 분석은 시간에 따른 데이터의 변화를 관찰하고 예측하는 분야로, 다양한 산업에서 광범위하게 활용되고 있습니다. 이는 과거의 패턴을 이해하고 미래를 예측함으로써, 효과적인 의사결정을 가능케 하는 핵심 도구입니다. 이 글을 통해서 시계열 데이터의 정의와 중요성, 시계열 데이터 분석의 종류, 분석 도구에 대해서 자세히 알아보도록 하겠습니다. 1. 시계열 데이터란? 시계열 데이터는 일정한 시간 간격으로 수집된 데이터를 의미합니다. 일, 월, 년 등의 시간 단위에 따라 수집된 데이터가 시계열 데이터에 해당합니다. 예를 들어, 주식 가격, 날씨 정보, 웹사이트의 일일 방문자 수 등이 시계열 데이터에 해당합니다. 시계열 데이터는 몇 가지 주요한 특징을 가지고 있습니다. 시간의 순서가 중요: 시계열 데이터.. 2023. 11. 21.
디지털 마케팅 분석(Digital Marketing Analytics) 디지털 마케팅 분석은 온라인 환경에서의 고객 행동, 마케팅 캠페인 성과, 웹사이트 성능 등을 이해하고 개선하기 위한 핵심 도구입니다. 이를 통해 기업은 고객과의 관계를 강화하고, 마케팅 ROI를 향상하며, 비즈니스 성장을 도모할 수 있습니다. 이 글을 통해서 디지털 마케팅 분석의 정의와 중요성, 디지털 마케팅의 주요 지표, 검색 엔진 최적화(SEO) 분석, 페이드 검색 광고(PPC) 등에 대해서 자세히 알아보도록 하겠습니다. 1. 디지털 마케팅 분석이란? 디지털 마케팅이란, 인터넷과 디지털 디바이스를 활용하여 제품이나 서비스를 고객에게 알리는 모든 마케팅 활동을 말합니다. 디지털 마케팅은 전통적인 마케팅 방법과는 달리, 실시간으로 데이터를 추적하고 분석하여 효과적인 마케팅 전략을 계획하고 실행하는 데 많.. 2023. 11. 21.