확률과 통계에 대해 공부하다 보면 정규 분포라는 걸 자주 보게 되죠. 중심 극한 정리에 등장하는 아주 중요한 분포예요. 중심 극한 정리도 언젠가 기회가 되면 소개할 생각이지만, 기초가 되는 확률 이론들을 소개한 다음이 될 것 같네요.
평균 mean이
확률 밀도 함수로 확률을 표현할 때는 적분을 하게 되죠. 전체 확률은 1이라야 하니 표준 정규 분포의 확률 밀도 함수를 생각하면
직접 이 식을 계산해 보려고 하면 잘 되지 않을 거예요. 일반적인 방법으론 적분이 불가능하죠. 하지만 이렇게 정확한 값을 구할 수 있는 단서는 적분할 수 없는 함수 자체에 있어요. 같은 밑을 가지는 두 거듭제곱의 곱은 지수의 합으로 표현할 수 있다는 걸 이용하는 거죠.
두 정적분의 변수가 다르다면 그 곱은 하나를 상수로 취급해 나머지 하나의 적분 내부로 넣어줄 수 있어요.
가우스 적분을 두 변수 x와 y에 대해 표현하고 그 둘을 곱해 위와 같은 방식으로 나타내면, 지수가
이제 직접 계산해 보면,
위의 중적분은 회전체의 부피로 생각할 수도 있어요. 일반적으로 중적분에서 두 변수
반대로, 유한한 범위에서 적분한다면 이런 방법을 쓸 수 없다는 말이 돼요. 실제로 0에서 어떤 실수까지의 구간에서 적분한 구체적인 값을 다른 함수나 상수들로 간단히 나타내기는 힘들죠. 이 함수의 상한과 하한을 각각 1과 -1로 조정한 함수
물론 구체적인 식으로 주어져 있으니 근삿값을 구할 수 있죠. 특히 테일러 정리를 이용해서 쉽게 근삿값을 계산할 수 있어요. 오차 함수의 매클로린 급수
표준 정규 분포의 누적 분포 함수 cumulative distribution function도 확률 밀도 함수의 적분으로 나타나니 비슷한 형태를 가져요. 당연히 오차 함수를 이용해 나타낼 수도 있죠.