기초 통계와 확률 이론

기초수학 2013. 2. 6. 17:59

통계를 이용하면 통계적인 특성이 있는 표본을 숫자로 표현하고 설명할 수 있다. 즉 표본에 대한 통계적인 분석을 통하여 통계적 파라미터를 추정하고, 그 표본의 특징을 표현할 수 있다.


창원대학생들의 키를 조사한다고 가정해면,


이 때 표본으로 몇몇 학생들의 키를 재어 보았다.

153cm, 167cm, 178cm, 181cm가 나왔다고 가정해보자.

이 때 우리는 다른 사람들에게 우리가 추출한 표본의 특징에 대해서 설명해줄 필요가 있다.

이 때 사용할 수 있는 것이 표본의 평균과 분산이다.


학생들의 표본은 다음과 같이 표현해 볼 수 있다.



평균(mean)

 

 

분산(variance)


표준편차


바이어스(bias)는 데이터의 편향된 정도를 나타낸다.


공분산(covvariance)


기본적인 확률 용어에 대한 설명


확률실험/시행(random experiment)

1. 같은 조건 아래에서 반복할 수 있으며,

2. 시행의 결과는 매번 우연히 변하므로 예측할 수 없으나, 가능한 모든 결과의 집합을 알 수 있고,

3. 시행을 반복할 때 결과는 각각 불규칙하게 나타나지만, 반복의 수를 늘리면 어떤 규칙성이 나타나는 특징을 가지는 행위를 확률실험이라고 한다.

예를 들면, 주사위를 던지는 행위 자체는 확률실험이 된다.

 

표본공간(sample space)

관찰할 면을 지정하고, 일어날 수 있는 결과의 범위를 규정한 다음, 그 범위 내의 각 결과에 기호를 대응시킨 후 얻은 기호화된 결과의 집합을 표본공간이라고 한다.


이 예제에 있어서는 '1'은 '1이라는 눈이 나온 것', '2'는 '2라는 눈이 나온것'...을 의미한다.


사건(event)

표본공간의 부분 집합을 사건이라고 한다.

 

짝수의 눈이 나오는 사건, 홀수의 눈이 나오는 사건, 2이하의 눈이 나오는 사건를 생각해 볼 수 있다.

이러한 특정 조건을 통해서 사건를 설정해 줄 수 있다.

 

사건역시 공간을 구성할 수 있는데, 각각의 사건의 원소들이 다른 사건의 원소와 중복되자 않으면서 모든 사건을 모은 집합을 사건공간이라고 표현한다.

결과적으로는 사건공간은 전체집합과 같게 된다.

 

예를 들면, 주사위에서 짝수의 눈이 나올 사건과 홀수의 눈이 나올 사건를 생각해보자.

 

각각의 사건을 A, B의 집합으로 표현해 보면 A={2, 4, 6}, B={1, 3, 5}가 된다.

각 사건의 원소들이 다른 사건원소들과 겹치지 않으며 A와 B를 모두 합하면 곧 전체집합이 된다.


 

ex1]

동전 던지기는 그 결과가 확률적으로 변하므로 확률 실험(시행)이다.


이때 가능한 모든 결과는 H(앞면)와 T(뒷면)의 2가지이므로, 표본공간 S={H, T}로 나타낼 수 있다.

표본공간의 부분집합{H}는 사건의 한 예로, "앞면이 나오는 사건"이라고 볼 수 있다.

마찬가지로{H, T} "앞면이나 뒷면이 나오는 사건"이다.


ex2]

주사위 던지기도 마찬가지로 확률실험(시행)으로, 표본공간은 S= {1, 2, 3, 4, 5, 6}이다.

사건의 예로는{2, 4, 6}과 같이 "짝수의 눈이 나오는 사건"이나,{1, 2, 3}과 같이 "4보다 작은 수의 눈이 나오는 사건" 등으로 매우 다양하다.


ex3]

우니나라 전체 인구 중 한 사람을 뽑아 몸무게를 재는 실험(시행)도 그 몸무게 결과가 하나로 결정되지 않고, 확률적으로 정해지므로 하나의 확률실험이다. 표본 공간은 나올수 있는 모든 결과 이므로 "0보다 큰 실수 집합"이다.

사건으로는 "50kg 보다 크고 60kg보다 작은 몸무게가 관측되는 사건" 등을 생각할 수 있다.



 

확률을 숫자말고 그림으로 나타내는 방법 중 벤다이어그램

 

 

그림이 보다 직관적이기 때문에 쉽게 확인할 수 있다. 살펴보면 두 사건이 동시에 발생할 수 있는 교사건과 동시에 발생할 수 없는 배반사건을 볼 수 있다.

 

조건부 확률(Conditional Probabilities)

A와 B 두개의 사건이 있을 경우, 사건 B가 일어날 확률이 이미 알려져 있을 경우에 사건 A가 일어날 확률

'the probability if A given B'


조건부 확률 P(A|B)은 'B가 일어났다고 가정할 때, A의 조건부 확률' 또는 '주어진 B에 대한 A의 확률

 

ex1]

주사위의 예로 들면, 사건 A는 2이하의 눈이 나오는 경우, 사건 B는 홀수의 눈이 나오는 경우라고 하자.

A= {1, 2}

B={1, 3, 5}


P(A|B)를 직접 원소를 구해보면,

먼저 B에는 1, 3, 5의 3가지 원소만 존재한다.


따라서, 홀수의 눈이 나왔을 때 그 눈이 2이하일 확률은,

1, 3, 5 중 1이 나와야 하고, 각 눈이 나올 확률은 모두 같으므로, P(A|B)= 1/3이 된다.


반대로

2이하의 눈이 나왔을 때, 그눈이 홀수일 확률은 P(B|A) =1/2가 된다.

즉, 어떤 것을 기준(base)로 하느냐에 따라서 조건부 확률은 다양한 결과가 나온다.


이러한 결과는 위에서 본 수식으로 구할 수 있다.

P(A)= 1/3, P(B)= 1/2, P(A∩B)= 1/6이므로,

앞서 구한 결과와 일치한다.


전체 확률 이론


베이즈 정리(Bayes's Theorem)


 

확률에 관한 정리

1번은 확률은 0과 1사이의 실수 값이다.

2번은 표본공간의 확률은 1이다.

3번은 두 사건 A,B가 동시에 일어날 수 없을 때 A,B는 서로 배반한다고 하는데, 서로 배반인 사건의 합의 확률은 각 확률의 합과 동일하다.

 

참조:

1. 패턴인식 개론, 한빛미디어

2. http://blog.acronym.co.kr/400

3. http://blastic.tistory.com/156

반응형

'기초수학' 카테고리의 다른 글

확률변수와 확률분포  (0) 2013.02.19
[선형 대수학]벡터와 행렬  (0) 2013.02.06