확률변수와 확률분포

기초수학 2013. 2. 19. 16:09

1.확률변수(random variable), RV

확률실험 결과 하나하나를 수치로 대응시키는 함수

 

몇 가지 예제를 통해 이해해보자.

 

ex1] 두 개의 동전을 전지는 화률실험에서 앞면이 낭는 횟수의 규칙으로 만들어지는 확률변수 X의 x는 {0, 1, 2}

 

앞면이 0회, 1회, 2회 나오는 확률은 각각 1/4, 1/2, 1/4가 된다. 왜냐하면 앞면이 0회나오는 사건은(T, T)의 1가지 경우, 앞면이 1회 나오는 사건은 (H, T),(T, H)의 2가지 경우, 앞면이 2회 나오는 사건은(H, H)의 1가지 경우로 이루어지고 있기 때문이다. 이 때에 앞면이 0회, 1회, 2회 나오는 사건을 동등하다고 생각하여 각각 1/3, 1/3, 1/3으로 생각해서는 안된다.

 

ex2] 1개의 동전을 2회 던지는 시행에서 쌍을 관찰할 때

 

ex3] 주사위를 던지는 실험, 결과값이 숫자인 경우는 표본 공간의 원소값과 대응값을 동일하게 정의

ex4] 두 개의 주사위 위에 있는 점들의 합의 규칙으로 만들어지는 확률변수 X의 값 x는{2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

-표본 공간: S={2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

 

example5] 학생들의 키를 측정하는 실험(조사), "50kg 보다 크고 60kg보다 작은 몸무게에 관심이 있을 때

-표본 공간:

-확률변수  x 는 각 학생들의 키의 측정치이다.

 

 

 

패턴인식 문제에서 대상 객체를 감지하여 받아들이는 과정을 랜덤시행이라고 할 수 있으며, 특징 벡터는 어떠한 척도에 따라 관측한 수치적 속성에 해당한다고 할 수 있다.

예를 들어, 영공에 침범한 적의 항공기를 인식하고자 할 때, 항공기의 모양을 결정하는 파라미터들을 측정하고, 이를 확률변수로 정의할 수 있다.

그림과 같이 확률변수 X는 랜덤시행의 표본공간에서 매 출력에 대하여 실수 X()를 할당하는 함수로 정의할 수 있다. 그러므로 이 함수 X()는 표본공간상의 가능한 모든 요소로부터 확률변수 값인 실선(실수)상의 임의의 점으로 매핑된다. 그리고 매 출력에 값들을 할당하는 함수는 결정적으로 고정되어 있으며, 주사위를 굴린 후의 결과값과 같이 이산확률변수인 경우와 샘플을 취한 개인의 몸무게와 같이 연속확률변수인 경우가 있다.

 

 

2.확률분포(probability distribution)

 수치로 대응된 확률변수의 개별 값들이 갖는 확률값의 분포

 

ex1]의 경우는 확률변수 X가 x의 값을 가질 확률P(X=x) 혹은 p(x)라고 표시하고, 다음과 같은 확률분포표가 만들어 질 것이다.


 

example1] 동전을 2개 던지는 실험, 앞면이 나오는 횟수에 대한 확률분포표

 

 0

 1

 2

 

 1/4

 (1/4)+(1/4)=2/4, 1/2

 1/4

 example2] 주사위를 2개 던지는 실험, 두 개의 주사위 위에 있는 점들의 합에 대한 확률분포료

 

 2

 3

 4

5

6

10 

11 

12 

 1/36

 2/36

 3/36  4/36  5/36  6/36  5/36  4/36  3/36  2/36  1/36

 

그리고 확률변수가 취할 수 있는 구체적인 값 하나 하나를 확률공간상의 확률값으로 할당해 주는 함수를 확률분포함수 혹은 확률함수하고 한다.

 

3.확률함수의 종류

확률변수가 이산확률변수면 이산적인 확률분포를 가지며, 그 분포는 확률질량함수(pmf)에 따른다

만약 연속확률변수면 연속적인 확률분포를 가지며 그 분포는 확률밀도함수(pdf)에 따른다. 확률함수에는 누적분포함수,(pcf), 확률밀도함수(pdf), 확률질량함수(pmf)가 있다.

 

1)누적분포함수(cdf, cumulative distribution function)

그림(a)연속확률변수 X의 누적분포함수

그림(b)이산확률변수 X의 누적분포함수

 

누적분포함수의 성질

1. 항상 0에서 1사이의 값만을 가질 수 있다.

2. x의 값이 커짐에 따라 증가하는 증가 함수이다.

3. 확률변수 X의 값이 어떤 구간안에 속할 확률은  cdf값의 차이와 같다.

 

연속이든 이산이든 상관없이 성립한다.

 

연속확률변수

어떤 확률변수 X의 cdf가 연속함수일 때 X는 연속확률변수이다. 

 

이산확률변수에서의 cdf는 일종의 계단형태의 모양을 가지게 된다.

특정 point에서 cdf값이 한번에 뛰어 오르기 때문에 연속한다고 하기 어렵다.

반면, 연속확률변수의 그래프는 직선 혹은 곡선, 혹은 두가지 복합된 형태로 나타날 수 있다.

계단 형태가 나온다면 최소한 연속확률변수라고 부르기 어렵다. 

 

ex1]

 

cdf 그래프로 나타내 보면 위와 같이 그릴 수 있다.

아래의 식으로 표현할 수 있다.

 

 


2)확률밀도함수(pdf, probability density function)

 

-확률밀도함수는 확률변수 X가 특정한 값 a와 b사이에 있을 확률, 즉 P(a<X<b) 값을 계산하는데 사용될 수 있다.

 

확률밀도함수의 성질

-확률밀도함수는 항상 0보다 큰값을 가진다.

-확률밀도함수를 x가 가질 수 있는 모든 값의 범위에서 적분하면 1이 된다.

 

 확률밀도함수

몸무게에 대한 확률밀도함수가 그림과 같이 주어질 때, 몸무게가 46에서 90사이에 있을 확률은 색칠된 영역의 면적에 해당된다.


3)확률질량함수(pmf, probability mass function)

이산확률변수 X의 확률질량함수는 다음과 같이 정의된다.

단, P(X=x)는 X가 x가 될 확률을 말한다.

 

확률질량함수는 어던 이산확률변수 X에 대한 확률모델이다.

즉, 표본공간을 구성하는 각각의 결과마다 어떤 확률을 부여한 것이다.

 

예를 들어, 앞면이 나올 확률이 0.8, 뒷면이 나올 확률이 0.2인 동전이 있다고 하자.

표본공간은 S={H, T}라고 하자. 이 확률실험를 확률변수 X로 나타내면, X는 앞 또는 뒤 둘 중 하나의 값을 가질 수 있다.

그러면 이 확률변수 X의 확률질량함수는 다음과 같이 정의할 수 있다.

주의할 것은 H와 T이외의 것이 아노는 것에 대해서는 확률이 0 이라고 표시를 해 주어야 한다.

값 H와 T에 각각 0.8과 0.2의 확률이 부여됐다.

또한 0.8, 0.2와 같은 숫자대신 확률변수 X가 가질 수 있는 값에 대한 관계식으로 함수를 표현할 수도 있다.


4.확률변수의 통계량

 

1)기대값(확률변수의 평균)

-일반 데이터의 성질을 표본 성질이라고 하는데, 확률분포의 성질은 모델 또는 모집단 성질이라고 한다

확률변수의 평균과 분산은 일반 데이터에 대한 평균()및 분산()과 구별하기 위해 모집단의 평균으로

를, 모집단의 표준편차로 를 사용한다.

 

일반적인 표본 평균은

만약 X의 모든 값들의 범위를  x라고 할 때, 를 x값을 가진 데이터점의 수라고 하자. 그러므로 위의 표본 평균은 이 되고, 여기서 는 상대도수가 된다. n값을 증가시키면 통계적 확률, 즉 근사 확률 p(x)에 접근하게 된다.

 

그러므로 이 되고, 이 식을 X의 기대값(expectation)이라고 한다.

연속확률변수인 경우는:

 

2)분산과 표쥰푠처

연속확률변수인 경우는:

 

참조:

1. 패턴인식 개론, 한빛미디어

2.http://blog.daum.net/gongdjn/62


반응형

'기초수학' 카테고리의 다른 글

기초 통계와 확률 이론  (0) 2013.02.06
[선형 대수학]벡터와 행렬  (0) 2013.02.06

기초 통계와 확률 이론

기초수학 2013. 2. 6. 17:59

통계를 이용하면 통계적인 특성이 있는 표본을 숫자로 표현하고 설명할 수 있다. 즉 표본에 대한 통계적인 분석을 통하여 통계적 파라미터를 추정하고, 그 표본의 특징을 표현할 수 있다.


창원대학생들의 키를 조사한다고 가정해면,


이 때 표본으로 몇몇 학생들의 키를 재어 보았다.

153cm, 167cm, 178cm, 181cm가 나왔다고 가정해보자.

이 때 우리는 다른 사람들에게 우리가 추출한 표본의 특징에 대해서 설명해줄 필요가 있다.

이 때 사용할 수 있는 것이 표본의 평균과 분산이다.


학생들의 표본은 다음과 같이 표현해 볼 수 있다.



평균(mean)

 

 

분산(variance)


표준편차


바이어스(bias)는 데이터의 편향된 정도를 나타낸다.


공분산(covvariance)


기본적인 확률 용어에 대한 설명


확률실험/시행(random experiment)

1. 같은 조건 아래에서 반복할 수 있으며,

2. 시행의 결과는 매번 우연히 변하므로 예측할 수 없으나, 가능한 모든 결과의 집합을 알 수 있고,

3. 시행을 반복할 때 결과는 각각 불규칙하게 나타나지만, 반복의 수를 늘리면 어떤 규칙성이 나타나는 특징을 가지는 행위를 확률실험이라고 한다.

예를 들면, 주사위를 던지는 행위 자체는 확률실험이 된다.

 

표본공간(sample space)

관찰할 면을 지정하고, 일어날 수 있는 결과의 범위를 규정한 다음, 그 범위 내의 각 결과에 기호를 대응시킨 후 얻은 기호화된 결과의 집합을 표본공간이라고 한다.


이 예제에 있어서는 '1'은 '1이라는 눈이 나온 것', '2'는 '2라는 눈이 나온것'...을 의미한다.


사건(event)

표본공간의 부분 집합을 사건이라고 한다.

 

짝수의 눈이 나오는 사건, 홀수의 눈이 나오는 사건, 2이하의 눈이 나오는 사건를 생각해 볼 수 있다.

이러한 특정 조건을 통해서 사건를 설정해 줄 수 있다.

 

사건역시 공간을 구성할 수 있는데, 각각의 사건의 원소들이 다른 사건의 원소와 중복되자 않으면서 모든 사건을 모은 집합을 사건공간이라고 표현한다.

결과적으로는 사건공간은 전체집합과 같게 된다.

 

예를 들면, 주사위에서 짝수의 눈이 나올 사건과 홀수의 눈이 나올 사건를 생각해보자.

 

각각의 사건을 A, B의 집합으로 표현해 보면 A={2, 4, 6}, B={1, 3, 5}가 된다.

각 사건의 원소들이 다른 사건원소들과 겹치지 않으며 A와 B를 모두 합하면 곧 전체집합이 된다.


 

ex1]

동전 던지기는 그 결과가 확률적으로 변하므로 확률 실험(시행)이다.


이때 가능한 모든 결과는 H(앞면)와 T(뒷면)의 2가지이므로, 표본공간 S={H, T}로 나타낼 수 있다.

표본공간의 부분집합{H}는 사건의 한 예로, "앞면이 나오는 사건"이라고 볼 수 있다.

마찬가지로{H, T} "앞면이나 뒷면이 나오는 사건"이다.


ex2]

주사위 던지기도 마찬가지로 확률실험(시행)으로, 표본공간은 S= {1, 2, 3, 4, 5, 6}이다.

사건의 예로는{2, 4, 6}과 같이 "짝수의 눈이 나오는 사건"이나,{1, 2, 3}과 같이 "4보다 작은 수의 눈이 나오는 사건" 등으로 매우 다양하다.


ex3]

우니나라 전체 인구 중 한 사람을 뽑아 몸무게를 재는 실험(시행)도 그 몸무게 결과가 하나로 결정되지 않고, 확률적으로 정해지므로 하나의 확률실험이다. 표본 공간은 나올수 있는 모든 결과 이므로 "0보다 큰 실수 집합"이다.

사건으로는 "50kg 보다 크고 60kg보다 작은 몸무게가 관측되는 사건" 등을 생각할 수 있다.



 

확률을 숫자말고 그림으로 나타내는 방법 중 벤다이어그램

 

 

그림이 보다 직관적이기 때문에 쉽게 확인할 수 있다. 살펴보면 두 사건이 동시에 발생할 수 있는 교사건과 동시에 발생할 수 없는 배반사건을 볼 수 있다.

 

조건부 확률(Conditional Probabilities)

A와 B 두개의 사건이 있을 경우, 사건 B가 일어날 확률이 이미 알려져 있을 경우에 사건 A가 일어날 확률

'the probability if A given B'


조건부 확률 P(A|B)은 'B가 일어났다고 가정할 때, A의 조건부 확률' 또는 '주어진 B에 대한 A의 확률

 

ex1]

주사위의 예로 들면, 사건 A는 2이하의 눈이 나오는 경우, 사건 B는 홀수의 눈이 나오는 경우라고 하자.

A= {1, 2}

B={1, 3, 5}


P(A|B)를 직접 원소를 구해보면,

먼저 B에는 1, 3, 5의 3가지 원소만 존재한다.


따라서, 홀수의 눈이 나왔을 때 그 눈이 2이하일 확률은,

1, 3, 5 중 1이 나와야 하고, 각 눈이 나올 확률은 모두 같으므로, P(A|B)= 1/3이 된다.


반대로

2이하의 눈이 나왔을 때, 그눈이 홀수일 확률은 P(B|A) =1/2가 된다.

즉, 어떤 것을 기준(base)로 하느냐에 따라서 조건부 확률은 다양한 결과가 나온다.


이러한 결과는 위에서 본 수식으로 구할 수 있다.

P(A)= 1/3, P(B)= 1/2, P(A∩B)= 1/6이므로,

앞서 구한 결과와 일치한다.


전체 확률 이론


베이즈 정리(Bayes's Theorem)


 

확률에 관한 정리

1번은 확률은 0과 1사이의 실수 값이다.

2번은 표본공간의 확률은 1이다.

3번은 두 사건 A,B가 동시에 일어날 수 없을 때 A,B는 서로 배반한다고 하는데, 서로 배반인 사건의 합의 확률은 각 확률의 합과 동일하다.

 

참조:

1. 패턴인식 개론, 한빛미디어

2. http://blog.acronym.co.kr/400

3. http://blastic.tistory.com/156

반응형

'기초수학' 카테고리의 다른 글

확률변수와 확률분포  (0) 2013.02.19
[선형 대수학]벡터와 행렬  (0) 2013.02.06

[선형 대수학]벡터와 행렬

기초수학 2013. 2. 6. 17:36

1. 벡터 이론

1)주요 개념와 용어

 

벡터(vector)

-크기와 방향을 갖는 어떠한 물리량

-패턴인식에서 인식 대상이 되는 객체가 특징으로 표현되고, 특징은 차원을 가진 벡터(열 벡터)로 표현 :특징벡터(feature vector) [[1 x N : 행 벡터, M x1 : 열 벡터, 1 x 1 : 스칼라]]

                     

-행렬 A의 각 성분(entry)은 로 표현

 

백터의 전치(transpose)

-행과 열을 바꾼 행렬 (Nx1행렬을 1xN으로, 혹은 1xN행렬을 Nx1행렬로)

 

 

벡터의 크기(norm)

-원점에서 벡터 공간상의 한 점까지의 거리

 

 

 

단위 벡터(unit vector)

-벡터의 크기가 1인 벡터

-만약 벡터 v가 영(0)이 아닌 벡터라면 v방향의 단위 벡터 u는 다음과 같이 구함 :벡터의 정규화(normalization)

 

 

스칼라 곱

-임의의 벡터에 임의의 실수(스칼라) 를 곱하는 것

 

 

내적(dot product or inner product)

-차원이 동일한 두 개의 벡터 A, B에 대하여 성분별로 곱하여 합하는 것

-내적의 결과는 실수 스칼라가 됨

 

-두 벡터 사이의 각 가 주어질 경우의 내적 계산

 

 

외적(cross product)

-소행렬식을 이용한 determinent 구하는 방법

 

수직사영(vertical projection)

 

 

선형 결합(linear combination, 1차 결합)

-벡터 집합 를 스칼라 계수 집합 과의 곱의 합으로 표현할수 있을 때, 벡터 y를 벡터 x의 선형 결합이라고 함

 

 

선형 종속(linearly dependent), 선형 독립(linearly independent)

-벡터의 집합 중 적어도 하나를 다른 벡터들의 선형 결합으로 표현할 수 있다면, 이 벡터 집합은 "선형 종속" 이라고 함

-위 식을 만족하는 유일한 해가 라면 벡터 집합은 "선형 독립" 이라고 함

 

기저 집합(baseis set)

-행렬 Nx1로 표현되는 모든 벡터를 표현할 수 있는 벡터의 집합

 

유클리디안 거리

 

2.행렬 대수

-M(i)개의 행과 N(j)개의 열을 가진 실수 혹은 복소수로 이루어진 사각형 블록

 

-

: i번째 행과 j번째 열의 성분/원소

 

1)행렬의 종류

 

전치(transpose) 행렬

-원래 행렬(A)의 행과 열을 바꾸어 놓은 행렬

 

-

전방(square)행렬

-행의 수와 열의 수가 동일한 행렬

-역행렬, 행렬식, 고유식 계산은 모두 정방행렬인 경우만을 대상으로 함

 

대각(diagonal) 행렬

-행렬의 대각 성분을 제외하고는 원소가 모두 영인 행렬

 

-스칼라 행렬 : 대각 성분이 모두 같고 비대각 성분이 모두 0인 정방행렬

-상삼각 행렬 : 대각 성분 아래 성분이 모두 0인 정방행렬

-하삼각 행렬 : 대각 성분 위 성분이 모두 0인 정방행렬

 

항등(identity)행렬(단위행렬)

-대각 성분이 모두 1이고 그 밖의 성분이 모두 0인 정방행렬

 -항등행렬은 행렬 대수에서 1과 같은 역할을 하기 때문에 행렬의 곱셈 결과에 영향을 주지 않으면서 임의로 삽입 또는 삭제할 수 있음

 

대칭(symmetric)행렬

-대각선을 축으로 모든 성분이 대칭되는 행렬

-

행렬 행렬이 같기 때문에 이는 대칭행렬

 

영 행렬

-행렬 구성 원소가 모두 0인 행렬

-행렬 대수에서 0과 같은 역할

 

직교(orthogonal) 행렬

-주어진 행렬 A가 정방행렬일 때 를 만족하는 행렬

-요인 분석, 주성분 분석, 판별 분석 등에서 널리 사용

 

 

2)행렬의 곱셈

-행렬 A의 열의 수와 행렬 B의 행의 수가 같을 경우에만 곱셈이 가능

곱셈의 결과 (행렬 A의 행의 수) x (행렬 B의 열의 수)의 크기의 행렬

 

-

 

3)행렬의 트레이스 tr(A)

-정방행렬에서 대각 성분의 합

-행렬의 고유값 문제에서 고유근을 구할 때 매우 중요한 역할을 함

 

4)역행렬

 

-

-

-행렬 A가 정방행렬이어야 함

-행렬식의 값이 0이 아니어야 함

 

5)행렬식 (혹은 det(A)

-행렬을 어떠한 하나의 실수 값으로 표현한 것

-행렬식의 설질

-행렬식은 오직 정방행렬에서만 정의함

-구성 성분이 하나인 행렬의 행렬식은 그 성분 자체

-행렬식의 값은 하나의 상수, 즉 이므이의 실수

-n차의 행렬식 은 n개의 행과 열의 위치가 서로 다른 성분들의 곱의 합으로 표현

 -2x2 행렬에 대한 행렬식

 

-3x3 행렬에 대한 행렬식

 

 

6)고유값과 고유벡터

-통계학의 다변량 분석에서 많이 사용되는 주요 개념

-행렬 A가 nxn의 정방행렬이고, 인 벡터 가 존재할 때, 다음 관계를 만족하는 스칼라 를 행렬 A의 고유치(eigenvalue)라고 하고, 벡터 x 는에 대응하는 A의 고유 벡터(eigenvector)라고 함

 

 

7)선형 변환

-벡터 으로부터 벡터 상으로 매핑하는 것

-패턴인식에서 특징 벡터의 차원을 축소하는데 이용

 

 

 

 

 

참조:

1. 패턴인식 개론, 한빛미디어

2. Basic Mathematics for Pattern Recognition, 부경대학교, 2011

 

 

 

반응형

'기초수학' 카테고리의 다른 글

확률변수와 확률분포  (0) 2013.02.19
기초 통계와 확률 이론  (0) 2013.02.06