Derek 의 데이터 분석 성장기

[확률론 기초] 확률과 셈(1강 부터 4강까지) 본문

Data/통계

[확률론 기초] 확률과 셈(1강 부터 4강까지)

Derek Grey 2024. 11. 26. 22:32
반응형

 

1. 개요 

 

해당 강의는 Harvard의 'Statistics 110' 강의이다.

 확률의 기본 개념을 이해하는 것은 분석 능력을 크게 향상시킬 수 있다고 말하고 있다. 핵심 주제는 샘플 공간, 사건, 계산 원칙과 같은 기본 개념을 마스터하는 것이며, 이는 실제 문제를 해결하는 데 필수적이라고 설명하고 있다.

 해당 강의에서는 이산 확률 분포와 연속 확률 분포를 배우고, 이러한 원칙들이 유전학, 물리학, 경제학과 같은 다양한 분야에서 어떻게 적용되는지를 알게 될 수 있다고 말하고 있다.

강의를 마친 후에는 불확실성을 이해하고 이를 효과적으로 수치화하는 강력한 능력을 갖추게 될 수 있다고 말하고 있다. 이 지식은 과학적 분야뿐만 아니라 일상적인 의사 결정 상황에서도 매우 유용하다는 게 해당 강의에 대한 설명이다. 


2. 확률의 핵심 개념

샘플 공간(Sample Space) 은 확률에서 중요한 구성 요소로, 랜덤 실험의 모든 가능한 결과를 나타낸다.

사건(Event) 은 샘플 공간 내의 특정 결과 또는 결과들의 집합으로, 확률을 이해하는 데 기본이 된다.

계산 원칙(곱셈 규칙)은 사건이 발생할 수 있는 방법의 수를 구하는 데 중요하다. 이는 확률을 이해하는데 필수적이다.

이항 계수는 조합론과 확률에서 중요한 역할을 하며, 사건의 조합을 계산하는 데 유용하다고 한다. 


3. 확률과 용어 정리

  • 샘플 공간은 실험의 모든 가능한 결과를 나타내는 집합. 이를 정의하는 것이 확률 분석에서 중요하다.
  • 사건은 샘플 공간의 부분 집합으로, 특정 결과를 나타낸다.
  • 확률의 단순 정의는 모든 사건이 동일한 확률로 발생한다고 가정하고 샘플 공간이 유한하다고 가정한다. 그러나 이러한 정의는 모든 경우에 적용되는 것은 아니며, 이러한 가정이 성립하지 않는 경우도 있다.
  • 계산 원칙은 곱셈 규칙을 포함하는데, 만약 사건 1에 대해 가능한 결과가 n1n_1, 사건 2에 대해 가능한 결과가 n2n_2라면, 두 사건이 발생할 수 있는 총 결과 수는 n1×n2×⋯×nrn_1 \times n_2 \times \cdots \times n_r로 계산된다.
  • 이항 계수는 조합에서 선택 가능한 방법의 수를 계산하는 데 사용된다.

4. 확률에서의 계산 원칙

  • 곱셈 규칙은 r개의 독립적인 사건에 대해, 각 사건이 n1.. n^n 개의 의 가능한 결과를 가질 때, 총 가능한 결과 수를 모두 곱셈하고 더하는 방식이다. 
  • 이항 계수n에서 k를 선택하는 방법의 수를 계산하는데 사용됩니다. 순서를 고려하지 않고 부분 집합을 선택하는 방법을 나타낸다.

 

예를 들어 아이스크림을 와플과 콘으로 선택할 때, 만약 맛이 3가지가 있다면 이는 2 *3 으로 총 6이라는 경우의 수로 수셈과 곱셈을 표현할 수 있다.

 

지수는 다른 방식으로 생각하자면 10가지 선택이 있고, 2가지 경우 중에 선택하는 것이라면 이는 2^10 승으로 1024개의 선택지가 있는 것 이다.

 

 

그리고, 팩토리얼에 대한 개념도 나온다. n 명의 사람이 있을 때(n명의 표본공간) 그 중 k명을 선택하는 경우의 수(k개의 이벤트)를 설명하고 있는 것이다. 순서에 대한 것은 해당 경우에서 반영하지 않는다.  

 

또한, n! 이란 것은 n * (n-1) .. (n-2) .. (n-k+1) 이 되는데 이 식이 의미하는 것은 한 명을 골랐으면 그 한명은 표본 공간에서 제외되어야 하니 n-1 .. n-2 형식으로 수셈되어야 한다. 

 

링크

반응형

'Data > 통계' 카테고리의 다른 글

[베이지안] Bayesian - 확률과 베이즈정리  (0) 2024.06.12