데이터계측분석/전기전자 기술자료

전기 공학의 정규 분포

에이티에스 2024. 7. 23. 06:48
728x90

전기 공학, 특히 확률 밀도 함수를 평가할 때 사용하는 정규 분포에 대해 알아보겠습니다. 

 

1. 정규 분포(Normal Distribution)란?

노이즈 신호의 전압 레벨, 47kΩ 저항의 실제 저항 값, 엔지니어링 수업의 테스트 점수, 잔디밭의 풀잎 길이 등 다소 무작위로 변하는 양을 반복적으로 측정하면 점점 더 많은 데이터가 축적됨에 따라 값 분포가 다음과 같이 될 수 있습니다. 점차적으로 아래 표시된 모양과 비슷해집니다.

 

정규 분포 또는 가우스 분포를 나타내는 히스토그램

 

이를 정규 분포 또는 가우스 분포라고 합니다. 익숙한 종형 곡선 모양을 따르지만 다른 유형의 분포도 유사한 모양을 가지므로 "종형 곡선"보다는 "정규" 또는 "가우스"라는 이름을 사용하는 것이 중요합니다. 공학, 물리 과학 및 사회 과학에서 연구되는 수많은 현상은 통계적으로 분석될 때 정규 분포를 생성합니다.

 

 

반응형

 

2. 정규 분포의 특성

정규 분포는 데이터 집합의 값을 설명하는 수학적으로 정의된 관계이며, 실제 측정은 표본 크기가 증가함에 따라 이 관계를 근사화합니다. 정규 분포의 몇 가지 중요한 기능을 살펴보겠습니다.

 

  • 분포의 일반적인 형상은 함수를 플로팅하여 생성됩니다

  • 주어진 정규 분포의 특정 모양은 평균과 표준 편차에 의해 완전히 정의됩니다. 즉, 정규 분포 데이터 세트의 평균과 표준편차를 알면 히스토그램의 형태를 플로팅할 수 있습니다.
  • 평균은 곡선의 중심이 될 위치를 결정하고 표준 편차는 겉보기 너비를 결정합니다. 위에 표시된 분포에서 평균은 0이고 표준 편차는 5입니다.
  • 이론적으로 가우스 곡선은 양수 및 음의 무한대로 확장되지만 값이 평균보다 약 3 표준 편차 이상 높거나 낮을 때 예상 발생 횟수는 매우 작아집니다.

 

 

반응형

 

3. 히스토그램과 확률 밀도 함수

정규 분포를 따르는 변수에 대해 많은 양의 데이터를 수집하면 해당 데이터를 히스토그램으로 표시할 수 있으며 가우스 곡선 모양을 갖게 됩니다. 반면에 데이터의 평균과 표준 편차를 알면 경험적 관측에 해당하는 확률 밀도 함수를 그릴 수 있습니다.

 

이를 위해 다음 공식을 사용합니다.

 

 

여기서 μ는 평균이고 σ는 표준 편차입니다.

다음은 평균이 0이고 표준 편차가 5인 정규 분포 변수의 확률 밀도 함수의 플롯입니다.

정규 분포 변수의 플롯 밀도 함수

 

반응형

 

1) 확률 밀도 함수 해석

주어진 간격(예: -3에서 +3까지) 내에서 P(x) 곡선 아래 면적을 계산하여 무작위로 선택한 측정값이 이 간격 내에 속할 확률을 결정합니다.

실용적인 목적을 위해 P(x)를 무작위로 선택된 측정값이 특정 값과 거의 같을 가능성으로 해석할 수도 있습니다.

 

예를 들어, 위에 표시된 확률 밀도 함수가 센서 신호의 전압(밀리볼트)을 측정하여 생성한 히스토그램에 해당한다고 가정해 보겠습니다. 모든 값은 가장 가까운 밀리볼트로 반올림되었습니다. 평균은 0V이고 표준 편차는 5mV입니다.

 

위에 주어진 공식을 사용하여 가우스 P(x)를 계산하고 P(x)를 플로팅하여 측정된 센서 전압의 분포를 연속적으로 수학적으로 표현한 곡선을 생성했습니다. 이제 플롯을 살펴보면 6mV 값이 P(x) = 0.04에 해당하며, 이는 무작위로 선택된 전압 측정값이 약 6mV가 될 확률이 4%임을 나타냅니다.

 

확률 밀도 함수는 연속형이며, 따라서 확률은 가로 축을 따라 하나의 정확한 값이 아닌 구간에 대해서만 0이 아닙니다.

 

 

반응형

 

2) 확률 밀도 함수의 정규화

모든 확률 밀도 함수는 곡선 아래의 전체 면적이 1이 되도록 정규화됩니다.

이는 의미가 있습니다: 전체 곡선 아래의 영역은 무작위로 선택된 측정값이 전체 곡선에 해당하는 구간 내에 속할 확률을 제공합니다. 값이 이 구간 어딘가에 있을 확률이 100%이므로 P(x)를 적분한 결과는 1이어야 합니다.

 

이 정규화로 인해 P(x)와 히스토그램을 동일한 축에 플로팅하면 일치하지 않습니다: P(x)는 세로 축에서 0에서 0.08까지만 확장되는 반면 히스토그램은 0에서 8000까지 확장됩니다(100,000개의 데이터 포인트를 사용하여 생성되었기 때문에).

 

그러나 P(x)에 100,000을 곱하고 결과 곡선을 히스토그램 플롯에 포함하면 가우스 확률 밀도 함수가 측정된 분포를 수학적으로 캡처한다는 것을 알 수 있습니다.

 

 

P(x)에 100,000을 곱하고 결과 곡선을 히스토그램 플롯에 포함할 때의 가우스 확률 밀도 함수입니다.

728x90
반응형
그리드형