데이터계측분석/데이터분석 기술자료

신호처리의 평균편차, 표준편차와 분산

에이티에스 2024. 7. 23. 22:00
728x90

평균과 중앙값 모두 데이터 집합의 중심 경향을 알수 있습니다. 중위수가 특이치에 덜 민감하다는 사실에도 불구하고, 평균은 전자 및 디지털 신호 처리에서 더 자주 사용됩니다. 산술 평균은 사실 전기 공학에서 필수적인 통계 기법입니다.

그러나 데이터 세트를 적절하게 설명하거나 이해하기 위해서는 평균 이상의 것이 필요한 경우가 많습니다.

중심 경향만 보고할 때는 데이터의 중요한 측면, 즉 값이 중심 경향에서 벗어나는 방식을 고려하지 않습니다.

 

1. 평균

두 개의 아날로그 입력 신호를 디지털화했다고 가정해 보겠습니다. 디지털 코드를 다시 볼트 단위로 변환하고 이산시간 파형을 플로팅하면 다음과 같습니다.

 

 

플롯을 보는 것만으로도 평균을 추측할 수 있습니다: 파란색 신호의 중심 경향은 1.2V이고 빨간색 신호의 중심 경향은 0.8V입니다. 그러나 평균만 보고하면 이 두 신호 간의 유일한 중요한 차이점은 평균값의 0.4V 차이(또는 DC 레벨 또는 DC 오프셋이라고 부를 수 있음)라는 것을 알 수 있습니다. 

 

전기 엔지니어는 본능적으로 이러한 파형을 상당한 노이즈를 포함하는 안정적인 DC 신호(전원 공급 장치 전압)로 식별합니다.

더 중요한 것은 파란색 신호가 빨간색 신호보다 훨씬 더 노이즈가 크다는 것을  인식한다는 것입니다. 노이즈 성능의 이러한 주요 차이는 평균만 고려하면 손실됩니다.

 

통계학자가 평균에서 작은 무작위 편차를 볼 때 전기 엔지니어는 노이즈를 봅니다.

 

 

반응형

 

2. 평균 편차

데이터 세트의 편차를 정량화해야 합니다. 편차를 정량화할 때 첫 번째 본능은 각 데이터 포인트와 평균 사이의 거리를 찾은 다음 이 모든 거리의 평균을 계산하는 것입니다. 이렇게 하면 평균 편차(평균 절대 편차라고도 함), 즉 값이 중심 경향에서 벗어나는 일반적인 양을 얻을 수 있습니다.

 

다음은 수학적 언어의 평균 편차입니다.

 

 

 

여기서 N은 데이터 세트의 값 개수이고, μ는 평균이며, x[k]는 이산시간 변수 k의 함수로 표현되는 신호입니다.

 

이 그림에서 수평선은 평균 위와 아래의 평균 편차 중 하나인 전압 수준을 나타냅니다.

 

평균 편차는 직관적이지만 평균에서 벗어나는 신호의 경향을 정량화하는 가장 일반적인 방법은 아닙니다. 이를 위해서는 표준 편차가 필요합니다.

 

 

반응형

 

3. 분산 및 표준 편차

전기 공학의 맥락에서 평균 편차의 문제는 전압(또는 전류) 차이를 평균화하므로 진폭 영역에서 작동한다는 것입니다. 노이즈 현상의 특성상 노이즈를 분석할 때 진폭보다 파워를 강조하기 때문에 파워의 영역에서 작동하는 통계적 기법이 필요합니다.

 

전력은 전압 또는 전류의 제곱에 비례하므로, 우리가 해야 할 일은 합과 평균을 내기 전의 차항을 제곱하는 것입니다. 이 절차를 거치면 분산이라고 불리는 통계적 측정값이 나오고, σ2(시그마 제곱)로 표시됩니다

 

 

 

분산을 전력으로 표현된 신호의 임의 편차들의 평균 전력으로 설명할 수 있습니다. 이것은 분산이 우리가 처음부터 시작했던 값들과 같은 단위를 가지고 있지 않다는 것을 의미합니다. 만약 우리가 전압 신호의 변동을 분석하고 있다면, 분산은 V 대신 V2 단위를 가지고 있습니다.

원래의 단위를 사용하여 신호가 무작위로 벗어나는 경향을 나타내려면 최종 값에 제곱근을 적용하여 각 차이를 제곱해야 합니다:

 

 

 

반응형

 

 

이 절차는 표준 편차, 즉 진폭으로 표현된 신호의 무작위 편차의 평균 전력으로 알려진 통계 측정값을 생성합니다. 따라서 전압 신호를 분석하는 경우 전압 편차의 제곱을 사용하여 표준 편차를 계산했음에도 불구하고 표준 편차의 단위는 V입니다.

 

 

이 그림에서 수평선은 평균 위와 아래에 하나의 표준 편차인 전압 수준을 나타냅니다.

 

분산과 표준편차는 동일한 정보를 서로 다른 방식으로 표현합니다.분산이 특정 분석 상황에서 더 편리하지만, 표준 편차는 평균에서 벗어나는 신호의 경향을 측정하는 것으로 직접 해석될 수 있는 숫자이기 때문에 일반적으로 선호됩니다.

 

728x90
반응형
그리드형