가중치

관측치에 대한 가중치

다른 측정치에 비해 얼마나 가치있는지를 표현하는 값

정밀도가 높은 측정값

  • 작은 분산을 보입니다.
  • 좋은 측정치라고 생각할 수 있습니다.
  • 보정치가 적게 들어갑니다.

정밀도가 낮은 측정값

  • 큰 분산을 보입니다.
  • 많은 오차가 있는 값이라고 생각할 수 있습니다.
  • 보정치가 크게 들어갑니다.

가중치는 측정에 적용되는 보정 크기에 영향을 미칩니다. 어떤 값의 정밀도가 높을수록 더 많은 가중치를 부여하겠죠. 그러니까 분산이 작을수록, 가중치가 더 커집니다.

가중치는 분산에 반비례합니다. 따라서 보정 크기 역시 가중치에 반비례합니다.

가중치의 장단점

장점

  • 측정자에게 측정값의 경중을 고려할 수 있게 합니다.

단점

  • 타당한 근거가 있는 측정값이 묻힐 수 있습니다.

가중치와 여인수(cofactor)

가중치는 공분산 행렬(∑)과 관계가 있습니다. 행렬의 요소들이 분산과 공분산이기 때문이지요.
가중치들이 관계가 있기 때문에, 분산과 공분산들은 Cofactor로 대체됩니다.


여기서의 Weight matrix를 기억합시다.

상관 관계가 없는 측정치의 가중치 행렬

측정치마다의 상관 관계가 없다면, 모든 공분산은 0입니다. 그럼 앞에서의 가중치 행렬 식 W을 같은 방법으로 생각해본다면,

이렇게 식을 만들 수 있습니다.
그러니까,

입니다.

가중 평균

만약 두 개의 측정치가 있다고 생각해 봅시다. 그리고 그것의 값은 각각 420과 425라고 합시다. 이 각각의 측정치는 EDM과 tape로 측정되었고, EDM이 tape보다 2배 더 정밀도가 높다고 합시다. 그러면 위에서 식을 기반으로 weight를 420에 2, 425에 1만큼 줄 수 있습니다.

가중 평균은 가중치값을 기반으로 한 평균값

그러면 위에서의 식은 (420* 2+425)/3 = 421.7(약)입니다. 평균값인데도 425보다 420에 가깝죠? 가중치값을 이용해 정밀도가 더 높은 값에 가깝게 값을 대표값으로 지정할 수 있습니다.


가중평균 식은 다음과 같습니다. 직관적으로도 이해하기 그렇게 어렵지 않죠?

가중치와 표준오차의 관계