본문 바로가기

컴퓨터 비전/이론

정확률과 재현율 완벽정리

이거 정말 헷갈리는 개념인데요. 그냥 블로그에 위키백과만 가져와서 붙여넣기한 포스팅만 보면 완전히 헷갈립니다. 이 포스팅을 보시면 완벽히 이해되실 겁니다. 가장 중요한게 모델의 예측(긍정,부정) 진리표 입니다.

왜 중요하냐면 성능지표가 두가지 관점이기 때문입니다.

 

  • True Positive(TP) : 참인 긍정 (진리표: 참)
  • False Positive(FP) : 틀린 긍정 (진리표: 거짓)
  • False Negative(FN) : 틀린 부정 (진리표: 참)
  • True Negative(TN) : 참인 부정(진리표: 거짓)

여기서 우리는 모델의 성능을 알고 싶습니다. 일반적으로 맞는걸 찾는것에 관심이 많기때문에 모델의 성능은 정확률과 재현율을 가장 많이 씁니다.

 

정확률은 쉽습니다. 모델이 긍정으로 찾은것중에 실제 맞는게 몇개인지 입니다.

 

재현율은 관점이 바뀝니다.(이게 바로 혼동의 원인입니다.) 실제 진리표에서 참인것중에 모델이 몇개를 맞췄는지 입니다.   

 

하지만 정확률은 모델이 정답 100개중에 한개만 찾았는데 그것이 참이면 100%라는 수치가 나오고

재현율은 정답은 1개인데 모델이 그 한개를 포함한 100개를 찾아도 100%라는 수치가 나옵니다. 따라서 이 둘은 상호 보완적인 성격입니다.

 

그래서 이 두가지 지표를 조화평균한 F1-score가 가장 일반적으로 모델의 성능을 나타낸 지표라고 할수있습니다.

감사합니다.

'컴퓨터 비전 > 이론' 카테고리의 다른 글

Edge Detection  (0) 2023.02.09
Interpolation  (0) 2023.02.08
히스토그램과 이진화  (0) 2023.02.06