False Positive (거짓 양성) 과 False Negative (거짓 음성)
False Positive 와 False Negative 는 주로 이진 분류 Binary Classification 문제에서 사용되는 용어로,
모델의 예측 결과가 실제 값과 다를 때 발생하는 오류이다
이 두 개념은 머신러닝 모델의 성능 분석, 오류 유형 파악, 이진 분류 모델 테스트에 있어 꼭 알아야 할 평가 지표이며,
다양한 AI 모델 평가, 보안 시스템, 의료 진단 등 실전에서도 널리 활용된다
| 용어 | 실제 값 | 예측 값 | 의미 | 영향 |
| True Positive (TP) | Positive | Positive | 양성이라고 맞게 예측함 | 정상 |
| True Negative (TN) | Negative | Negative | 음성이라고 맞게 예측함 | 정상 |
| False Positive (FP) | Negative | Positive | 음성인데, 양성이라고 잘못 예측함 | 오탐지 (불필요한 대응) |
| False Negative (FN) | Positive | Negative | 양성인데, 음성이라고 잘못 예측함 | 누락 (중요한 걸 놓침) |
예시: 스팸 필터
* Positive 스팸이다
* Negative 스팸이 아니다
| 결과 유형 | 예시 | 설명 |
| False Positive | 정상 메일을 스팸으로 분류 | 중요한 메일을 놓칠 수 있음 |
| False Negative | 스팸을 정상으로 분류 | 사용자에게 불편 초래 |
AI 모델 관점에서 보는 FP/ FN
1. False Positive
실제로는 Negative 인데 모델이 Positive 로 잘못 예측하는 경우
예시:
AI 얼굴 인식 보안 시스템: 등록되지 않은 사람을 등록된 사람으로 인식
스팸 필터: 정상 메일을 스팸으로 분류
질병 진단 AI: 건강한 사람을 환자로 진단
문제점:
사용자 불편 증가
불필요한 조치 발생 (불필요한 치료, 잘못된 권한 부여 등)
모델 신뢰성 하락 – 과잉 반응하는 시스템으로 보임
2. False Negative
실제로는 Positive 인데 모델이 Negative 로 잘못 예측하는 경우
예시:
질병 진단 AI: 암 환자를 정상으로 예측
침입 탐지 시스템: 해커를 정상 사용자로 판단
콘텐츠 필터링 AI: 혐오 발언을 정상 콘텐츠로 분류
문제점:
치명적인 결과 초래 (진단 누락, 보안 위협, 규제 위반 등)
법적 책임 발생 가능 (시스템 책임 가능성 증가)
사용자에게 심각한 피해
AI 모델 평가 시 활용 방법
1. Confusion Matrix 분석
FP/ FN 의 비율을 시각적으로 파악 가능
과잉 탐지/누락 탐지 여부 판단
2. 정밀도(Precision), 재현율(Recall), F1 Score
Precision: 예측한 Positive 중 진짜 Positive 의 비율 → FP 에 민감
Recall: 실제 Positive 중 모델이 찾아낸 비율 → FN 에 민감
F1 Score: Precision 과 Recall 의 조화 평균
3. Threshold 조정
도메인에 따라 적절한 기준선 설정
예: 의료 AI → FN 최소화 (재현율 중시)
예: 마케팅 추천 → FP 최소화 (정밀도 중시)
4. 오류 케이스 수집 및 재학습
FP/FN 사례를 수집해 분석하고, 모델 학습 데이터에 반영하여 성능 개선
False Positive 와 False Negative 는 단순한 통계 지표가 아니라,
AI 모델이 실제 환경에서 얼마나 신뢰할 수 있는지를 판단하는 핵심 지표이다
모델의 목적과 쓰임에 따라 FP 와 FN 의 영향은 완전히 달라질 수 있으므로,
적절한 평가 지표와 도메인 기반 판단이 함께 필요하다
'TIL > 용어' 카테고리의 다른 글
| [TIL] SQL 에서의 NULL (1) | 2025.06.19 |
|---|---|
| [TIL] Delete/ Truncate/ Drop 차이 w/ MySQL (1) | 2025.06.18 |
| Servlet 서블릿 (1) | 2025.02.13 |
| Embedded Tomcat 내장 톰캣 (1) | 2025.02.12 |
| Tomcat (1) | 2025.02.08 |