풍선 검출기 사각지대(손글씨 효과음·크레딧·UI 텍스트) 보완 · 임계값 튜닝 · 2026-06-13 · ← 프로젝트 개요
comic-text-detector(mayocream ONNX)의 텍스트 세그멘테이션 마스크를 풍선 마스크와 합집합한다. 200컷을 스캔해 텍스트 검출기가 풍선 밖에서 추가로 잡는 면적이 큰 순으로 12컷을 자동 선별 — 효과음이 많은 컷이 위로 온다.
성공: 손글씨 효과음("콰르르르..", "괴...", "!!"), 작가 크레딧("글ㅣ우시목 그림ㅣ이하안"), 채팅 UI 텍스트 — 풍선 검출기가 못 잡던 비-풍선 텍스트를 정확히 제거. 이게 d45에 남았던 잔재의 정체다.
오검출: 상위 컷(26%, 12%)의 큰 빨강 영역은 효과음이 아니라 하프톤(스크린톤) 점무늬를 텍스트로 오인한 것. 이 영역을 지우면 음영 텍스처가 뭉개진다.
텍스트 확률 임계값을 올리면 스크린톤(약한 신호)은 빠르게 탈락하지만 효과음·크레딧(강한 신호)은 거의 유지된다.
| 케이스 | thr 0.3 | thr 0.5 | thr 0.7 |
|---|---|---|---|
| 스크린톤 ep024/cut_025 | 9.5% | 5.4% | 3.3% |
| 스크린톤 ep035/cut_047 | 2.8% | 1.1% | 0.4% |
| 효과음 ep026/cut_008 | 3.1% | 2.7% | 2.2% |
| 크레딧 ep030/cut_064 | 1.9% | 1.7% | 1.5% |
스크린톤은 thr 0.7에서 1/3로 줄지만 효과음·크레딧은 거의 그대로 — 임계값 0.5가 균형점(스크린톤 절반 감소, 텍스트 거의 보존).
텍스트 마스크에 패딩(팽창)을 주지 않으면 글자 외곽선 잔상이 남는다. 효과음·크레딧 컷에서 패딩 12/24/36px를 비교했다.
| 패딩 | 결과 |
|---|---|
| 12px | 효과음 외곽선 잔상 잔존 (예: "콰르르르" 파란 획) |
| 24px | 잔상 대부분 제거, 과잉 마스킹 없음 — 채택 |
| 36px | 잔상 거의 완전 제거. 인접 그림 침범 위험은 약간 증가 |