Rinda · /replied-emails · 검증 완료

받은 답장함 자동응답 분류 — 개선 완료 & 검증 리포트

"자동응답이 중립으로 분류되거나 미분류되는" 문제를 발송·분류·조회·UI 전 층위에서 해결하고, beta 실데이터로 검증한 결과. alpha·beta 양쪽 반영 완료.

검증일 2026-06-10 환경 beta 프로덕션 (배포됨) PR 10건 머지 (양쪽) 테스트 34 pass

핵심 지표

0
탐지가능 자동응답→중립 잔존 (제목·헤더·본문)
0%
최근 24h 미분류율 (과거 48%→0%)
0
ai_summary 내부 마커 누출
408
기존 데이터 결정적 백필 (353+55)
한 줄 결론
측정 가능한 모든 축에서 문제 없음. 제목·헤더·본문 결정적 신호의 자동응답→중립 잔존 0, 최근 답장 미분류 0%, 사용자 노출 누출 0.

최적 파이프라인 (5단계 캐스케이드)

싼 결정적 신호 먼저, LLM은 최후 catch-all. 각 레이어는 다른 종류의 자동응답을 잡는다.

인입 답장 → [멱등 큐 보장호출] │ [L0] 바운스/DSN mailer-daemon·DSN → 서버 clean 타임스탬프로 inbox 기본 숨김 [L1] 헤더(RFC3834) Auto-Submitted / X-Auto-Response-Suppress / Precedence (raw_email 파싱) [L2] 제목 마커 15+언어 (automatic reply / 自動応答 / 부재중 …) → 단락 [L2b] 본문 auto-ack 머신전용(automated response / do-not-reply / 티켓ID) → fusion(neutral→ooo) [L3] LLM catch-all 다국어 프롬프트(KO/JA) + 헤더/본문 신호 융합, wrong_contact 보존 │ [L4] SSOT + 필터(③) autoReply 보이기/숨기기 (아이콘→체크박스 카드, 반송은 서버 기본숨김)
오탐 0 설계
본문 스캔은 "thank you for contacting" 같은 사람도 쓰는 정중 도입부를 의도적으로 제외하고 머신 전용 신호만 사용. 게다가 fusion 방식(LLM이 neutral일 때만 보정)이라 wrong_contact·positive_interest 등 사람답장은 미접촉 → 진짜 답장 손실 0.

전수 검증 결과 (beta 실데이터)

검증 항목결과판정
L2 제목마커 자동응답이 중립/미분류0통과
L1 헤더(is_auto_reply) 자동응답이 중립/미분류0통과
L2b 본문 auto-ack 자동응답이 중립/미분류0통과
사람답장 오탐 (본문스캔 FP)0 (fusion)통과
ai_summary 내부 마커 누출0통과
최근 24h 신규 답장 미분류0 / 37통과
필터 신호 (자동응답 1,492 · 반송 1,758)정상통과
배포 (elysia-server 컨테이너)재배포됨통과

반영된 개선 (PR 10건 · alpha+beta)

개선PR (alpha/beta)핵심
결정적 제목마커 + silent-neutral 제거8358 / 836015+언어 마커, retry 복구, RFC3834 헤더파싱
③ 옵션 필터 (조회)8370 / 8371autoReply·bounce 보이기/숨기기 (NULL-safe)
다국어 프롬프트 + 헤더 융합8376 / 8378KO/JA 예시, is_auto_reply→ooo (wrong_contact 보존)
필터 칩 UI8381 / 8383아이콘+활성체크
ai_summary 누출 차단8389 / 8390내부 마커 → logger 이동
필터 아이콘+체크박스 카드8396 / 8397Gmail식, 반송 토글 제거(서버 기본숨김)
본문 auto-ack 머신신호 융합8407 / 8408티켓ID/automated, fusion(오탐 0)

운영(beta DB): 결정적 백필 408건 교정 (제목/헤더 353 + 본문 auto-ack 55) · ai_summary 마커 353건 정리.

이슈 커버리지 체크리스트

  • 자동응답→중립 오분류 — 제목·헤더·본문 잔존 0
  • 분류기 미실행(48% null) — 최근 24h 0%
  • 헤더↔AI 신호 분리(교집합0) — 융합 적용
  • 한국어 34.6% 영어프롬프트 — 다국어화
  • 제목 "Automatic reply" 놓침 — 15+언어 마커
  • 본문만 있는 자동회신(티켓팅) — L2b 본문 융합
  • silent-neutral 오염 — throw+retry 복구
  • ai_summary 마커 누출 — logger 이동 + DB 정리
  • 옵션 필터 부재 — 아이콘+카드 필터
  • wrong_contact 추출 취약 — noreply 제외
  • 잔여 "조용한" 자동응답 — LLM 담당(다국어)
  • unipile 단일경로 회귀 — 최근 null=0, 미발현
남은 이론적 사항 (현재 비활성)
패턴이 전혀 없는 "조용한" 자동응답은 LLM(다국어 프롬프트)이 담당 — 실검출 0. unipile 등 단일경로 회귀는 최근 24h 미분류 0이라 현재 발현 안 됨. alpha DB는 백필 미적용이나 마커도 없어 ai_summary 깨끗.