AI 방지 검증기 (Anti-AI Validator)
빠른 참조
목적
AI 방지 검증기는 자연스럽고 인간 수준 품질의 한국어 글쓰기를 보장하기 위해 AI 생성 텍스트 패턴을 체계적으로 감지하고 제거한다.
감지 카테고리
중요 패턴 감지:
- "~를 넘어 ~하다" 구문 (최우선)
- 과용 용어 목록의 금지 어휘
- 추측 표현과 회피 언어
- 단락 내 반복적 단어 사용
구조적 감지:
- 예측 가능한 문장 패턴
- 균일한 문장 길이 분포
- 제한된 연결어 다양성
- 추상적 은유 구문
어휘 감지:
- 단락 내 단어 반복
- 공허한 강조어와 채움 단어
- 과용된 기술 유행어
- 일반적인 전환 구문
검증 프로세스
검증기는 4단계 스캔 프로세스를 실행한다:
1단계 - 중요 패턴 스캔:
- 모든 형태의 "~를 넘어" 패턴 검색
- 모든 인스턴스를 즉시 대체 플래그
- 예외 불허
2단계 - 어휘 스캔:
- 콘텐츠와 금지 단어 목록 대조
- 단락 경계 내 반복 식별
- 공허한 강조어와 채움어 플래그
3단계 - 구조 스캔:
- 문장 길이 분포 분석
- 연결어 다양성 확인
- 단락 변화 평가
4단계 - 수정 생성:
- 각 위반에 대한 구체적 대체 제공
- 대안 구문 제안
- 어휘 순환 권고
구현 가이드
중요 패턴: "~를 넘어" 감지
이 패턴은 한국어에서 가장 쉽게 감지되는 AI 글쓰기 표지이다. 검증기는 예외 없이 모든 인스턴스를 플래그한다.
감지 규칙:
- 동작 동사나 명사 앞에 오는 "넘어" 스캔
- 모든 변형 포함: "를 넘어", "을 넘어", "넘어서"
- 다른 단어로 분리되어 있어도 플래그
일반적인 위반:
- "단순한 응답자를 넘어 능동적인 문제 해결자로서"
- "코드 생성을 넘어 전체 프로젝트를 자동화한다"
- "기본 기능을 넘어 고급 분석까지 제공한다"
승인된 대체:
- "~에 그치지 않고 ~도 수행한다"
- "~뿐만 아니라 ~도 담당한다"
- "~뿐 아니라 ~까지 포함한다"
- "~와 더불어 ~도 제공한다"
- "~은 물론, ~에도 영향을 미친다"
금지 어휘 감지
검증기는 유형별로 분류된 금지 용어의 포괄적 목록을 유지한다.
과용 추상 용어:
- "패러다임" → "접근 방식", "방법론", "체계"
- "혁신" → "새로운 기능", "개선된 기능", "향상된 접근"
- "게임체인저" → "중요한 도구", "효과적인 도구"
- "획기적" → "주목할 만한", "상당한", "최신의"
- "놀라운" → "인상적인", "효과적인", "실용적인"
공허한 강조어:
- "매우" → 구체적 수량이나 측정값으로 대체
- "아주" → 구체적 데이터나 벤치마크로 대체
- "정말" → 사실적 증거로 대체
- "물론", "당연히" → 완전히 제거
채움 표현:
- "현저하게" → 구체적 백분율이나 메트릭으로 대체
- "상당히" → 비교 데이터로 대체
- "분명히" → "~로 확인되었다"로 대체
- "확실히" → "~에 따르면"으로 대체
- "명백히" → 증거 기반 진술로 대체
추측 표현 감지
추측적 언어는 신뢰성을 약화시키고 AI 생성을 신호한다. 검증기는 모든 추측 패턴을 제거한다.
금지 어미:
- 모든 맥락에서 "~일 것입니다"
- "~로 예상됩니다"
- "~로 보입니다"
- "~할 수 있습니다" (정중한 추측)
금지 단어:
필수 대체:
- 선언형 어미: "~한다", "~제공한다", "~지원한다"
- 확인된 사실: "~로 확인되었다", "~에 따르면"
- 데이터 기반 진술: "~에 기반하여", "~을 기준으로"
변환 예시:
- 나쁨: "Claude Code는 곧 새로운 프로그래밍 언어를 지원할 것으로 예상됩니다"
- 좋음: "Claude Code는 2025년 11월 현재 Python, JavaScript, TypeScript 등 20개 이상의 언어를 지원한다 (1)"
- 나쁨: "이 기능은 생산성을 향상시킬 수 있습니다"
- 좋음: "이 기능은 생산성을 평균 35% 향상시킨다 (2)"
어휘 반복 감지
세 번 사용 규칙은 어휘 다양성을 강화한다:
단락 내 규칙:
- 단일 단락 내에서 동일 단어가 두 번 이상 나타나지 않음
- 세 번째 사용은 동의어 대체 필요
- 단락 경계를 넘어 단어 사용 추적
섹션 내 규칙:
- 섹션 내에서 동일 구문이 두 번 이상 반복되지 않음
- 두 번째 사용을 위한 대안 구문 찾기
동의어 순환 시스템:
고빈도 동사:
- "제공한다" 순환: "지원한다", "공급한다", "제시한다", "제안한다"
- "처리한다" 순환: "다루다", "관리한다", "실행한다", "수행한다"
- "사용한다" 순환: "활용한다", "적용한다", "채택한다"
고빈도 명사:
- "기능" 순환: "역할", "책임", "임무", "능력"
- "시스템" 순환: "체계", "구조", "플랫폼", "환경"
- "방법" 순환: "방식", "기법", "절차", "전략"
문장 구조 분석
AI 생성 텍스트는 예측 가능한 구문 패턴을 보인다. 검증기는 구조적 다양성을 확인한다.
능동/수동 교체:
- 능동 예시: "시스템이 데이터를 처리한다"
- 수동 예시: "데이터가 시스템에 의해 처리된다"
- 혼합 예시: "데이터가 시스템에 의해 처리되며, 이를 통해 결과가 생성된다"
길이 분포:
- 짧은 문장 (15-20단어): 핵심 개념을 직접 전달
- 중간 문장 (25-35단어): 필요한 맥락과 설명 제공
- 긴 문장 (40-50단어): 개념 간 복잡한 관계 처리
- 동일 길이 카테고리의 연속 문장 플래그
연결어 분포:
- 순차적 연결어: "그리고", "또한", "그뿐만 아니라"
- 대조적 연결어: "그러나", "반면에", "그럼에도 불구하고"
- 인과적 연결어: "그래서", "따라서", "이에 따라", "결론적으로"
- 전환적 연결어: "한편", "다른 한편으로", "또한"
- 단일 연결어 유형 과용 플래그
추상적 은유 감지
모호한 은유적 패턴은 의미를 흐리고 AI 생성을 신호한다. 검증기는 직접적 설명으로 대체한다.
금지 은유 패턴:
- 추상적 A-B 패턴: "A의 기반 위에 B가 확장되는 패턴으로"
- 강제된 구조 설명: "~라는 원인-결과 구조로"
- 기술 개념에 대한 음악/예술 은유: "마치 교향곡처럼 여러 요소가 조화를 이룬다"
필수 직접 설명:
- 인과관계: "A가 발생함에 따라 B가 나타났다"
- 기능성: "A는 ~을 직접 수행하며, ~을 통해 구체적인 결과를 만든다"
- 비교: "A와 달리 B는 다음과 같은 차이를 보인다"
변환 예시:
- 나쁨: "기술 발전이 A의 기반 위에 B가 추가로 확장되는 패턴으로 진행된다"
- 좋음: "기술 발전이 기존 기술 A를 바탕으로 새로운 기능 B를 추가로 확장시켰다"
- 나쁨: "이는 시간의 흐름에 따른 변화 구조로 과거에는 A, 현재는 B가 된다"
- 좋음: "시간이 지남에 따라 기술이 A에서 B로 발전되었다"
고급 패턴
검증 보고서 생성
검증기는 콘텐츠 검토를 위한 상세 보고서를 생성한다:
위반 요약:
- 카테고리별 총 위반 수
- 중요 vs 비중요 분류
- 수정 우선순위 순위
위반 세부사항:
- 정확한 텍스트 위치 (단락 번호, 문장 위치)
- 구체적 위반 유형
- 권장 대체
- 변경 근거
수정 가이던스:
- 단계별 수정 지침
- 각 위반에 대한 대안 구문
- 적절한 사용 예시
자동 수정 제안
검증기는 맥락 인식 대체 제안을 제공한다:
중요 패턴:
- 승인된 대안 목록에서 즉시 대체
- 맥락에 대한 적절성으로 순위 매겨진 다중 옵션
- 올바른 적용을 보여주는 사용 예시
어휘 위반:
- 순환 시스템에서 동의어 제안
- 맥락 보존 가이드라인
- 자연스러운 흐름 검증
구조적 문제:
- 문장 재구성 권고
- 길이 조정 전략
- 연결어 대체 옵션
자가 수정 프로세스
위반이 감지되면 다음 수정 워크플로우를 따른다:
1단계 - 위반 유형 식별:
- 이 문서의 카테고리와 위반 매칭
- 심각도 결정 (중요, 높음, 중간, 낮음)
2단계 - 적절한 대체 선택:
3단계 - 문장 재작성:
- 자연스러운 흐름 유지하면서 대체 적용
- 새로운 위반이 도입되지 않았는지 확인
4단계 - 주변 맥락 확인:
- 새로운 반복 문제가 생성되지 않았는지 확인
- 연결어 사용이 여전히 적절한지 검증
- 단락 응집성이 유지되는지 확인
5단계 - 소리 내어 읽기 테스트:
- 자연스러운 한국어 리듬을 위해 단락을 소리 내어 읽기
- 어색한 표현이 도입되지 않았는지 확인
- 가독성이 향상되었는지 확인
함께 사용하면 좋은 것들
스킬:
- writing-standards - 검증기가 강화하는 더 넓은 품질 프레임워크 제공
- personas - 페르소나별 콘텐츠가 품질 표준을 충족하는지 검증
- research - 인용과 인용 자료가 표준을 따르는지 확인
커맨드:
검증 체크리스트
발행 전 검증
패턴 점검:
- 텍스트 어디에도 "~를 넘어" 패턴 없음
- 금지 어휘 인스턴스 제로
- 추측 어미나 회피 언어 없음
- 단일 단락 내에서 동일 단어 두 번 반복 없음
구조 점검:
- 문장 길이가 적절히 변화 (동일 카테고리 3개 이상 연속 없음)
- 연결어 유형이 적절히 분포
- 추상적 은유 구문 없음
수정 점검:
- 플래그된 모든 위반이 처리됨
- 대체 제안이 올바르게 구현됨
- 수정 후 자연스러운 흐름 유지
- 수정 중 새로운 위반 도입 없음
최종 품질 점검:
- 자연스러운 리듬을 위한 소리 내어 읽기 테스트 통과
- 기술적 정확성 보존됨
- 원본에서 가독성 향상됨
- 인간 수준 품질 글쓰기 달성
Version: 2.0.0
Last Updated: 2026-01-06
Category: Quality Assurance
Type: Content Validation
Status: Production Ready