AI 방지 검증기 (Anti-AI Validator)

빠른 참조

목적

AI 방지 검증기는 자연스럽고 인간 수준 품질의 한국어 글쓰기를 보장하기 위해 AI 생성 텍스트 패턴을 체계적으로 감지하고 제거한다.

감지 카테고리

중요 패턴 감지:

"~를 넘어 ~하다" 구문 (최우선)
과용 용어 목록의 금지 어휘
추측 표현과 회피 언어
단락 내 반복적 단어 사용

구조적 감지:

예측 가능한 문장 패턴
균일한 문장 길이 분포
제한된 연결어 다양성
추상적 은유 구문

어휘 감지:

단락 내 단어 반복
공허한 강조어와 채움 단어
과용된 기술 유행어
일반적인 전환 구문

검증 프로세스

검증기는 4단계 스캔 프로세스를 실행한다:

1단계 - 중요 패턴 스캔:

모든 형태의 "~를 넘어" 패턴 검색
모든 인스턴스를 즉시 대체 플래그
예외 불허

2단계 - 어휘 스캔:

콘텐츠와 금지 단어 목록 대조
단락 경계 내 반복 식별
공허한 강조어와 채움어 플래그

3단계 - 구조 스캔:

문장 길이 분포 분석
연결어 다양성 확인
단락 변화 평가

4단계 - 수정 생성:

각 위반에 대한 구체적 대체 제공
대안 구문 제안
어휘 순환 권고

구현 가이드

중요 패턴: "~를 넘어" 감지

이 패턴은 한국어에서 가장 쉽게 감지되는 AI 글쓰기 표지이다. 검증기는 예외 없이 모든 인스턴스를 플래그한다.

감지 규칙:

동작 동사나 명사 앞에 오는 "넘어" 스캔
모든 변형 포함: "를 넘어", "을 넘어", "넘어서"
다른 단어로 분리되어 있어도 플래그

일반적인 위반:

"단순한 응답자를 넘어 능동적인 문제 해결자로서"
"코드 생성을 넘어 전체 프로젝트를 자동화한다"
"기본 기능을 넘어 고급 분석까지 제공한다"

승인된 대체:

"~에 그치지 않고 ~도 수행한다"
"~뿐만 아니라 ~도 담당한다"
"~뿐 아니라 ~까지 포함한다"
"~와 더불어 ~도 제공한다"
"~은 물론, ~에도 영향을 미친다"

금지 어휘 감지

검증기는 유형별로 분류된 금지 용어의 포괄적 목록을 유지한다.

과용 추상 용어:

"패러다임" → "접근 방식", "방법론", "체계"
"혁신" → "새로운 기능", "개선된 기능", "향상된 접근"
"게임체인저" → "중요한 도구", "효과적인 도구"
"획기적" → "주목할 만한", "상당한", "최신의"
"놀라운" → "인상적인", "효과적인", "실용적인"

공허한 강조어:

"매우" → 구체적 수량이나 측정값으로 대체
"아주" → 구체적 데이터나 벤치마크로 대체
"정말" → 사실적 증거로 대체
"물론", "당연히" → 완전히 제거

채움 표현:

"현저하게" → 구체적 백분율이나 메트릭으로 대체
"상당히" → 비교 데이터로 대체
"분명히" → "~로 확인되었다"로 대체
"확실히" → "~에 따르면"으로 대체
"명백히" → 증거 기반 진술로 대체

추측 표현 감지

추측적 언어는 신뢰성을 약화시키고 AI 생성을 신호한다. 검증기는 모든 추측 패턴을 제거한다.

금지 어미:

모든 맥락에서 "~일 것입니다"
"~로 예상됩니다"
"~로 보입니다"
"~할 수 있습니다" (정중한 추측)

금지 단어:

"아마도", "아마", "어쩌면"

필수 대체:

선언형 어미: "~한다", "~제공한다", "~지원한다"
확인된 사실: "~로 확인되었다", "~에 따르면"
데이터 기반 진술: "~에 기반하여", "~을 기준으로"

변환 예시:

나쁨: "Claude Code는 곧 새로운 프로그래밍 언어를 지원할 것으로 예상됩니다"
좋음: "Claude Code는 2025년 11월 현재 Python, JavaScript, TypeScript 등 20개 이상의 언어를 지원한다 (1)"
나쁨: "이 기능은 생산성을 향상시킬 수 있습니다"
좋음: "이 기능은 생산성을 평균 35% 향상시킨다 (2)"

어휘 반복 감지

세 번 사용 규칙은 어휘 다양성을 강화한다:

단락 내 규칙:

단일 단락 내에서 동일 단어가 두 번 이상 나타나지 않음
세 번째 사용은 동의어 대체 필요
단락 경계를 넘어 단어 사용 추적

섹션 내 규칙:

섹션 내에서 동일 구문이 두 번 이상 반복되지 않음
두 번째 사용을 위한 대안 구문 찾기

동의어 순환 시스템:

고빈도 동사:

"제공한다" 순환: "지원한다", "공급한다", "제시한다", "제안한다"
"처리한다" 순환: "다루다", "관리한다", "실행한다", "수행한다"
"사용한다" 순환: "활용한다", "적용한다", "채택한다"

고빈도 명사:

"기능" 순환: "역할", "책임", "임무", "능력"
"시스템" 순환: "체계", "구조", "플랫폼", "환경"
"방법" 순환: "방식", "기법", "절차", "전략"

문장 구조 분석

AI 생성 텍스트는 예측 가능한 구문 패턴을 보인다. 검증기는 구조적 다양성을 확인한다.

능동/수동 교체:

능동 예시: "시스템이 데이터를 처리한다"
수동 예시: "데이터가 시스템에 의해 처리된다"
혼합 예시: "데이터가 시스템에 의해 처리되며, 이를 통해 결과가 생성된다"

길이 분포:

짧은 문장 (15-20단어): 핵심 개념을 직접 전달
중간 문장 (25-35단어): 필요한 맥락과 설명 제공
긴 문장 (40-50단어): 개념 간 복잡한 관계 처리
동일 길이 카테고리의 연속 문장 플래그

연결어 분포:

순차적 연결어: "그리고", "또한", "그뿐만 아니라"
대조적 연결어: "그러나", "반면에", "그럼에도 불구하고"
인과적 연결어: "그래서", "따라서", "이에 따라", "결론적으로"
전환적 연결어: "한편", "다른 한편으로", "또한"
단일 연결어 유형 과용 플래그

추상적 은유 감지

모호한 은유적 패턴은 의미를 흐리고 AI 생성을 신호한다. 검증기는 직접적 설명으로 대체한다.

금지 은유 패턴:

추상적 A-B 패턴: "A의 기반 위에 B가 확장되는 패턴으로"
강제된 구조 설명: "~라는 원인-결과 구조로"
기술 개념에 대한 음악/예술 은유: "마치 교향곡처럼 여러 요소가 조화를 이룬다"

필수 직접 설명:

인과관계: "A가 발생함에 따라 B가 나타났다"
기능성: "A는 ~을 직접 수행하며, ~을 통해 구체적인 결과를 만든다"
비교: "A와 달리 B는 다음과 같은 차이를 보인다"

변환 예시:

나쁨: "기술 발전이 A의 기반 위에 B가 추가로 확장되는 패턴으로 진행된다"
좋음: "기술 발전이 기존 기술 A를 바탕으로 새로운 기능 B를 추가로 확장시켰다"
나쁨: "이는 시간의 흐름에 따른 변화 구조로 과거에는 A, 현재는 B가 된다"
좋음: "시간이 지남에 따라 기술이 A에서 B로 발전되었다"

고급 패턴

검증 보고서 생성

검증기는 콘텐츠 검토를 위한 상세 보고서를 생성한다:

위반 요약:

카테고리별 총 위반 수
중요 vs 비중요 분류
수정 우선순위 순위

위반 세부사항:

정확한 텍스트 위치 (단락 번호, 문장 위치)
구체적 위반 유형
권장 대체
변경 근거

수정 가이던스:

단계별 수정 지침
각 위반에 대한 대안 구문
적절한 사용 예시

자동 수정 제안

검증기는 맥락 인식 대체 제안을 제공한다:

중요 패턴:

승인된 대안 목록에서 즉시 대체
맥락에 대한 적절성으로 순위 매겨진 다중 옵션
올바른 적용을 보여주는 사용 예시

어휘 위반:

순환 시스템에서 동의어 제안
맥락 보존 가이드라인
자연스러운 흐름 검증

구조적 문제:

문장 재구성 권고
길이 조정 전략
연결어 대체 옵션

자가 수정 프로세스

위반이 감지되면 다음 수정 워크플로우를 따른다:

1단계 - 위반 유형 식별:

이 문서의 카테고리와 위반 매칭
심각도 결정 (중요, 높음, 중간, 낮음)

2단계 - 적절한 대체 선택:

승인된 대안에서 선택
맥락과 주변 문장 고려

3단계 - 문장 재작성:

자연스러운 흐름 유지하면서 대체 적용
새로운 위반이 도입되지 않았는지 확인

4단계 - 주변 맥락 확인:

새로운 반복 문제가 생성되지 않았는지 확인
연결어 사용이 여전히 적절한지 검증
단락 응집성이 유지되는지 확인

5단계 - 소리 내어 읽기 테스트:

자연스러운 한국어 리듬을 위해 단락을 소리 내어 읽기
어색한 표현이 도입되지 않았는지 확인
가독성이 향상되었는지 확인

함께 사용하면 좋은 것들

스킬:

writing-standards - 검증기가 강화하는 더 넓은 품질 프레임워크 제공
personas - 페르소나별 콘텐츠가 품질 표준을 충족하는지 검증
research - 인용과 인용 자료가 표준을 따르는지 확인

커맨드:

post - 발행 전 최종 콘텐츠 검증

검증 체크리스트

발행 전 검증

패턴 점검:

텍스트 어디에도 "~를 넘어" 패턴 없음
금지 어휘 인스턴스 제로
추측 어미나 회피 언어 없음
단일 단락 내에서 동일 단어 두 번 반복 없음

구조 점검:

문장 길이가 적절히 변화 (동일 카테고리 3개 이상 연속 없음)
연결어 유형이 적절히 분포
추상적 은유 구문 없음

수정 점검:

플래그된 모든 위반이 처리됨
대체 제안이 올바르게 구현됨
수정 후 자연스러운 흐름 유지
수정 중 새로운 위반 도입 없음

최종 품질 점검:

자연스러운 리듬을 위한 소리 내어 읽기 테스트 통과
기술적 정확성 보존됨
원본에서 가독성 향상됨
인간 수준 품질 글쓰기 달성

Version: 2.0.0 Last Updated: 2026-01-06 Category: Quality Assurance Type: Content Validation Status: Production Ready

anti-ai-validator