본문 바로가기
IT 트렌드

🤖 ChatGPT가 몰래 남기는 흔적? '보이지 않는 워터마크'의 정체

by sosoham-today 2025. 4. 22.
반응형

“내가 쓴 글, 진짜 내가 쓴 게 맞을까?”

 

요즘 AI 글쓰기 도구들이 점점 자연스러워지면서, ‘진짜 사람 손글’과 ‘AI 생성 텍스트’를 구분하는 건 갈수록 어려워지고 있어요. 그런데 최근, GPT 기반 텍스트에 ‘보이지 않는 워터마크’가 숨어 있다는 사실이 알려지며 온라인에서 큰 논란이 되고 있습니다.

 


 

특수 유니코드 문자가 일정한 패턴으로 삽입되는 걸 발견

 

👁️ 문제의 시작: 보이진 않지만, 사라지지 않는 유령 문자

 

AI 연구 그룹 Rumi가 처음 이 현상을 발견했어요.
그들이 조사한 결과, GPT-o3와 o4-mini 모델이 생성한 긴 텍스트에는 U+202F(Narrow No-Break Space) 같은 특수 유니코드 문자가 일정한 패턴으로 삽입된다는 사실을 포착했죠.

  • 이 문자는 일반 문서에서는 눈에 띄지 않아요.
  • 하지만 Sublime Text, VS Code, Google Docs 같은 도구로 열어보면 “숨어있던 공백”들이 드러납니다.
  • 때때로 xee999 같은 16진수 코드나 r처럼 전혀 이상하지 않은 단어도 규칙적으로 포함되는데,
    이게 반복되면서 “AI 워터마크”의 흔적이 되는 거예요.

이걸 사람들이 "디지털 워터마크"라고 부르기 시작했죠.

 


 

🧠 이게 왜 중요하냐고요?

 

그냥 공백 문자 하나 들어간 거면, 별일 아닐 수도 있어요.
하지만 이게 ‘의도적으로 삽입된 흔적’이라면 이야기가 달라지죠.

  • AI 탐지 도구로도 잘 안 걸리는 텍스트를 구분하기 위한 ‘백도어’ 일 수도 있고,
  • 사용자나 기업 입장에서 보면 ‘내가 생성한 텍스트가 AI였다는 걸 누군가 알아낼 수 있다’는 얘기이기도 하니까요.

실제로, 많은 학생들이 "이 워터마크 때문에 교수님에게 걸릴까 봐 걱정"이라는 반응을 보이기도 했습니다.

 

처음엔 그냥 이상한 공백 문자 하나 들어간 걸로 보일 수도 있어요.
근데 이게 단순한 인코딩 오류나 오타처럼 보기엔 좀 이상하죠.

 

‘의도적인 삽입’이 아닐까?


슬쩍, 누군가 일부러 넣은 거 아닐까? 하는 의심이 드는 지점이에요.

 

실제로 Rumi의 분석에 따르면
이 문자는 GPT-o3, o4-mini 모델에서만 주로 발견되고,
최신 GPT-4o에서는 거의 사라졌어요.

 

우연이라고 하기엔, 너무 ‘시기’가 정확합니다.

그리고 이 특수 문자는 AI 탐지기로도 잘 안 걸려요.
하지만 텍스트 안에 조용히 남아 있죠.
마치 ‘백도어’나 ‘추적 장치’처럼 작동할 수도 있는 구조입니다.

 

AI가 쓴 글이라는 걸 누가 몰래 알아볼 수 있는, 그런 방식이죠.

왜 이런 걸 넣은 걸까요?

공식 설명은 없지만, 커뮤니티에선 이렇게 말해요.


“AI가 썼다는 흔적을 남기려고”
“표절 방지를 위한 무단 추적용일지도”
“OpenAI 내부에서도 만든 걸 구분할 용도일 수 있지”
“슬쩍 넣어두고, 말은 안 하는 게 제일 무섭지 않냐”

 

 

 


 

🧹 그럼 지울 수는 있어?

 

네, 생각보다 간단합니다.

  • 워드 프로세서에선 자동으로 남아있고,
  • Sublime Text 같은 에디터에선 특수문자 검색만 하면 바로 제거 가능해요.
  • 예: U+202F 문자 검색 → 전체 제거
  • 혹은 Python에서 .replace("\u202F", "") 한 줄이면 정리 끝.

즉, 감지하기도 쉽고, 우회도 너무 쉬운 워터마크라는 게 함정이에요.

 


 

🧩 근데 왜 굳이 이런 걸 넣은 걸까?

 

OpenAI는 이 기능에 대해 아무 공식 발표도 하지 않았어요.
하지만 여러 기술 커뮤니티에서는 이런 추측이 돌고 있어요.

  • 표절 방지: AI가 쓴 글을 사람 글처럼 제출하는 걸 막기 위한 조치일 수 있다.
  • AI 탐지 향상: 기존 감지기가 너무 부정확해서, 내부적으로 구분 가능한 표식을 넣은 것.
  • 내부 추적용: AI가 생성한 콘텐츠를 뒤늦게라도 추적할 수 있도록 ‘디지털 사인’을 넣은 것일 수도 있다.

하지만 이런 방식은 아직 법적으로나 윤리적으로 회색지대예요.
콘텐츠 생성자가 모르는 사이에 '출처 마크'를 넣는 건, 프라이버시나 저작권 문제로 번질 수도 있죠.

 


 

 

 

📌  ‘AI 글쓰기’의 두 얼굴

 

AI로 블로그 쓰고, 리포트 쓰고, 이메일도 보내는 시대입니다.
그만큼 “AI가 썼는지 아닌지”에 민감한 분야도 늘어나고 있어요—특히 교육, 출판, 언론 같은 곳에서요.

이번 워터마크 논란은 단순한 기술적 이슈가 아니라,

“AI와 인간 창작물의 경계가 어디까지 허용될 수 있는가”라는 근본적인 질문을 던집니다.

당분간은 계속 이런 논쟁이 이어질 것 같아요.
그리고 그 사이에, 우리는 더 똑똑한 방법으로 글을 쓰고,
더 날카로운 눈으로 콘텐츠를 읽게 되겠죠.

 


 
반응형