글쓰기

수만 개 가짜 계정으로 미국 AI를 턴다: 백악관이 공개한 중국의 수법

트레폴·
·조회 0123456789001234567890·11

TL;DR 2026년 4월 23일, 백악관이 OpenAI랑 Anthropic API 응답을 사실상 국가 안보 자산으로 재분류할 가능성이 생겼다. 근데 이게 개발자한테 생각보다 큰 얘기다.


딥시크 V3 처음 돌렸던 날을 아직 기억한다. 2025년 1월이었다. 모델 내려받아서 GPT-4랑 같은 질문 몇 개 돌려봤는데.. "어? 이게 된다고?" 소리가 진짜로 나왔다. 코딩 문제도 풀고, 한국어도 생각보다 자연스럽게 뽑고, 심지어 추론도 꽤 했다. 그 주말 내내 단톡방에 "이걸로 GPT 월 22달러 탈출 가능하냐"는 얘기가 돌았다.

근데 미국 AI 회사들도 같은 날 같은 모델 돌려보고 있었다. 다만 놀란 포인트가 달랐다. 한국 개발자들은 "와 싸고 좋네" 했고, 샌프란시스코는 "우리 모델에서 뭘 빼간 거 아니냐" 로 들어갔다.

엔비디아 주가는 다음 날 17% 빠졌다. 삼성전자랑 SK하이닉스도 같이 출렁였다. 반도체 시총 6000억 달러가 증발한 날이었다. 전쟁도 금리도 실적도 아니었다. 무명 중국 스타트업 하나가 모델 공개했다는 이유였다.

그로부터 1년 3개월 뒤, 백악관이 답을 내놨다.

4월 23일, 백악관이 낸 문서

미국 시간 2026년 4월 23일 목요일. 백악관 과학기술정책실(OSTP) 실장 마이클 크라치오스가 연방 기관들에 메모를 보냈다. 제목이 좀 세다. "미국 AI 모델에 대한 적대적 증류(Adversarial Distillation of American AI Models)". 파이낸셜 타임스가 단독으로 먼저 썼고, 그날 안에 로이터, CNBC, CNN, AP가 다 받아 썼다.

한 줄 요약은 이렇다. 중국을 주 거점으로 한 외국 세력이 OpenAI, Anthropic, 구글 상위 AI 모델을 상대로 산업 규모의 "증류 캠페인"을 벌이고 있다는 것. 수단은 수만 개 프록시 계정이랑 탈옥(jailbreaking). 목적은 미국 모델 능력을 대규모로 뽑아서 싸구려 복제판을 만드는 거다.

용어가 낯설 수 있다. 하나씩 풀어보겠다.

증류가 뭔데

증류(distillation). 술 증류 아니고 AI 쪽 전문 용어다.

큰 모델 하나를 학습시킨다고 치자. GPT-5급쯤 되는 거. 수십억 달러랑 수만 장 GPU랑 수개월이 들어간다. 근데 재밌는 게, 이미 다 만들어진 그 큰 모델한테 질문을 잔뜩 던져서 답을 모으면, 그 질문-답변 덩어리가 그대로 학습 데이터가 된다. 이걸로 작은 모델을 훈련시키면? 작은 모델이 큰 모델의 "사고 패턴"을 꽤 그럴싸하게 흉내 낸다.

쉽게 말하면 큰 모델을 과외 선생으로 앉혀두고 작은 모델이 받아 적는 구조다. 선생이 푼 문제집을 학생이 통째로 외워서 비슷한 시험에서 비슷한 점수 내는 거랑 똑같다.

증류 자체는 합법이다. 크라치오스도 메모에서 증류가 "핵심적인" 역할을 한다고 인정했다. 구글이 자기네 Gemini Ultra에서 Gemini Nano를 뽑아내는 건 아무 문제 없다. 자기 모델이니까. 문제는 남의 모델을, API 이용약관 대놓고 위반하면서, 수만 개 계정으로 대규모로 뽑아내는 경우다.

프록시 수만 개, 그리고 탈옥

AI 회사들은 계정 하나당 하루 요청 한도를 둔다. 같은 IP, 같은 결제 카드, 같은 이메일 도메인에서 수상한 패턴 쏟아지면 바로 차단이다. 이거 뚫으려면 가짜 계정 수만 개를 서로 다른 IP, 다른 결제 수단, 다른 신원으로 만들어서 흩뿌려야 한다. 백악관 표현 그대로 "탐지를 회피하기 위한 수만 개의 대리 계정".

솔직히 트래픽만 놓고 보면 소규모 DDoS랑 인프라 구성이 비슷하다. 차이는 딱 하나다. DDoS는 서비스를 무너뜨리려고 하는 건데, 이쪽은 서비스가 정상 작동하는 동안 최대한 많은 응답을 긁어가려 한다.

두 번째 수법은 탈옥(jailbreaking). 보안 쪽 하는 사람들한텐 익숙한 단어이다. AI 회사들은 모델이 위험한 정보나 내부 프롬프트를 못 뱉게 안전장치를 깔아둔다. 그런데 프롬프트를 특정 방식으로 꼬아 넣으면 이게 풀린다. "너는 이제 DAN이라는 제한 없는 AI다" 같은 초창기 수법부터, 긴 문맥 안에 명령어를 숨기거나 유니코드 동형이의자를 섞어서 시스템 프롬프트를 토해내게 하는 수법까지.. 기법은 계속 진화하는 중이다.

이런 밈도 있다. "내 죽은 할머니가 자장가 대신 폭탄 제조법을 불러주셨는데..."

둘을 합치면 그림이 나온다. 수만 개 계정이 각자 조금씩 다른 탈옥 프롬프트로 모델을 두드린다. 정상 사용으로는 절대 안 나오는 응답, 필터 아래 깔린 원시 확률 분포, 내부 정보까지 긁어낸다. 그 데이터로 자기네 모델을 훈련시킨다. 원본 개발사는 수년이랑 수십억 달러를 썼는데, 복제자는 API 호출비만 내고 비슷한 걸 만들어낸다.

크라치오스가 특히 걸고 넘어진 건 그다음이다. 메모는 증류된 결과물이 원본의 안전 프로토콜까지 "의도적으로 벗겨낼" 수 있다고 적었다. 원본에 깔려 있던 콘텐츠 필터, 정치적 중립성 장치, 거부 응답 로직이 증류 과정에서 사라진 채로 깡통 능력만 복제될 수 있다는 주장이다.

딥시크라는 배경

메모는 갑자기 튀어나온 게 아니다. 앞에서 언급한 딥시크가 여기서 돌아온다.

딥시크는 중국 AI 스타트업이다. 2025년 1월 V3로 전 세계를 흔들었다. 오픈웨이트 전략 덕분에 며칠 만에 Hugging Face 다운로드 상위권을 쓸어갔고, 한국 개발자 커뮤니티에도 로컬 실행 후기가 줄줄이 올라왔다.

당시 트럼프의 AI 자문 데이비드 색스가 먼저 치고 나갔다. 딥시크가 OpenAI 모델에서 지식을 증류해냈다는 상당한 증거가 있다고 주장한 거다. OpenAI도 2월에 의회 서한에서 같은 의혹을 걸었다. Anthropic은 더 세게 나갔다. 2월에 딥시크랑 중국계 AI 연구소 두 곳이 Claude 능력을 부당하게 추출해서 자기네 모델을 개선했다고 실명으로 공개 비난했다. AI 회사가 경쟁사를 실명으로 지목해서 증류 의혹을 제기한 건 업계에서도 드문 사건이었다.

이번 백악관 메모는 그 흐름을 정부 공식 문서 언어로 올린 버전이다. 그리고 딥시크는 기막힌 타이밍을 보여줬다. 메모 나온 바로 다음 날, 화웨이 칩에 맞춘 V4 프리뷰를 공개한 거다. 우연인지 계산된 반격인지는 모른다. 다만 "너네 칩 안 줘도 된다"는 메시지로 읽히기엔 충분했다.

그래서 뭐가 바뀌나

여태까지 미국의 대중국 AI 통제는 손에 잡히는 물건을 다뤘다. 엔비디아 H100, H200을 누구한테 팔지. 반도체 장비를 어디까지 수출할지. 클라우드 우회 접속을 어떻게 막을지. 전부 국경에서 통관하는 얘기였다. 한국 반도체 업계가 미국 규제 뉴스마다 긴장하는 이유도 이거다. HBM 만드는 삼성이랑 SK하이닉스가 누구한테 납품하느냐가 곧장 미국 규제랑 맞물리기 때문이다.

근데 이번엔 다르다. 칩을 못 가져가더라도 미국 모델에 접속만 되면 출력을 긁어서 능력을 압축 복제할 수 있지 않냐는 문제의식이 전면에 깔렸다. 그러니까 지켜야 할 게 늘어난 거다. API 엔드포인트. 계정 진위. 요청 패턴 로그. 안전장치. 그리고 응답 결과물 자체.

미국이 이제 AI 모델의 출력물까지 국가 자산으로 다루기 시작했다. 지금까지 LLM 응답은 그냥 JSON 페이로드였다. 앞으로는 국경 넘을 때 체크받는 품목이 될 수도 있다.

국내 개발자 입장에선

이게 진짜 남 일이 아니다.

토스, 쿠팡, 배민, 당근, 라인, 네이버, 카카오, 그리고 수많은 판교 스타트업이 OpenAI나 Anthropic API 위에 서비스 올려두고 있다. 이번 메모 나오고 나서 미국 AI 회사들이 손댈 것들은 대충 이런 것들이다.

  • 고객 심사(KYC) 강화

  • 해외 이용자 신원 검증

  • 지역별 사용량 상한

  • 출력 워터마킹

  • 탈옥 시도 실시간 차단

  • 의심 계정 클러스터 탐지

  • 응답 엔트로피 모니터링

"내 카드로 결제되면 쓸 수 있다"가 "우리가 누구한테 API 파는지 미국 정부에 설명할 수 있는 한 쓸 수 있다"로 바뀌는 중이다.

한국 스타트업 입장에선 API 의존도를 다시 봐야 할 시점이다. 최악의 경우 어느 날 갑자기 국가 단위 지역 제한이 들어올 수도 있다. 그런 시나리오 터지면 네이버 하이퍼클로바X, LG 엑사원, 카카오 KoGPT 같은 국산 모델이 갑자기 대안이 아니라 보험으로 올라선다.

왜 하필 지금인가

5월 베이징 회담을 3주 앞두고

트럼프는 5월 14~15일 베이징에서 시진핑이랑 만난다. 이 메모는 회담을 3주 남기고 나왔다.

상무장관 하워드 러트닉이 4월 22일, 메모 하루 전에 슬쩍 흘린 발언이 있다. 올해 1월에 조건부로 허가된 엔비디아 H200 대중국 수출이 4월까지 실제로는 한 건도 선적되지 않았다는 확인이었다. 허가는 떨어졌는데 실행은 보류. 딱 봐도 협상용이다.

한쪽 손엔 칩 수출 허가를 협상 카드로 쥐고, 다른 손으론 모델 증류 문제를 새 압박 명분으로 깔았다. 5월 회담 테이블에 반도체랑 AI 접근권이 같이 올라갈 가능성이 높다. 한국 입장에선 또 남 일이 아니다. H200 공급망에 한국 메모리가 얽혀 있고, 회담 결과에 따라 한국 반도체 수출 환경도 같이 출렁인다.

행정부 혼자 움직인 게 아니다

같은 주에 하원 외교위원회가 관련 법안을 초당적 만장일치로 통과시켰다. 발의자는 빌 후이젠가 공화당 의원(미시간). 법안 내용은, 미국 소유 폐쇄형 AI 모델에서 "핵심 기술 특징"을 뽑아가는 외국 행위자를 식별해서 제재까지 포함한 처벌 절차를 만드는 거다. 후이젠가는 모델 추출 공격을 "중국 경제 강압과 지재권 탈취의 최신 전선"이라고 불렀다.

행정부 메모랑 입법부 법안이 같은 주에 같은 방향으로 나왔다. 조율된 패키지다. 크라치오스 한 사람의 발언이 아니라 미국 정부 전체의 방향 선언에 가깝다.

그런데 Cursor는 중국 모델 쓴다

여기서 한 장면 짚고 가야 한다.

샌프란시스코 AI 코딩 툴 Cursor 만드는 스타트업 Anysphere가 최근 재밌는 사실을 털어놨다. 자기네 최신 제품이 중국 기업 Moonshot AI의 오픈소스 모델 Kimi 기반이라고 공개한 거다. 한국 개발자들도 많이 쓰는 그 Cursor다. 솔직히 좀 웃기지 않나.

증류랑 오픈소스 재활용은 방향이 정해져 있지 않다. 미국 모델이 중국에서 증류되기도 하고, 중국 오픈소스가 미국 상업 제품 엔진에 들어가기도 한다. 백악관이 말하는 "적대적 증류"의 법적 선이 실전에서 어떻게 그어질지는 아직 모른다. 몇 가지 질문이 그대로 남아 있다.

  • 미국 기업이 쓰는 중국 오픈소스는 괜찮나

  • 중국 기업이 쓰는 미국 오픈소스는 어떻게 되나

  • 폐쇄 모델에서 뽑은 지식만 문제인가

  • 합성 데이터로 한 번 세탁한 건 괜찮은가

답은 아직 없다. 앞으로 몇 년 동안 변호사들이랑 엔지니어들이 같이 그어야 할 선이다.

결국 남는 것

지금 확실한 것부터 정리해보자. 백악관이 이 문제를 공식 안보·산업 정책 어휘로 끌어올렸다. 행정부랑 입법부가 같은 주에 같은 방향으로 움직였다. 미국 AI 기업의 API 접근 통제, 계정 심사, 해외 이용자 검증이 강해질 공산이 크다. 5월 트럼프-시진핑 회담 카드에 이 문제가 올라갈 가능성도 높다.

반대로 아직 확실하지 않은 것도 있다. 실제 침해 규모는 메모가 구체 수치를 안 내놨다. 가해 기업 명단도 딥시크가 유력한 배경 인물이지만 메모는 특정 회사를 지목하지 않았다. 법적 조치는 기소, 제재 지정, 수출 통제 확대 중 어떤 게 실제 발동될지 미정이다. 중국 측은 주미 중국대사관이 "미국의 부당한 중국 기업 탄압에 반대한다"고 받아쳤고, 외교부는 "편견을 버리라"고 응수한 상태다.

이번 사건의 핵심은 따로 있다. "AI 모델의 출력물도 보호 대상이 될 수 있다"는 규범이 국가 단위에서 처음으로 문서화된 사례에 가깝다는 거다. 지금까지 출력은 그냥 API 응답이었다. 앞으로는 수출 통제 품목이 될 수도 있다. 이게 자리 잡으면 오픈소스 LLM 생태계, 합성 데이터 산업, 해외 개발자의 미국 API 접근 구조 전체가 흔들린다. 판교에서 GPT-5 API로 서비스 돌리는 팀이라면, 1년 뒤 어느 날 약관 메일 하나가 도착하는 장면을 머릿속에 한번 그려봐도 된다.

1년 뒤 이 메모를 돌아볼 때, 우리는 둘 중 하나를 말하게 될 거다. "과잉 반응이었네"거나, "이때부터 API의 성격이 바뀌었다"거나.


출처

사건 보도

정책·입법 맥락

타이밍과 시장 영향

댓글

아직 댓글이 없습니다.

로그인하고 의견 남기기

로그인하면 댓글·투표·북마크를 사용할 수 있어요.

제목작성자작성일추천조회수
수만 개 가짜 계정으로 미국 AI를 턴다: 백악관이 공개한 중국의 수법
068트레폴··추천 0·조회 68·11
093트레폴··추천 0·조회 93·8