본문 바로가기
카테고리 없음

딥시크(DeepSeek)쇼크란? (feat. 딥시크와 엔비디아의 연관성 알아보기)

by 삶의재발견 2025. 1. 29.
반응형

최근 중국의 AI 스타트업 딥시크(DeepSeek)의 챗봇 서비스 출시에 '딥시크 쇼크'라는 용어가 나오며 동시에 엔비디아의 주가가 폭락하는 일이 일어나며 이슈가 되고 있습니다.
딥시크가 뭐지? 엔비디아와 무슨 연관성이 있지? 란 질문을 하며 제가 궁금해서 정리한 내용들 공유드립니다.

딥시크와 V3와 GPT

목차
1. AI 시장의 지각을 흔드는 딥시크 등장
2. AI 구동 원리 (딥시크쇼크를 이해하기 위해 알아야 하는 내용)

3. 딥시크의 모델 V3
4. 딥시크의 등장으로 인한 엔비디아와 AI 시장의 변화

1. AI 시장의 지각을 흔드는 딥시크 등장

그동안 미국이 주도해 온  AI 시장에 지각을 흔들만한 뉴스가 발표되었습니다.
우리의 일상속으로 들어와 있는 챗GPT 성능을 능가한다는 AI 딥시크를 중국에서 이슈화시켰습니다.
여기서 핵심은 미국이 중국으로 엔비디아 반도체 칩 수출을 규제하고 있는 상황에서 엔비디아 칩 없이 저가형 반도체를 이용해 챗GPT와 유사이상의 성능을 내는 AI를 출시했다는 점입니다.
미국은 엔비디아 칩 없이는 이 시장이 발전할 수 없고 이것을 미국이 주가 되어 키우겠다는 입장이었습니다.
그러나 중국의 딥시크가 미국이 1억 달러 들여 만든 챗GPT를 550만 달러로 두 달 만에 만들어 내어 기술을 따라잡았습니다. 더구나 이걸 오픈소스로 공개해서 누구든 이 코드를 쓸 수 있도록 한 것입니다.

 

2. AI 구동 원리 

먼저 딥시크와 엔비디아의 연관성에 대해 이해하려면 용어정리가 필요합니다.
 
AI의 구동원리에 대해 알아보면 AI의 뇌, 엔진이 되는 대규모 언어모델(LLM)을 알아야 합니다.
LLM은 엄청나게 많은 글과 정보를 읽고 배운 AI모델입니다. 사람이 언어를 배우는 것처럼 LLM은 많은 양의 데이터를 학습합니다. 이러한 LLM 모델이 AI의 핵심이 되는 뇌, 엔진이 되는 것입니다.
 
엔진을 이용하여 다양한 차종이 개발이 되듯이
하나의 AI모델을 활용하여 다양한 생성형 서비스가 만들어 질 수 있습니다.
 
대표적인 LLM 모델이 OpenAI 사의 GPT-3, GPT-4 등이고 이러한 모델을 이용하여 다양한 생성형 AI 서비스가 제공되고 있습니다.

Bing, 뤼튼 등이 생성형 AI이고 GPT-4등이 엔진인 LLM모델입니다.

우리에게 친숙한 챗GPT는 바로 오픈 AI사가 GPT모델로 만든 생성형 AI입니다.
 
이렇게 AI의 엔진이 되는 LLM를 개발하는 주요 회사와 생성형 AI를 비교하면 아래와 같습니다.

개발사 국가 모델 생성형 AI 주요특징
오픈AI 미국 GPT-4 Turbo 챗GPT, Microsoft 빙(Bing), 코파일럿(Copilot), 뤼튼 강력한 자연어 처리, Azure AI 기반 최적화
구글 딥마인드
(Google DeepMind)
미국 Gemini 1.5 Gemini, Google Search, Duet AI 멀티모달 AI, TPU(자체 반도체) 활용
앤스로픽(Anthropic) 미국 클로드(Claude) 2,3 Claude AI, Notion AI 안정성 강화, 문맥 유지 능력 우수
메타(Meta) 미국 라마(Llama)2,3 Meta AI 오픈소스 LLM, 기업 및 연구자용 최적화
미스트랄(Mistral)AI 프랑스 Mistral Le Chat 경량화된 LLM, 성능 대비 빠른 속도 제공
딥시크(DeepSeek) 중국 V3 DeepSeek Chat R1  저사양 반도체 활용 타 LLM 모델과 유사 성능 (타 LLM의 1/10 수준의 개발비용)

 
 

3. 딥시크의 모델 V3

위 표와 같이 딥시크(DeepSeek) 사의 AI 이름인 R1의 LLM모델은 V3입니다.

이슈가 되는건 바로AI의 엔진이 되는 LLM모델인 V3입니다.

V3는 현재 오픈 AI의 GPT-3 보다 뛰어난 성능을 자랑하지만 AI 모델인 V3의 개발 비용이 기존 개발사의 개발비용의 10분의 1에 불과한 수준이라는 것이 이슈가 되었습니다. 

딥시크는 낮은 비용으로 저사양 반도체를 활용해 두 달 만에 V3를 개발하였기에 AI 시장의 새로운 변수로 주목받고 있고 이로 인해 '딥시크 쇼크'란 용어가 나오게 된 것입니다.

딥시크-GPT 개발 비용 비교 (출처 : NBC News 아래 링크)

 

딥시크- 주요 AI 성능 비교(출처 : NBC News 아래 링크)

 

Why DeepSeek is different, in three charts

The Chinese artificial intelligence model’s innovative design allows it to outperform other popular models at significantly lower costs.

www.nbcnews.com

 
 

4. 딥시크 등장으로 인한 엔비디아와 AI 시장의 변화

엔비디아는 최근 몇 년 동안 고성능 그래픽 처리 장치(GPU)를 통해 AI 산업에서 막대한 매출을 올리고 있었고 AI관련 기업들은 필수적으로 엔비디아 고성능 칩을 구매해 LLM 모델을 개발해 왔습니다.
그러나 이번에 딥시크의 AI 모델이 저사양 반도체로 개발되었음에도 오픈 AI의 최신 모델과 유사한 성능을 발휘하자 이는 곧 엔비디아와 같은 고성능 칩이 필수적이지 않다는 증거가 되었습니다.
그 결과 엔비디아 주가가 급락하게 되면서 이슈가 된 것입니다.
지금까지 최첨단 AI 모델을 훈련시키는 데는 엄청난 비용이 소요되고 있었고 오픈 AI 등은  CPU 수천 대와 대규모 데이터 센터를 운영하며 천문학적 비용을 투입했습니다.
딥시크 V3등장으로 이제 엔비디아와 같은 고가의 최신 반도체를 사용하지 않고도 경쟁력 있는 성능을 확보할 수 있다는 전망이 나오면서 아래와 같이 AI 시장이 변화될 가능성이 있습니다.

  • AI 모델 개발 비용 절감 가능성 -> 빅테크 중심 AI 시장 구조 변화 가능
  • 엔비디아 의존도 감소 -> AI 모델 개발에 초고성능 GPU 필수 아님
  • 중국 AI의 성장 가속화 -> 글로벌 AI 경쟁 구도 변화
  • 더 많은 기업들이 저비용 AI 모델을 개발 가능성

deepseek 메인화면

 
마무리
 
현재 AI 산업이 매우 빠르게 변화하고 있습니다.
미국이 주도하고 있는 AI 산업을 중국이 따라잡고 있고 이번 딥시크의 등장으로 AI 개발비용 절감과 반도체 의존도 변화가 예상되기에 앞으로 AI 시장이 어떻게 개편될지 궁금한 상황입니다.
이런 상황에서 한국이 AI 시대 너무 준비가 안된듯해서 아쉬운 마음은 큰 것이 사실입니다.
이제라도 AI 개발에 뛰어들어 좋은 성과가 나오길 바라는 마음입니다.

 


'삶의 재발견'은 직장을 탈출하고  Better Life를 위해
세상을 하나씩 공부해 나가는 블로그입니다.
많은 관심과 댓글 의견 부탁드릴게요!
(흔적 남겨 주시면 답방은 꼭 가겠습니다!)

반응형