Notice
Recent Posts
Recent Comments
Link
«   2026/05   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
Tags more
Archives
Today
Total
관리 메뉴

루크의 텐베거 투자 블로그

DeepSeek V4가 MIT 라이선스로 풀렸다, 1.6조 파라미터의 가격이 GPT의 1/10이라고? 본문

VC PE/기술스터디

DeepSeek V4가 MIT 라이선스로 풀렸다, 1.6조 파라미터의 가격이 GPT의 1/10이라고?

루크_VC Investor 2026. 4. 26. 09:42

2026년 04월 26일 AI·기술 트렌드

안녕하세요. 오늘은 이번 주 가장 큰 충격파를 던진 DeepSeek V4 오픈소스 공개와, 이 모델이 돌아가려면 반드시 필요한 차세대 AI 인프라(엔비디아 루빈 + HBM4)를 중심으로 기술 트렌드를 깊이 파헤쳐볼게요. AI 모델 경쟁이 "성능"에서 "가격"으로 전환되는 역사적 분기점, 그리고 그 뒤에서 벌어지는 반도체 전쟁까지 한 번에 정리해드릴게요.

AI 반도체 칩 이미지
AI 칩과 회로 기판 (출처: Unsplash)

오늘의 핵심 기술 1 - DeepSeek V4와 오픈소스 AI 모델 전쟁

이 기술이 뭔가요

DeepSeek V4는 중국 AI 스타트업 DeepSeek가 4월 24일 공개한 초거대 언어 모델(LLM)이에요. 쉽게 말하면, ChatGPT나 Claude 같은 대화형 AI의 "두뇌"에 해당하는 핵심 엔진인데요. 이번에 특별한 건 1.6조(1.6T) 개의 파라미터를 가진 모델을 MIT 라이선스(누구나 상업적으로 자유롭게 쓸 수 있는 완전 오픈소스)로 풀어버렸다는 거예요. 1년 전 DeepSeek가 실리콘밸리를 뒤흔들었을 때도 대단했지만, 이번엔 그때와는 차원이 다른 이야기예요.

기술의 진화 - 어떻게 바뀌어 왔나

  • 이전 세대(DeepSeek V3, 2025): MoE(Mixture of Experts) 구조를 처음 대규모로 적용해서 "적은 연산으로 큰 모델을 돌린다"는 걸 증명했어요. 하지만 프론티어 모델(GPT-4.5, Claude 등) 대비 성능 격차가 뚜렷했고, 긴 문맥 처리에도 한계가 있었어요.
  • 현재 세대(DeepSeek V4, 2026.04): 완전히 다른 레벨이에요. V4-Pro는 총 1.6T 파라미터에 49B 활성화, V4-Flash는 284B 파라미터에 13B 활성화로 두 가지 모델을 동시에 출시했어요. 핵심 혁신은 세 가지예요.
    • Manifold-Constrained Hyper-Connections(mHC): 기존 잔차 연결(residual connection)을 강화해서 학습 안정성을 크게 높인 기술
    • Hybrid Attention Architecture: 긴 대화에서도 맥락을 잃지 않는 새로운 어텐션 구조
    • 100만 토큰 컨텍스트 윈도우: 책 한 권 분량을 한 번에 처리할 수 있어요
    • V4-Pro-Max 기준 GPT-5.2, Gemini-3.0-Pro와 동급 성능을 달성
  • 다음 세대: DeepSeek는 V4를 "프리뷰"라고 명시했어요. 즉, 정식 버전에서는 현재 3-6개월 뒤처져 있다는 GPT-5.4, Gemini-3.1-Pro와의 격차를 더 좁히겠다는 의미예요. 업계에서는 2026년 하반기 V4 정식 버전이 프론티어 모델과 완전히 동급에 도달할 수 있다고 보고 있어요.

최근 뉴스로 본 혁신 포인트

1) 가격 파괴의 충격 - V4-Flash의 API 가격이 입력 100만 토큰당 $0.14, 출력 $0.28이에요. 이건 GPT-5급 모델 대비 약 1/10 수준의 가격이에요. 오픈소스이니 자체 서버에 올리면 API 비용이 아예 0원이고요. AI 서비스 스타트업들에게는 "게임 체인저" 그 자체예요.

2) Stanford AI Index 2026의 판도 변화 - 스탠포드 대학교의 2026 AI Index에 따르면, 2026년 3월 기준으로 Anthropic이 AI 모델 리더보드 1위, 그 뒤를 xAI, Google, OpenAI 순으로 따르고 있어요. 1년 전만 해도 OpenAI 독주 체제였는데, 판이 완전히 뒤집어진 거예요.

3) PwC AI 성과 보고서 - AI의 경제적 이익 중 75%를 상위 20% 기업이 독차지하고 있다는 분석이 나왔어요. AI 도입이 보편화됐지만, 실제로 돈을 버는 기업은 극소수라는 뜻이에요. 이런 상황에서 DeepSeek V4 같은 저가/오픈소스 모델은 "나머지 80% 기업"에게 새로운 기회를 열어줄 수 있어요.

주목해야 할 기업 맵

상장 기업 (국내/글로벌):

기업 티커 포지션 최근 이슈
Anthropic (비상장이나 구글 지분) GOOGL (간접) AI 모델 리더보드 1위 (Stanford AI Index 2026) Claude 4.5/4.6 시리즈로 프론티어 선두 유지
Microsoft MSFT OpenAI 최대 투자자, Copilot 생태계 2026 AI 인프라 CapEx 1,000-1,200억 달러 전망
Alphabet (Google) GOOGL Gemini 3.x 시리즈, TPU 자체 개발 신규 데이터센터 3곳에 400억 달러 투자 계획
네이버 035420.KS HyperCLOVA X, 한국어 AI 선도 DeepSeek V4 등 오픈소스 모델 활용 전략 검토
카카오 035720.KS 카나나(Kanana) AI 모델 개발 오픈소스 모델 기반 서비스 고도화 추진

비상장 / 스타트업:

기업 국가 최근 펀딩 차별점
DeepSeek 중국 비공개 (자체 자금) 1.6T 파라미터 MIT 오픈소스, API 가격 파괴
Cursor (Anysphere) 미국 $20억 라운드 진행 중 (기업가치 $500억+) AI 코딩 에디터, 개발자 생산성 혁신
Upstage 한국 시리즈 B+ Solar 모델, 문서 AI 특화, 글로벌 진출
Twelve Labs 한국/미국 시리즈 A 비디오 AI 이해 기술, 멀티모달 특화

오늘의 핵심 기술 2 - 엔비디아 루빈(Rubin) + HBM4, 차세대 AI 인프라의 실체

이 기술이 뭔가요

DeepSeek V4처럼 1.6조 파라미터짜리 모델을 실제로 학습시키고 서비스하려면, 엄청난 연산 능력(GPU)초고속 메모리(HBM)가 필요해요. 비유하자면, AI 모델이 "자동차"라면 GPU는 "엔진", HBM은 "연료 탱크"인 셈이에요. 엔진이 아무리 강력해도 연료를 빠르게 공급하지 못하면 차가 안 달리거든요. 엔비디아의 루빈(Rubin) GPU와 HBM4 메모리는 바로 이 문제를 해결하는 차세대 AI 인프라의 핵심이에요.

HBM 고대역폭 메모리 구조도
HBM(High Bandwidth Memory) 구조 다이어그램 - 여러 층의 DRAM 다이를 수직으로 쌓아 대역폭을 극대화하는 구조 (출처: Wikimedia Commons, CC BY-SA 4.0)

기술의 진화 - 어떻게 바뀌어 왔나

  • 이전 세대(블랙웰/B200, 2025): 엔비디아 블랙웰 아키텍처는 AI 학습/추론 성능에서 큰 도약을 이뤄냈지만, HBM3E 메모리의 대역폭(약 8TB/s)이 점점 병목이 되기 시작했어요. "메모리 벽(Memory Wall)" 문제가 본격적으로 부각된 시기예요.
  • 현재 세대(루빈/Vera Rubin, 2026): CES 2026에서 양산 돌입을 발표한 루빈 플랫폼은 스펙 자체가 압도적이에요.
    • 트랜지스터 3,360억 개 (블랙웰 대비 약 1.6배)
    • FP4 기준 50 페타플롭스 연산 성능
    • 288GB HBM4 메모리, 22TB/s 대역폭 (블랙웰 대비 약 2.75배)
    • NVLink 6으로 GPU간 260TB/s 연결
    • TSMC 3nm 공정 제조
    • 2026년 3분기(Q3) 출하 예정
    • Vera CPU, Rubin GPU, NVLink 6 스위치 등 7개 칩이 하나의 통합 플랫폼으로 설계됨
  • 다음 세대(파인만/Feynman): GTC 2026에서 로드맵이 공개됐어요. 루빈 이후 파인만(Feynman) 아키텍처가 예고됐고, GPU 업그레이드 주기를 기존 2년에서 1년으로 단축하겠다는 젠슨 황의 선언이 있었어요. 반도체 업계 전체가 이 속도에 맞춰야 하는 상황이에요.

최근 뉴스로 본 혁신 포인트

1) 엔비디아, 데스크톱 GPU 포기 선언 - 30년 역사상 처음으로 2026년 데스크톱용 그래픽카드 신제품 출시를 전면 중단했어요. 이유는 단순해요. HBM과 메모리 자원을 데이터센터 AI 칩에 올인하겠다는 거예요. 게이머보다 AI 데이터센터가 돈이 된다는 걸 엔비디아 스스로가 선언한 셈이에요.

2) SK하이닉스-TSMC "HBM4 원팀" - 4월 23일 TSMC 심포지엄에서 SK하이닉스가 HBM4 로드맵을 공개하며 TSMC와의 협력을 더욱 강화했어요. HBM4는 기존처럼 메모리만 쌓는 게 아니라, 로직 다이와 메모리를 통합(Memory-Logic Integration)하는 방향으로 진화하고 있어요. SK하이닉스가 2026년 중 HBM4 양산에 돌입하며 글로벌 점유율 50% 이상을 유지할 전망이에요.

3) 삼성전자-테슬라 파운드리 협력 - 일론 머스크가 테슬라 자체 AI 칩 'AI4.1'의 생산을 삼성전자 파운드리에 맡기겠다고 발표했어요. 2nm 차세대 칩까지 협력 범위를 확대하면서, 삼성 파운드리가 TSMC 독점 체제에 균열을 낼 수 있는 중요한 레퍼런스를 확보한 거예요.

주목해야 할 기업 맵

상장 기업 (국내/글로벌):

기업 티커 포지션 최근 이슈
엔비디아 NVDA AI GPU 절대 강자, 루빈 플랫폼 루빈 풀프로덕션 진입, 데스크톱 GPU 출시 중단
SK하이닉스 000660.KS HBM 글로벌 1위 (50%+ 점유율) 1분기 사상 최대 실적, 영업이익률 70%대, HBM4 양산 준비
삼성전자 005930.KS 메모리 + 파운드리 듀얼 포지션 테슬라 AI4.1 파운드리 수주, 2nm 협력 확대
TSMC TSM 파운드리 절대 1위, 3nm 양산 연간 최대 82조 원 투자 계획, SK하이닉스 HBM4 협력
한미반도체 042700.KS HBM 본딩 장비 핵심 공급사 HBM4 세대교체로 장비 수주 확대 기대

비상장 / 스타트업:

기업 국가 최근 펀딩 차별점
DeepX 한국 시리즈 B 온디바이스 AI 전용 NPU 칩 설계, WIS 2026 출전
Mobilint 한국 시리즈 A 초저전력 NPU, 엣지 AI 특화
Cerebras Systems 미국 시리즈 F ($250M+) 웨이퍼 스케일 칩, 단일 칩으로 LLM 학습
Groq 미국 시리즈 D LPU(Language Processing Unit), 초고속 추론 특화

데이터센터 서버 랙
AI 데이터센터의 서버 랙 (출처: Unsplash)

기타 주목할 뉴스 - 한 줄 요약

분야 핵심 뉴스 시사점
AI 벤처 투자 Q1 2026 글로벌 벤처 투자 3,000억 달러 돌파 (역대 최고), AI가 전체의 80% 차지 OpenAI $1,220억, Anthropic $300억, xAI $200억 등 초대형 라운드가 전체를 견인. 투자 집중도 심화
빅테크 CapEx 빅테크 4사 2026년 AI 인프라 투자 합계 6,500-6,700억 달러 전망 MS 1,000-1,200억, 메타 720억 달러 등. "달 착륙보다 돈을 더 쓴다"는 평가. GDP 2% 수준 접근
에너지/냉각 AI 데이터센터 전력 수요 100MW 이상, IEA "2030년까지 4배 증가" 전망 MS 무수(waterless) 침지냉각 도입, 삼성중공업 부유식 DC, 에이텀 해수냉각 DC 등 혁신 경쟁
AI 규제 美 백악관 국가 AI 정책 프레임워크 발표 (3월 20일), EU AI Act 투명성 요건 8월 2일 시행 새 규제기관 신설 반대, 기존 기관 활용 방침. 주(州)법 선점 권한 제한으로 기업 부담 경감
반도체 수급 중동 리스크로 헬륨 공급 차질, 나프타 가격 80% 급등, 화학소재 20-30% 상승 반도체 원재료 비용 압력 가중. 삼성/SK하이닉스 생산 차질 우려
온디바이스 AI 향후 3년간 AI 디바이스 4.9억 대 공급 전망, 시스템 반도체 25.8조 원 부가가치 창출 NPU 40 TOPS 이상이 AI PC 기준. DeepX, Mobilint 등 한국 팹리스 성장 기회
에너지 효율 터프츠대, AI 에너지 사용량 100배 절감 + 정확도 향상 기술 발표 신경망+기호 추론 결합 방식. 로봇 AI에 특화, 상용화 시 DC 전력 문제 완화 가능

VC 인사이트

2026년 4월 넷째 주, 두 가지 큰 흐름이 교차하고 있어요. AI 모델의 민주화AI 인프라의 초집중화예요.

DeepSeek V4의 오픈소스 공개는 AI 모델 접근성을 극적으로 낮추고 있어요. GPT-5급 성능을 1/10 가격에 쓸 수 있다는 건, AI 응용 계층(Application Layer)의 스타트업들에게 엄청난 기회예요. 특히 한국에서는 Upstage(문서 AI), Twelve Labs(비디오 AI), 뤼튼(생성형 AI 플랫폼) 같은 기업들이 모델 비용 절감의 직접적 수혜를 받을 수 있어요. 반면, 자체 모델 개발에 올인한 기업들은 "직접 만드는 것 vs 오픈소스 커스터마이징"이라는 전략적 딜레마에 빠질 수 있어요.

인프라 쪽에서는 자금이 더욱 집중되고 있어요. Q1 벤처 투자 3,000억 달러 중 80%가 AI에 몰렸고, 빅테크 CapEx만 6,500억 달러를 넘어요. 이 돈은 결국 엔비디아 루빈 GPU, SK하이닉스 HBM4, TSMC 3nm 파운드리로 흘러가요. 한국 기업 중에서는 SK하이닉스(HBM4 양산), 삼성전자(파운드리 + 메모리), 한미반도체(본딩 장비), ISC(HBM 테스트 소켓)가 가장 직접적인 수혜 후보예요.

리스크 시그널도 분명해요. 중동발 헬륨 공급 차질로 반도체 생산 비용이 올라가고 있고, AI 투자의 극단적 집중(상위 4개 라운드가 전체 VC의 65%)은 거품 논란을 키우고 있어요. EU AI Act 시행(8월)과 미국의 주별 AI 규제 움직임도 변수예요. 다만, 실질적인 AI 매출이 발생하는 기업(PwC 보고서 기준 상위 20%)과 그렇지 않은 기업의 양극화가 심화되고 있으니, "AI를 잘 쓰는 기업"에 투자하는 것과 "AI를 만드는 기업"에 투자하는 것을 구분해서 접근해야 해요.

※ 이 글은 정보 제공 목적으로 작성되었어요. 투자 결정은 본인의 판단과 책임 하에 이루어져야 해요.

#AI트렌드 #기술트렌드 #AI뉴스 #반도체뉴스 #HBM #엔비디아 #빅테크AI #AI데이터센터 #DeepSeekV4 #루빈GPU