Anthropic $900B 밸류에이션 · OpenAI 'AI 연구 인턴' 선언 · Alibaba Qwen 3.7-Max 공개
Anthropic이 OpenAI를 처음 앞지른 $900B+ 밸류에이션으로 $30B 펀딩을 진행 중이며, OpenAI는 9월까지 AI 연구 인턴 달성을 공식 목표로 선언했습니다. 알리바바는 싱가포르 Qwen 컨퍼런스에서 Qwen 3.7-Max를 공개해 에이전틱 AI 경쟁을 가열했습니다.
오늘의 핵심
오늘 AI 업계 뉴스를 관통하는 키워드는 ‘에이전트’와 ‘밸류에이션’입니다. Anthropic이 OpenAI 밸류에이션을 처음으로 추월하는 $900B+ 라운드를 진행 중이라는 보도가 나왔고, OpenAI는 9월까지 자동화 AI 연구 인턴을 완성하겠다는 목표를 공식화했습니다. 알리바바·구글·마이크로소프트 모두 에이전트 인프라 경쟁에 본격 돌입한 하루였습니다.
Anthropic, $30B 펀딩 · 밸류에이션 $900B+로 OpenAI 첫 추월
Anthropic이 $900억 달러(약 900조 원)를 넘는 밸류에이션으로 $300억 달러 규모의 펀딩 라운드를 마무리하고 있다고 복수 소식통이 전했습니다. 이는 OpenAI의 3월 밸류에이션 $852억 달러를 처음으로 앞지르는 수치로, 2025년 설립 이후 누적 기업가치 역전이 처음 발생하는 역사적 시점입니다. 2분기 매출 $10.9B, 분기 영업이익 첫 흑자 전환도 함께 예고됐습니다.
- 밸류에이션: $900B+, OpenAI $852B 최초 추월
- 2분기 매출 전망: $10.9B (분기 영업이익 첫 흑자)
- 최근 계약: Gates Foundation $2억 파트너십, KPMG 전 직원 통합 계약, PwC 파트너십
출처: Anthropic News — Anthropic
OpenAI, “9월까지 AI 연구 인턴 완성” 공식 목표 선언
샘 알트먼 CEO가 라이브스트림을 통해 2026년 9월까지 수십만 개의 GPU에서 작동하는 자동화 AI 연구 인턴, 2028년 3월까지 완전 자동화 AI 연구원 달성을 OpenAI의 ‘북극성’ 목표로 공식 선언했습니다. 수석 과학자 야쿠브 파코키는 이 시스템을 “대형 연구 프로젝트를 자율적으로 수행하는 시스템”으로 정의하며 추론 모델·에이전트·해석 가능성 연구를 통합한 다중 연구 흐름을 하나로 묶는 목표라고 설명했습니다.
- 1단계 (2026년 9월): AI 연구 인턴 — 제한적 연구 문제를 자율 수행
- 2단계 (2028년 3월): 완전 자동화 AI 연구원 — 멀티에이전트 대형 프로젝트 수행
- 인프라 규모: 수십만 GPU
출처: Sam Altman on X — X, OpenAI is throwing everything into building a fully automated researcher — MIT Technology Review
알리바바 Qwen 컨퍼런스 2026: Qwen 3.7-Max 공개 · 에이전틱 AI 생태계
알리바바 클라우드가 싱가포르에서 개최한 첫 국제 Qwen 컨퍼런스(5월 26일)에서 1조 파라미터 이상, 100만 토큰 컨텍스트 윈도우를 갖춘 Qwen 3.7-Max를 공개했습니다. 35시간 연속 자율 운행에도 성능 저하가 없으며, 60개 이상의 클라우드 제품을 MCP 호환 스킬로 변환하는 JVS 에이전트 스위트와 AI 에이전트 전용 플랫폼 Qwen Cloud도 함께 발표됐습니다.
- Qwen 3.7-Max: 1T+ 파라미터, 1M 컨텍스트, 35시간 자율 운행
- Qwen Cloud: AI 에이전트를 위한 AI 네이티브 클라우드 플랫폼
- JVS Agent Suite: 60개+ 클라우드 제품을 MCP 호환 스킬로 변환
출처: Alibaba unveils Qwen 3.7 Max at inaugural Singapore conference — Computer Weekly
DeepSeek V4-Pro, 75% 영구 가격 인하 단행
딥시크(DeepSeek)가 플래그십 모델 V4-Pro의 API 가격을 75 % 영구 인하했습니다. 최대 $3.48/M 토큰에서 $0.87/M 토큰으로 내려가 SWE-bench 80.6 % 성능을 유지하면서도 GPT-5, Gemini 3.5 Flash 대비 현저히 낮은 비용을 제시하며 엔터프라이즈 시장 공략을 강화했습니다.
- 이전 최고 가격: $3.48/M 토큰 → 인하 가격: $0.87/M 토큰 (75 % 인하, 영구 적용)
- 성능: SWE-bench 80.6 %, 1.6T 파라미터, 1M 컨텍스트
- 제공 속도: Fireworks 기준 167 tokens/sec
출처: DeepSeek cuts V4-Pro prices by 75% — The Next Web
NextEra, Dominion Energy $67B 인수 — AI 전력 수요가 동력
미국 최대 재생에너지 기업 NextEra Energy가 Dominion Energy를 $670억 달러에 인수한다고 발표했습니다. AI 데이터센터가 2030년까지 미국 전력의 15~25 %를 소비할 것으로 전망되는 가운데, 이번 딜은 AI 인프라 확장에 따른 에너지 시장 재편을 상징하는 거래로 평가받고 있습니다.
- 딜 규모: $67B
- 인수 동기: AI 데이터센터 전력 수요 폭증 대응
- 전망: AI 데이터센터 2030년까지 미국 전력 15~25 % 소비 예상
출처: The Latest AI News and Breakthroughs That Matter Most — Crescendo AI
Microsoft Build 2026 프리뷰: 에이전트 플랫폼 성숙기 선언
6월 2~3일 샌프란시스코 Fort Mason에서 열리는 Microsoft Build 2026의 핵심 테마는 ‘에이전트’입니다. Azure AI Foundry에서 OpenAI 모델 외 Anthropic Claude의 공식 통합, GitHub Copilot 멀티에이전트 코딩 워크플로, Windows AI NPU 기반 온디바이스 추론이 주요 발표 예정입니다. 주최 측은 ‘발표’가 아닌 ‘프로덕션 안착’ 중심 컨퍼런스를 강조하고 있습니다.
- 일시: 2026년 6월 2~3일, 샌프란시스코 Fort Mason
- 주목할 발표: Azure AI Foundry에 Claude 공식 통합, GitHub Copilot 멀티에이전트, Windows Copilot Runtime
- 특징: ‘AI 발표 → 프로덕션 성숙기’로의 전환점 포지셔닝
출처: Microsoft Build 2026 Preview — AI Agents, Azure AI Foundry, and the Return to San Francisco — ChatForest
Gemini 3.5 Flash GA — 구글의 에이전트 전략 신호
구글이 I/O 2026(5월 20일)에서 발표한 Gemini 3.5 Flash를 Gemini API, Google AI Studio, Android Studio를 통해 정식 출시(GA)했습니다. Gemini 3.1 Pro를 어려운 코딩·에이전트 벤치마크에서 상회하면서 출력 토큰 속도는 4배 빠릅니다. 구글은 Gemini 3.5 Pro를 6월로 미루고 Flash를 먼저 출시하며 속도·비용 중심의 에이전트 시장 선점에 나섰습니다.
- 가용 채널: Gemini API, AI Studio, Android Studio, Gemini Enterprise, Search AI Mode
- 성능: Gemini 3.1 Pro 대비 코딩·에이전트 벤치마크 상회
- 속도: 출력 토큰 4배 빠름
출처: Gemini 3.5: frontier intelligence with action — Google Blog
LG AI연구원, 유휴 Inference GPU 재활용 인프라 최적화 공개
LG AI연구원이 추론(Inference) 서빙 중 발생하는 유휴 GPU Pool을 감지해 추가 작업에 재배치하는 인프라 최적화 사례를 공개했습니다. 통상 학습 인프라 최적화가 주목받는 데 반해, 서빙 인프라의 GPU 스케줄링 효율화 사례는 드물어 GeekNews 개발자 커뮤니티의 높은 관심을 받았습니다.
- 핵심: 추론 서빙 중 유휴 GPU를 감지해 다른 작업에 재배치
- 의의: 서빙 인프라 최적화는 학습 최적화 대비 실무 사례가 희소
- 공개 채널: LG AI Research 기술 블로그
출처: GPU 스케줄링 효율화 사례 — LG AI Research Blog
”LLM 평가는 지식 테스트일 뿐” — 행동 기반 벤치마크 논쟁 확산
현재 LLM 벤치마크가 모델의 ‘지식 보유 여부’만 측정하고 ‘실제 에이전트 수행 능력’을 측정하지 못한다는 비판이 개발자 커뮤니티에서 확산 중입니다. 벤치마크 포화(benchmark saturation) 현상과 맞물려, 실제 사용 시나리오 기반 행동 평가(behavior-based benchmarks)의 필요성이 제기되고 있습니다.
- 문제: 기존 벤치마크는 지식 재현 능력 측정, 실제 에이전트 수행 능력 미반영
- 대안 제시: 실제 작업 시나리오 기반 행동 평가 (agentic benchmarks)
- 커뮤니티 반응: dev.to·GeekNews에서 활발한 토론 진행 중
출처: LLM 평가 방식의 한계 — dev.to
오늘의 도구 추천
React Doctor — AI가 생성한 React 코드를 정적 분석으로 검증하는 진단 도구입니다. AI 코딩 도구가 일상화된 지금 생성 코드의 품질 검증이 새로운 병목이 됐습니다. React Doctor는 그 간극을 채우는 실용적인 오픈소스 솔루션입니다.
에디터 노트
오늘 뉴스에서 가장 눈에 띄는 패턴은 ‘에이전트’라는 단어가 모든 빅플레이어의 발표에 공통으로 등장한다는 점입니다. 구글은 Gemini 3.5 Flash를 에이전트용으로 최적화했고, 알리바바는 에이전트 스위트를 발표했으며, Microsoft Build 2026은 에이전트를 메인 테마로 잡았습니다. OpenAI는 AI 연구 인턴이라는 에이전트의 극단적 형태를 목표로 선언했습니다.
에이전트가 유행어에서 제품 전략의 핵심 축으로 전환되는 순간이 지금입니다. 이 전환이 실제로 작동하는지, 아니면 또 다른 과대 선전인지를 판단하는 기준은 6월 Microsoft Build 2026이 될 것입니다.
다음에 또 찾아옵니다. — 에이브랜치