Anthropic $900B 밸류에이션 · OpenAI 'AI 연구 인턴' 선언 · Alibaba Qwen 3.7-Max 공개

오늘의 핵심

오늘 AI 업계 뉴스를 관통하는 키워드는 ‘에이전트’와 ‘밸류에이션’입니다. Anthropic이 OpenAI 밸류에이션을 처음으로 추월하는 $900B+ 라운드를 진행 중이라는 보도가 나왔고, OpenAI는 9월까지 자동화 AI 연구 인턴을 완성하겠다는 목표를 공식화했습니다. 알리바바·구글·마이크로소프트 모두 에이전트 인프라 경쟁에 본격 돌입한 하루였습니다.

Anthropic, $30B 펀딩 · 밸류에이션 $900B+로 OpenAI 첫 추월

Anthropic이 $900억 달러(약 900조 원)를 넘는 밸류에이션으로 $300억 달러 규모의 펀딩 라운드를 마무리하고 있다고 복수 소식통이 전했습니다. 이는 OpenAI의 3월 밸류에이션 $852억 달러를 처음으로 앞지르는 수치로, 2025년 설립 이후 누적 기업가치 역전이 처음 발생하는 역사적 시점입니다. 2분기 매출 $10.9B, 분기 영업이익 첫 흑자 전환도 함께 예고됐습니다.

밸류에이션: $900B+, OpenAI $852B 최초 추월
2분기 매출 전망: $10.9B (분기 영업이익 첫 흑자)
최근 계약: Gates Foundation $2억 파트너십, KPMG 전 직원 통합 계약, PwC 파트너십

📢 OpenAI와 Anthropic의 밸류에이션 역전은 단순 숫자 싸움이 아닙니다. 엔터프라이즈 신뢰도와 안전성 기반 접근이 시장에서 프리미엄을 인정받기 시작했다는 신호입니다.

출처: Anthropic News — Anthropic

OpenAI, “9월까지 AI 연구 인턴 완성” 공식 목표 선언

샘 알트먼 CEO가 라이브스트림을 통해 2026년 9월까지 수십만 개의 GPU에서 작동하는 자동화 AI 연구 인턴, 2028년 3월까지 완전 자동화 AI 연구원 달성을 OpenAI의 ‘북극성’ 목표로 공식 선언했습니다. 수석 과학자 야쿠브 파코키는 이 시스템을 “대형 연구 프로젝트를 자율적으로 수행하는 시스템”으로 정의하며 추론 모델·에이전트·해석 가능성 연구를 통합한 다중 연구 흐름을 하나로 묶는 목표라고 설명했습니다.

1단계 (2026년 9월): AI 연구 인턴 — 제한적 연구 문제를 자율 수행
2단계 (2028년 3월): 완전 자동화 AI 연구원 — 멀티에이전트 대형 프로젝트 수행
인프라 규모: 수십만 GPU

📢 AI가 AI 연구를 수행하는 재귀적 구조가 2026년 안에 첫 단계를 밟게 됩니다. 이 목표 달성 시점이 AGI 논의의 실질적 기준점이 될 가능성이 높습니다.

출처: Sam Altman on X — X, OpenAI is throwing everything into building a fully automated researcher — MIT Technology Review

알리바바 Qwen 컨퍼런스 2026: Qwen 3.7-Max 공개 · 에이전틱 AI 생태계

알리바바 클라우드가 싱가포르에서 개최한 첫 국제 Qwen 컨퍼런스(5월 26일)에서 1조 파라미터 이상, 100만 토큰 컨텍스트 윈도우를 갖춘 Qwen 3.7-Max를 공개했습니다. 35시간 연속 자율 운행에도 성능 저하가 없으며, 60개 이상의 클라우드 제품을 MCP 호환 스킬로 변환하는 JVS 에이전트 스위트와 AI 에이전트 전용 플랫폼 Qwen Cloud도 함께 발표됐습니다.

Qwen 3.7-Max: 1T+ 파라미터, 1M 컨텍스트, 35시간 자율 운행
Qwen Cloud: AI 에이전트를 위한 AI 네이티브 클라우드 플랫폼
JVS Agent Suite: 60개+ 클라우드 제품을 MCP 호환 스킬로 변환

📢 알리바바의 에이전틱 생태계 공개는 중국 AI 기업의 전략이 모델 경쟁에서 플랫폼 경쟁으로 이동했음을 보여줍니다. 오픈AI·구글·알리바바가 동시에 에이전트 인프라를 구축 중입니다.

출처: Alibaba unveils Qwen 3.7 Max at inaugural Singapore conference — Computer Weekly

DeepSeek V4-Pro, 75% 영구 가격 인하 단행

딥시크(DeepSeek)가 플래그십 모델 V4-Pro의 API 가격을 75 % 영구 인하했습니다. 최대 $3.48/M 토큰에서 $0.87/M 토큰으로 내려가 SWE-bench 80.6 % 성능을 유지하면서도 GPT-5, Gemini 3.5 Flash 대비 현저히 낮은 비용을 제시하며 엔터프라이즈 시장 공략을 강화했습니다.

이전 최고 가격: $3.48/M 토큰 → 인하 가격: $0.87/M 토큰 (75 % 인하, 영구 적용)
성능: SWE-bench 80.6 %, 1.6T 파라미터, 1M 컨텍스트
제공 속도: Fireworks 기준 167 tokens/sec

📢 딥시크의 영구 가격 인하는 AI API 시장 전반의 가격 압력을 높입니다. OpenAI와 Google의 다음 가격 조정이 주목됩니다.

출처: DeepSeek cuts V4-Pro prices by 75% — The Next Web

NextEra, Dominion Energy $67B 인수 — AI 전력 수요가 동력

미국 최대 재생에너지 기업 NextEra Energy가 Dominion Energy를 $670억 달러에 인수한다고 발표했습니다. AI 데이터센터가 2030년까지 미국 전력의 15~25 %를 소비할 것으로 전망되는 가운데, 이번 딜은 AI 인프라 확장에 따른 에너지 시장 재편을 상징하는 거래로 평가받고 있습니다.

딜 규모: $67B
인수 동기: AI 데이터센터 전력 수요 폭증 대응
전망: AI 데이터센터 2030년까지 미국 전력 15~25 % 소비 예상

📢 AI 경쟁은 칩·모델을 넘어 이제 전력 인프라 경쟁으로 확장됐습니다. 에너지 기업의 M&A는 앞으로 AI 섹터 주요 뉴스가 될 것입니다.

출처: The Latest AI News and Breakthroughs That Matter Most — Crescendo AI

Microsoft Build 2026 프리뷰: 에이전트 플랫폼 성숙기 선언

6월 2~3일 샌프란시스코 Fort Mason에서 열리는 Microsoft Build 2026의 핵심 테마는 ‘에이전트’입니다. Azure AI Foundry에서 OpenAI 모델 외 Anthropic Claude의 공식 통합, GitHub Copilot 멀티에이전트 코딩 워크플로, Windows AI NPU 기반 온디바이스 추론이 주요 발표 예정입니다. 주최 측은 ‘발표’가 아닌 ‘프로덕션 안착’ 중심 컨퍼런스를 강조하고 있습니다.

일시: 2026년 6월 2~3일, 샌프란시스코 Fort Mason
주목할 발표: Azure AI Foundry에 Claude 공식 통합, GitHub Copilot 멀티에이전트, Windows Copilot Runtime
특징: ‘AI 발표 → 프로덕션 성숙기’로의 전환점 포지셔닝

📢 Google I/O 이후 열리는 Microsoft Build 2026은 에이전트 AI 패권 경쟁의 2라운드입니다. Google이 소비자 중심이라면, Microsoft는 개발자·엔터프라이즈 진영을 공략합니다.

출처: Microsoft Build 2026 Preview — AI Agents, Azure AI Foundry, and the Return to San Francisco — ChatForest

Gemini 3.5 Flash GA — 구글의 에이전트 전략 신호

구글이 I/O 2026(5월 20일)에서 발표한 Gemini 3.5 Flash를 Gemini API, Google AI Studio, Android Studio를 통해 정식 출시(GA)했습니다. Gemini 3.1 Pro를 어려운 코딩·에이전트 벤치마크에서 상회하면서 출력 토큰 속도는 4배 빠릅니다. 구글은 Gemini 3.5 Pro를 6월로 미루고 Flash를 먼저 출시하며 속도·비용 중심의 에이전트 시장 선점에 나섰습니다.

가용 채널: Gemini API, AI Studio, Android Studio, Gemini Enterprise, Search AI Mode
성능: Gemini 3.1 Pro 대비 코딩·에이전트 벤치마크 상회
속도: 출력 토큰 4배 빠름

📢 Gemini 3.5 Pro 출시를 6월로 늦추고 Flash를 먼저 띄운 것은 에이전트 서빙 시장을 속도와 비용으로 먼저 장악하겠다는 전략입니다.

출처: Gemini 3.5: frontier intelligence with action — Google Blog

LG AI연구원, 유휴 Inference GPU 재활용 인프라 최적화 공개

LG AI연구원이 추론(Inference) 서빙 중 발생하는 유휴 GPU Pool을 감지해 추가 작업에 재배치하는 인프라 최적화 사례를 공개했습니다. 통상 학습 인프라 최적화가 주목받는 데 반해, 서빙 인프라의 GPU 스케줄링 효율화 사례는 드물어 GeekNews 개발자 커뮤니티의 높은 관심을 받았습니다.

핵심: 추론 서빙 중 유휴 GPU를 감지해 다른 작업에 재배치
의의: 서빙 인프라 최적화는 학습 최적화 대비 실무 사례가 희소
공개 채널: LG AI Research 기술 블로그

📢 GPU 비용이 AI 스타트업 생존을 가르는 시대에, 서빙 인프라 최적화 노하우는 실무적 가치가 매우 높습니다. 국내 연구기관의 현장 사례라는 점에서도 주목할 만합니다.

출처: GPU 스케줄링 효율화 사례 — LG AI Research Blog

”LLM 평가는 지식 테스트일 뿐” — 행동 기반 벤치마크 논쟁 확산

현재 LLM 벤치마크가 모델의 ‘지식 보유 여부’만 측정하고 ‘실제 에이전트 수행 능력’을 측정하지 못한다는 비판이 개발자 커뮤니티에서 확산 중입니다. 벤치마크 포화(benchmark saturation) 현상과 맞물려, 실제 사용 시나리오 기반 행동 평가(behavior-based benchmarks)의 필요성이 제기되고 있습니다.

문제: 기존 벤치마크는 지식 재현 능력 측정, 실제 에이전트 수행 능력 미반영
대안 제시: 실제 작업 시나리오 기반 행동 평가 (agentic benchmarks)
커뮤니티 반응: dev.to·GeekNews에서 활발한 토론 진행 중

📢 AI 모델 평가의 패러다임 자체가 흔들리고 있습니다. 리더보드 경쟁이 의미를 잃어가는 가운데, '어떻게 평가할 것인가'가 다음 AI 레이스의 핵심 논쟁이 될 것입니다.

출처: LLM 평가 방식의 한계 — dev.to

오늘의 도구 추천

React Doctor — AI가 생성한 React 코드를 정적 분석으로 검증하는 진단 도구입니다. AI 코딩 도구가 일상화된 지금 생성 코드의 품질 검증이 새로운 병목이 됐습니다. React Doctor는 그 간극을 채우는 실용적인 오픈소스 솔루션입니다.

에디터 노트

오늘 뉴스에서 가장 눈에 띄는 패턴은 ‘에이전트’라는 단어가 모든 빅플레이어의 발표에 공통으로 등장한다는 점입니다. 구글은 Gemini 3.5 Flash를 에이전트용으로 최적화했고, 알리바바는 에이전트 스위트를 발표했으며, Microsoft Build 2026은 에이전트를 메인 테마로 잡았습니다. OpenAI는 AI 연구 인턴이라는 에이전트의 극단적 형태를 목표로 선언했습니다.

에이전트가 유행어에서 제품 전략의 핵심 축으로 전환되는 순간이 지금입니다. 이 전환이 실제로 작동하는지, 아니면 또 다른 과대 선전인지를 판단하는 기준은 6월 Microsoft Build 2026이 될 것입니다.

다음에 또 찾아옵니다. — 에이브랜치