TPU 8t·TPU 8i 선보여 학습 칩과 추론 칩 분리해 성능 3배·전력효율 2배 쑥 구글만 쓰던 전용 칩 벗어나 앤스로픽 등 외부 판매 시작 엔비디아·아마존 등과 대결 사진 확대 구글이 인공지능(AI) 연산의 핵심인 자체 반도체 '텐서처리장치(TPU)' 8세대를 공개했다. 학습과 추론을 하나의 칩으로 처리하던 기존 방식에서 벗어나 용도별로 설계를 분리한 것이 특징으로, AI 연산의 중심이 '모델 학습'에서 '추론'으로 이동하는 시장 변화를 반영한 전략으로 풀이된다. 아마존, 엔비디아에 이어 구글까지 추론 특화 AI 칩을 내놓으면서 추론 칩 분야가 AI 반도체시장의 새로운 승부처로 떠오르고 있다. 21일(현지시간) 미국 라스베이거스에서 열린 '구글 클라우드 넥스트 2026' 사전행사에서 공개된 이번 제품은 학습용 'TPU 8t'와 추론용 'TPU 8i'로 나뉜다. 이전 세대 TPU인 '아이언우드'는 학습과 추론을 모두 지원했지만, 이번에는 두 작업을 완전히 분리한 전용 칩을 내놓았다. 아민 바다트 구글 AI인프라 최고기술책임자(CTO)는 "두 칩은 파생 제품이 아니라 각각 용도에 맞춰 처음부터 새로 설계했다"고 설명했다. 훈련용 TPU 8t는 초대형 모델 학습에 집중한다. 단일 훈련 작업에 100만개 이상 TPU 칩을 연결할 수 있다. 바다트 CTO는 "8세대 칩은 7세대 대비 사전학습 성능이 3배 빨라졌으며 전력 효율은 2배 높아졌다"고 말했다. 추론용 TPU 8i는 응답 속도를 최우선으로 했다. 포드 하나에 1152개 칩이 연결되고, 메모리 용량은 이전 세대 대비 7배나 늘어났다. 엔비디아 AI 칩의 경우 수십 개 그래픽처리장치(GPU)를 하나의 서버나 랙 단위로 묶은 뒤 이를 다시 연결해 확장하는 체계라면, 구글은 1000개가 넘는 칩을 하나의 묶음으로 설계해 처음부터 대규모 연산을 전제로 한 구조를 채택했다. 이처럼 1000개 이상 칩을 하나의 시스템으로 설계하면 칩 간 통신 지연을 줄이고 전체 연산을 더 빠르고 안정적으로 처리할 수 있다. TPU 8i에도 이전 세대인 아이언우드처럼 고대역폭메모리(HBM)가 탑재됐다. 다만 HBM 공급사를 묻자 바다트 CTO는 "우리는 최고의 파트너들과 함께하고 있다"고만 언급했다. TPU 전략 전환은 사업 모델 변화와도 연결된다. 구글은 최근 앤스로픽과 대규모 TPU 공급 계약을 체결하며 외부 고객 확보에 나섰다. 내부 전용 칩에 머물던 TPU를 클라우드 고객사에 본격적으로 판매하는 단계로 넘어간 것이다. 엔비디아 GPU 수요가 공급을 초과하는 상황에서 '대안 공급자'로 자리 잡겠다는 의도다. 여기에 범용 칩시장을 엔비디아가 장악하고 있는 것과 달리, 추론의 경우 일부 스타트업과 엔비디아, 아마존 등이 이제 막 뛰어든 초기 단계다. 구글은 올해 전용 칩까지 출시하며 절대 강자가 없는 AI 추론 칩시장에서 선제적으로 주도권을 확보하려는 전략을 본격화하고 있다. 구글 클라우드는 이날 AI 인프라스트럭처 외에도 기업용 AI 플랫폼을 대거 공개했다. 핵심은 '제미나이 엔터프라이즈 에이전트 플랫폼'이다. 기업이 AI 에이전트를 만들고 운영·통제하는 기능을 하나로 묶은 시스템이다. 한국 기업으로는 카카오뱅크와 CJ올리브영이 이를 적용해 생산성을 높이고 비개발자도 AI 에이전트를 만드는 환경을 구축했다. 또한 글로벌 제약사 머크와 최대 10억달러 규모 인공지능 전환(AX) 계약을 체결했다고 밝혔다. 이 프로젝트는 연구개발, 생산, 영업 등 전 영역에 AI 에이전트를 도입하는 내용이다. 7만5000여 명의 직원이 사용하는 기업 전반 시스템에 AI를 적용하는 대형 프로젝트다. 토머스 쿠리안 구글 클라우드 최고경영자(CEO)는 "에이전틱 엔터프라이즈로의 전환은 모든 기업이 나아가야 할 미래"라며 "구글 클라우드의 기술적 준비는 끝났으며, 이제 기업이 성장엔진을 구축해야 할 때"라고 말했다. [라스베이거스 원호섭 특파원]