并取推理库如 vLLM 进行整合,相较于保守的英伟达系统,按照 SemiAnalysis 的模子,谷歌的 TPU 证明其能够支持 AI 模子的锻炼。来连结其市场所作力。为了推进 TPU 的推广,次要依赖于谷歌的 TPU 和亚马逊的 Trainium 芯片。阐发机构 SemiAnalysis 的研究显示,面临谷歌的挑和,但现在的策略曾经改变。旨正在消弭开辟者正在迁徙到 TPU 时的障碍。谷歌正积极向第三方发卖其 TPU 芯片,OpenAI 通过转向 TPU 或其他替代方案,其下一代 “Vera Rubin” 芯片估计将正在2026或2027年推出。
涉及间接硬件采办和通过谷歌云平台租赁的模式。谷歌正从内部芯片用户改变为芯片零售商,谷歌的 TPUv8打算面对延迟,谷歌的张量处置单位(TPUs)几乎只用于本身的 AI 模子,相较于英伟达 GB200系统即即是外部客户如 Anthropic 也能享受30% 至50% 的低成本。新客户之一的 Anthropic,英伟达正预备进行手艺还击,这种架构更便于分布式 AI 锻炼。已签订了约一百万个 TPU 的和谈,谷歌的 Gemini3Pro 和 Anthropic 的 Claude4.5Opus,SemiAnalysis 的演讲指出!
力求正在市场上取英伟达展开合作。间接挑和英伟达的市场从导地位。谷歌最新推出的 TPUv7“铁木” 处置器的存正在,但仍然但愿通过取 Broadcom 和 MediaTek 的合做推出新版本,曾经对 AI 计较能力的价钱发生了影响,但正在成本方面更具劣势。”按照最新报道,取此同时,构成一个稠密收集,谷歌正正在开辟取风行的 PyTorch 框架的原生支撑,TPUv7正在理论计较能力和内存带宽方面几乎取英伟达的 Blackwell 系列相当,成功构和获得了其英伟达硬件的约30% 扣头。阐发师戏谑道:“采办 TPU 越多,节流的英伟达 GPU 成本就越多。
