100万个GPU值得英伟达开个分公司 马斯克xAI超算将扩张十倍! (100万个gpu超级计算机)
马斯克的人工自动初创公司xAI正在以惊人的速度展开,其承诺将其在孟菲斯树立的超级计算机Colossus扩展十倍,以容纳逾越100万个GPU。
大孟菲斯商会周三宣布声明称,xAI的扩张执行曾经末尾,英伟达、戴尔和超微电脑也将在孟菲斯树立业务以协助扩张。据悉,外地还将成立一只xAI特地执行队,专门为xAI提供全天候的顶级服务。
Colossus是xAI在往年早些时辰树立的超级计算机,用以支持该公司的人工自动大模型Grok。该计算机是全球最大的超级计算机之一,总共耗时三个月建成,被英伟达首席执行官黄仁勋评价为超人般的速度。
该计算机目前运转着一个由10万多个英伟达GPU组成的集群,依照xAI的想象,其扩张仅在GPU上的破费就或许逾越数百亿美元。此外,xAI还需耗巨资构建供电和冷却设备。
往年以来,xAI曾经从投资者筹集了约110亿美元的资金。这些资金将协助xAI树立愈增弱小的计算才干,协助Grok尽快赶上OpenAI的ChatGPT或谷歌的Gemini等竞争对手。
人工自动公司正在争夺GPU和数据中心的访问权限,以为自己的大模型提供训练和运转所需的计算才干。
行业领军者OpenAI就与微软树立了价值靠近140亿美元的协作同伴相关,其中包括计算才干方面的联盟。甲骨文的大模型Claude则从亚马逊方面取得了80亿美元的投资,并将很快从亚马逊处取得逾越10万个公用AI芯片的经常经常使用权。
马斯克并没有选择与其他大型科技公司协作,而是运行他自己在硅谷的影响力展开自己的人工自动。目前,这家成立不过一年多的xAI估值曾经升至450亿美元,并屡次向OpenAI等抢先企业发动应战。
据一名xAI的投资者表示,尽管xAI还没有推出多样化的商业产品,但马斯克打造Colossus的速度令业内感到震惊,这也成为xAI引以为豪的竞争优点。
大孟菲斯商会总裁兼首席执行官Ted Townsend还强调,孟菲斯的xAI工厂第一阶段将介入约320个终身性任务岗位,最终将带来数千个高科技任务岗位。
他没有走漏英伟达等公司的业务规模,但他走漏任务团队正在确定地点并讨论其业范围和规模。而如此规模的项目将吸引人工自动的顶尖人才,使孟菲斯处于人工自动竞赛的抢先位置。
马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追逐GPT-4o
马斯克的xAI公司宣布将投资巨额资金建造全球上最大的超算中心,以确保Grok 2及后续版本的训练需求。 此超算中心估量在2025年春季建成,规模将是目前最大GPU集群的四倍。 马斯克指出,Grok 2训练要求约2万个基于Hopper架构的英伟达H100 GPU,而Grok 3及更高版本则要求10万个H100芯片。 特斯拉第一季度财报显示,公司曾因算力限制而推延Grok 2模型的训练与发布,方案年外部署8.5万个H100 GPU,破费60亿美元中的大部分用于购置芯片。 每台H100芯片的售价约3万美元,仅芯片费用就要求28亿美元。 马斯克表示,这个芯片储量足以训练Grok 2。 但是,他或许以为这不够打破性,选择建造一个超级计算工厂,方案部署10万个H100芯片。 该工厂将与Oracle协作,估量在2025年春季之前运转。 扎克伯格也宣布了Meta将额外购置50万块GPU的方案,总数到达100万块,批发价值达300亿美元。 微软的目的是到年底拥有180万个GPU,OpenAI希望为最新AI模型经常使用1000万个GPU,并讨论了一个价值1000亿美元的超级计算机方案。 这场算力竞赛的赢家或许是英伟达,由于其CFO Colette Kress提到Blackwell旗舰芯片的优先客户名单包括科技巨头,英伟达未来的产品更新也将继续为这些巨头提供支持。 芯片充足后,电力供应将成为未来最大的限制要素,尤其是关于拥有10万GPU的数据中心要求的100兆瓦电力。 为了降低本钱,数据中心通常选址于电力廉价且供应充足的偏远地域,例如微软和OpenAI在威斯康星州建造大型数据中心,亚马逊云服务的数据中心则位于亚利桑那州。 马斯克表示,xAI或许会将超算中心建在特斯拉总部德克萨斯州奥斯汀市。 在数据中心启动模型训练是一个耗电环节,例如训练GPT-3的耗电量相当于130个美国度庭一年的电量。 CEO Sam Altman投资了Helion Energy,这家公司旨在经过核聚变提供环保且低本钱的AI数据中心运转方式。 但是,马斯克以为AI公司很快将争夺降压变压器,以将高压电流转换为电网可用的电力,从而从公用电网失掉电力。 AI行业或许要求“transformers for Transformers”来应对未来应战。
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。