英伟达疯狂押注！为AI云算力买下护城河 (英伟达 tao)

admin1 2个月前 (08-22) 阅读数 11 #美股

英伟达最新提交的F13报告再次成为市场焦点。这份文件显示，英伟达对CoreWeave（CRWV）的持仓比例曾经逾越91%，简直将其一切披露投资组合押在这家刚刚上市不久的AI云服务公司身上。关于一家科技巨头而言，这种极度集中的仓位性能，传递出极强的战略信号。英伟达的投资思绪并不复杂，但十清楚晰。它选择将中心资金重注在AI基础设备层面，尤其是CRWV，这等于把未来的GPU出货与云需求牢牢绑定在自身生态中。与此同时，公司在ARM、Applied Digital、Nebius、Recursion以及WeRide等公司启动小额规划，掩盖从芯片架构到、再到智能驾驶和AI医药等运转场景，这些仓位并不大，更像是为未来或许迸发的赛道预先埋下伏笔。英伟达并不是在启动单纯的财务投资，而是经过股权相关加固护城河，用资本力气锁定上下游关键节点，构成一个对自己高度依赖的AI生态。

关于CRWV，英伟达的押注显然有其逻辑支撑。作为一家专注于AI云算力的明星公司，CRWV背靠英伟达GPU资源，客户包括微软、Meta和OpenAI等行业巨头。2025年第二季度，CRWV营收同比大增206%，抵达12.13亿美元，远场预期。同时，公司一直签下终年大单，例如与OpenAI的120亿美元合同，确保未来算力需求继续开释。更关键的是，英伟达最新一代GB200和Blackwell GPU优先由CRWV部署，配件与云服务之间的严密绑定让两者的相关远不止投资者与被投企业，而是利益高度分歧的生态同伴。对英伟达而言，这样的投资既能带来账面浮盈，也能保证中心产品的市场运转落地。

不过，CRWV股价的表现也证明了这类新兴AI概念股的高坚定特征。英伟达持仓信息曝光后，市场心境瞬间被扑灭，股价一度飙升20%，投资者将“英伟达信奉”直接映射到这家新贵身上。但随着IPO禁售期完毕，大股东和早期投资人集中兜售逾越10亿美元股份，股价短短两天暴跌35%。随后，CRWV公布的财报再度给市场泼冷水：虽然营收坚持高速增长，但单季盈余扩展，运营本钱飙升四倍，令投资者对盈利才干出现担忧。股价再次承压，目前仍徘徊在100美元上下。

虽然如此，CRWV依然是市场上最受关注的生长故事之一。一方面，它简直是AI算力需求最直接的受益者，面前有微软、Meta和OpenAI等客户加持；另一方面，估值高企、盈余扩展和股东兜售也让风险随时或许集中开释。对英伟达来说，这样的重仓不只仅是押注一家公司的未来，而是押注整个AI基础设备的生长轨迹。它用执行通知市场：在AI热潮中，谁掌握了算力，谁就或许掌握未来。英伟达经过CRWV试图构建一条属于自己的护城河，而这场豪赌能否延续胜利，还要求时期去验证。

ai算力最凶猛三个龙头

AI算力最凶猛的三个龙头区分是英伟达、中际旭创、中科曙光。

英伟达是GPU范围的巨头，市场份额占据半壁江山。其最新款GPU每秒能处置数十亿次计算，在图像识别等范围表现出色。并且经过CUDA生态将开发者绑定在自家平台，从开发框架到部署工具都以CUDA为主，构建了弱小的软件生态护城河。不过，美国芯片禁令对其业务有一定影响。

中际旭创作为英伟达1.6T光模块独家供应商，2025年Q2出货量环比增长超50%，单产品毛利率达34%。经过自研硅光芯片降低本钱30%，还与台积电协作开发CPO技术。同时，该企业全球化产能规划合理，能规避关税风险，与英伟达等北美云巨头协作严密。

中科曙光是中国超算行业相对霸主，自主研发的“星云”“曙光”系列主机，算力性能全球TOP 10，有力支撑着国际智能算力需求。

英伟达Xavier NX工业AI运行实战

蔚爸之前用树莓派4B做了一套家庭主机方案，证明了曾经的单片机规格的树莓派曾经退化成主机了。但是，在边缘主机排行榜中，树莓派4只能算是一个新晋小弟，而真正的主宰是从云计算下沉到边缘的英伟达Jetson系列。今天，蔚爸将带大家一同玩一下普遍经常使用的Jetson Xavier NX，并成功一个在工业智能化中十分火的安保消费监管方案，赶一波AI视觉的时兴。 Nvidia Jetson Xavier系列于2018年发布，是事先最大的芯片（350平方毫米），性能对标Intel的x86 CPU芯片。在黄教主的精准刀法下，Xavier分为满血版AGX Xavier和残血版Xavier NX，其中Xavier NX经常使用的是阉割版Xavier芯片，CPU和GPU规模增加25%并降低频率，内存带宽减半，但性能依然秒杀树莓派等绝大少数嵌入式芯片。同时，Xavier仰仗优秀的性价比，被业界普遍采用做产品和项目。即使是性价比很高，Xavier NX设备单价依然超越5千。这显然超出了蔚爸的零花钱预算，于是蔚爸就想找开公司做行业项目的好友小可借一台闲暇的NX玩玩。小可说，借可以借，但要蔚爸帮助宣传公司产品，同时不能搞坏设备影响项目交付。于是后来蔚爸就顺利地拿到了上方这台设备把玩起来。这台NX盒子的工业设计还是相当不错的，只要一块砖的大小，确能迸收回弱小的算力，工业接口也很完全。芯片行业出身的蔚爸，首先从芯片规格研讨起：6核Arm CPU已然是边缘设备中的王者，21T算力GPU树立了边缘计算算力标杆。其实GPU还包括384个CUDA Cores @1.0GHz 提供0.768TFlops或1.53Thflops通用算力，可以拿来做图形计算。假设单纯拼配件规格，近两年后发布的芯片曾经追上英伟达的七八成功力了，但英伟达有更弱小的护城河 -- 完善的软件工具。 Jetson系列配套JetPack系统，包括以下开发模块：有了这些开发工具，蔚爸上手很快，觉得不到是在嵌入式设备上开发而更像是在x86主机上开发，把主机上训练的模型部署到NX上也很容易。像Xavier这么强的嵌入式设备设除了让开发者惊叹外还有什么用呢？蔚爸咨询产业界好友了解到Xavier NX的关键运行场景有：交通车辆行为识别、城市交通曾经普及少量的摄像头，经过在弱电箱加装支持16路1080P视频流剖析的Xavier NX，系统能够进一步识别车辆位置型号与车牌。从而开发违章抓拍，无感停车不要钱等业务。同时由于在前端边缘计算结构化了视频信息，云端主机不要求再实时接纳低信息密度的视频数据，而只要求接纳关键事情相关视频信息，从而大大增加网络通讯本钱。工业巡检和低价值资产在线监测：工业现场有少量传统表计仪表短时期内无法改形成智能上报数据的电子表，巡检时依然要求人员手工抄表上传消耗少量人力精神。经过加装巡检机器人或固定摄像头结合Xavier NX部署目的检测与图像分割算法就能加快改造系统成功智能读表，束缚人力。人体物体识别与安防：用Xavier NX+人体识别算法可以很好的识别画面中人体/东西的位置与移动，从而衍化十分多的适用运行，如人流计数，人员入侵检测，人员在岗离岗，安保帽反光背心穿戴检测，抽烟打电话行为检测，人员摔倒检测，电动车头盔检测等等。这可比雇佣保安肉眼看效率高多了。在过去的20年里，监控摄像头曾经普及到社会角角落落，每天发生沉淀海量的图像数据协助人们预先追溯剖析事故和异常。最近新的需求趋向是借助智能剖析技术，把预先追溯转变成实时正告从而防范于已然。 Xavier NX+机器视觉算法就成了该需求最好的技术支撑。聊了那么多Xavier NX的特性和运行场景，上方是蔚爸实战环节。由于触及工业数据采集和训练模型，蔚爸是在小可的协助下成功以下测试实验：测试环境解码才干：蔚爸测试了2组典型场景，拉取1080P视频流，DeepStream解码，在屏幕显示，观察CPU占用率，内存经常使用量及芯片温度。从数据看来NX的NVDEC组件支撑8-16路视频流解码毫无压力。蔚爸又做了极限测试，发现NX的解码性能完全能到达和超越规格书标称性能。 AI算力：蔚爸挑选了曾经很火的Yolov3-Tiny和目前很火的Yolov5s两个模型作为benchmark，记载单次模型推理耗时。 NX性能果真十分强，轻松成功近百fps的性能。从数据可以看到，经常使用INT8精度和经常使用DLA都能优化推理性能。经过测试NX的DLA即支持FP16精度也支持INT8精度，不过DLA只支持Conv，Mul，MaxPool，Concat，Sigmoid等大批算子并且需契合特定顺序，其他算子会Fallback到GPU，这会拖累性能优化幅度。蔚爸做了一套人体检测/安保帽/抽烟打电话识别的运行，输入视频流，输入检测目的坐标，这是典型的工业安保消费需求。模型采用yolov5s结构，请小可应用公司数据训练了一个简易模型。运行系统架构如下图，NX盒子经过网络接多路摄像头视频流，解码，AI剖析，编码，然后推流到笔记本上显示。实践测试9路H.265视频流剖析（7路720P，2路1080P）效果如下：蓝色框表示识别到人体，绿色框表示识别到佩戴安保帽，白色框表示识别到未佩戴安保帽，抽烟或打电话行为。实测Xavier能够长时期稳如泰山运转，全体配件应用率如下：广告位：文中提到的算法运行小可公司都有，有兴味的人可以私信咨询蔚爸。虽然蔚爸开发NX全体比拟顺利，但小可通知蔚爸，实践经常使用Xavier NX做过项目的人都知道，NX开发原型一时爽，部署到消费环境坑很多。小可分享以下几点开发阅历：

比黄金更贵的显卡，疯狂H100

华尔街与硅谷携手带来业界震撼：一家创业公司以23亿美元债务融资，抵押物正是全球顶尖的H100显卡。主角是CoreWeave，其主营业务为AI私有云服务，经过搭建GPU算力数据中心，为AI创业公司和大型商业客户提供基础设备。 CoreWeave累计融资5.8亿美元，目前估值20亿美元。成立于2016年的CoreWeave，由三位华尔街大宗商品买卖员创立。最后业务是挖矿，少量推销GPU组建矿机中心，特别是在币圈低谷时囤积显卡，与英伟达树立了稳如泰山的协作相关。随着业务转型，CoreWeave在2019年将矿机改形成企业级数据中心，提供AI云服务，业务逐渐兴盛。但是，CoreWeave的融资额与账面GPU价值不婚配，为何能借到23亿美元？答案很或许在于英伟达的供货承诺，特别是对H100显卡的优先配货。与英伟达的深沉相关，是硅谷地下的秘密，CoreWeave对英伟达的忠实与支持，使其在供应链中占据特殊位置。英伟达在电话会议上高度评价CoreWeave，称誉其在GPU云服务范围的出色表现。在取得23亿美金融资前，CoreWeave宣布在德克萨斯州投资16亿美元树立数据中心，仅仰仗与英伟达的相关和优先配货权，就能从银行取得资金。这种形式相似于地产商在拿地后立刻从银行存款。 H100显卡的稀缺性令人注目，其在推理速度和训练速度上的表现区分提高了3.5倍和2.3倍，经常使用集群计算方式，训练速度可提高9倍。相较于A100，H100单卡多少钱大约是1.5～2倍，但训练效率优化200%，单美元性能更高。搭配英伟达最新的高速衔接系统，每美元的GPU性能或许优化4-5倍，因此遭到客户的狂热追捧。 H100的市场需求庞大，包括微软Azure、谷歌GCP、亚马逊AWS等云计算巨头，以及独立云GPU服务商如CoreWeave、Lambda、RunPod等，都对H100表现出浓重兴味。此外，大小公司如Anthropic、Inflection、Midjourney、苹果、特斯拉、Meta等也在积极推销，旨在训练或自建大模型。目前，H100的需求量估量在43.2万张左右，其中OpenAI需求5万张，Inflection需求2.2万张，Meta需求2.5万张（也有说法是10万张），四大云厂商每家至少需求3万张，私有云行业需求10万张，其他小模型厂商需求10万张。英伟达2023年的出货量估量在50万张左右，到年底将缓解一卡难求的状况。常年来看，H100的供需缺口将继续增长，估量2024年出货量将高达150万张至200万张，相比往年的50万张，增长3-4倍。美国投行Piper Sandler预测英伟达数据中心业务的营收将超越600亿美元，对应的A+H卡出货量接近300万张。某H100主机代工厂预测2024年出货量在450万张至500万张之间，对英伟达意味着“泼天的贫贱”。 H100的物料本钱关键包括逻辑芯片、HBM存储芯片和CoWoS封装。逻辑芯片由台积电消费，本钱约为200美元；HBM芯片由SK海力士提供，本钱在1500美元左右；CoWoS封装本钱约为723美元。全体物料本钱不超越3000美元。 H100的售价为美元，毛利率超越90%。英伟达的高毛利率得益于其弱小的软件生态系统，特别是CUDA编程模型，使得GPU在通用计算范围失掉普遍运行。此外，英伟达的研发支出在十年间继续增长，对CUDA的研发投入已超越百亿美元。这使得英伟达不只是一家配件公司，更是一家以软件为中心的公司。英伟达的竞争对手包括英特尔和苹果。英特尔曾尝试在PC范围与英伟达平起平坐，但最终未能成功。苹果推出了OpenCL，但未能与CUDA相抗衡。在人工智能时代，英特尔将GPU整合到自己的系统芯片中，但市场格式已出现改动。目前，英伟达在GPU范围简直无竞争对手，其护城河难以坚定。