正面硬刚DeepSeek和字节豆包 AGI独家腾讯首个全模态模型混元O将公布 (正面硬刚的成语)

admin1 8小时前阅读数 330 #银行

文章标签 AGI独家腾讯首个全模态模型混元O将公布正面硬刚DeepSeek和字节豆包

腾讯不止“关爱”DeepSeek，其自研大模型“混元”似乎也要发力，不只瞄准豆包，而且要发力“全模态”，运行更多资源投向通用人工智能（AGI）。

5月25日信息，笔者独家得知，基于腾讯自研大模型混元的首个端到端语音通话模型Hunyuan-Voice，最快往年6月上线腾讯元宝App，从而与豆包AI视频通话性能对立。而且，腾讯已规划多模态和全模态路途，最快往年将推出全球首个“全模态模型”，代号为混元-O，瞄向“全球模型”。

隶属于腾讯TEG（技术工程）事业群的腾讯混元科研人员走漏，面向AGI，混元将以言语模型为中心，探求多种模态融合，并将向深度、广度两方面继续推进探求。一方面，混元从大言语模型向多模态模型展开，了解和模拟物理全球；同时，混元还将瞄准更智能的推理、规划、智能体，以及探求知识边界，自我启示、自我迭代、自我发现，最终与具身智能等技术结合，向环境中自主执行和学习的全球模型方向启动探求。

这是首个披露腾讯混元最新规划的信息，在此之前，腾讯没有对外披露过混元-O全模态模型技术。

后发混元大模型，马化腾直夸DeepSeek

随着2022年底ChatGPT流行全球，2023年2月，腾讯混元大模型项目正式启动，并部署AI大模型技术研发任务，以言语模型为基础，逐渐打造涵盖各种模态的模型矩阵。

2023年9月，腾讯在全球数字生态大会上正式公布混元大模型，并宣布经过腾讯云对外开放。该模型是腾讯全链路自研的通用大言语模型，拥有超千亿参数规模，预训练语料超2万亿tokens；9月中旬，混元大模型首批经过《生成式人工智能服务控制暂行方法》备案。

2024年，腾讯混元大模型减速迭代，1月公布高性能MoE模型，5月开源业界首个中文DIT文生图模型，随后公布混元多模态了解模型；9月，混元Turbo公布；11月，腾讯混元开源大言语模型Hunyuan-large。

理想上，腾讯很早就规划AI技术，2021年腾讯就推出千亿和万亿参数的NLP稀疏大模型，但是在混元疑问上，截至2024年底，腾讯混元不时落后于OpenAI，并且未与豆包、阿里通义、DeepSeek等模型拉开差距，腾讯AI运转元宝也未与kimi等产品构成头部效应。

2023年股东大会上，腾讯集团董事长兼CEO马化腾表示，AI是全行业甚至全全球的重点，腾讯总算能跟上第一阵列，不能算最抢先，但是至少没有太落后。

“我们最末尾以为这是互联网十年不遇的机遇，但是越想越觉得这是几千载难逢的、相似发明电的工业反派一样的机遇。互联网企业都有很多的积聚，都在做，我们也一样在埋头研发，但是并不急于早早做完，把半成品拿出来展现。”马化腾称。

马化腾强调，前面还要结合场景展开，把AI混元大模型运转到各个场景中，“短期内一两年内我觉得不会有一个纯原生AI大的运转，应该还是要结合到我们的一切产品外面效率优化等，我觉得这个是一个很大的机遇。”

到了2025年，中国开源AI模型DeepSeek流行全球，腾讯突然减速AI运转落地部署，旗下元宝、阅读器、微信、ima、腾讯文档、QQ阅读器、QQ音乐等多款腾讯产品，在接入混元大模型的同时，接入DeepSeek-R1模型。在外界看来，这让混元AI大模型处境略显为难，似乎成为“备胎”。

DeepSeek-R1虽补偿了混元大模型在推理速度和照应效率上的有余，却使得用户更偏向于经常经常使用有DeepSeek加持的性能。

往年3月腾讯年报沟通会中，马化腾谈及DeepSeek时表示，深度思索模型出来后，AI智能化比以前有大幅优化，而且DeepSeek发生后，开源和中国工程师在关注本钱和效率方面的优点较为清楚。AI的智能化水平相比往年有大幅度优化，关于腾讯来说经过慎重思索，云业务和元宝都在拥抱AI。未来运转大展开的机遇曾经到来，各家都在采纳AI落地，也看到AI Agent（智能体）的展开，面前有很多AI相关工具的设想空间。目前AI生态还在早期，各行各业都会受益于AI普及，置信每个行业都会拥抱这个机遇。

“我们业界和梁文锋都有交流，很敬仰市场上发生独立、开源的产品，我们十分尊重。”马化腾表示。

与此同时，腾讯集团CSIG旗下腾讯云针对DeepSeek开源的DeepEP通讯框架启动深度优化，使其在多种网络环境下均成功清楚性能优化。相关技术方案也取得了DeepSeek地下致谢，称这是一次性性“huge speedup”代码奉献。

“经常经常使用GPU启动大言语模型训练。去年有一段时期，人们以为每一代大型言语模型都要求数量级更大的GPU，但 DeepSeek 的打破性进度完毕了这一时期。如今，业界以及我们业内人士都能够运行现有GPU大幅提矮小型言语模型训练的消费力，而无需像之前预期的那样额外增加GPU。”腾讯此前在财报会上表示。

据界面，一位担任互联网大厂投流的营销供应商表示，腾讯在元宝上的投流打法复制了去年字节跳动豆包“鼎力出奇观”的推行方式，经过自家产品生态自带的流量中心优点（字节关键依赖抖音、今天头条，腾讯依赖微信），再加上大规模广告投放引流。独一的区别是，字节跳动投流的宣传对象关键是自家的“豆包”AI模型，腾讯则简直为每一条元宝广告都贴上了“DeepSeek”标签，自家混元模型反而没有太多曝光。

不过，腾讯似乎依然不想丢弃自研大模型产品。随着全球AI产业片面构成“重资源”投入趋向，腾讯心愿运行“自研+开源”多模型战略，减速全域产品AI浸透。

目前混元是由腾讯TEG（技术工程）启动主导研发，随着姚星、蒋杰等人陆续离任，目前腾讯混元担任人是腾讯首席迷信家、腾讯X实验室主任、视觉计算机范围专家张正友，他向腾讯集团初级执行副总裁、技术工程事业群总裁卢山汇报；而元宝、腾讯云等隶属于CSIG事业群，由腾讯集团初级执行副总裁、云与智慧产业事业群总裁汤道生指点。

这两大事业群主导腾讯AI业务研发和落地。

2025年2月，混元深度思索推理模型T1预览版上线腾讯元宝；3月，混元 Turbos通用模型公布；4月，新一代旗舰混元多模态模型公布；5月，多模态慢思索深度推理模型混元T1-Vision公布，端到端语音通话模型也在5月底公布，并将上线腾讯元宝。

目前，混元 TurboS 在声威评测平台Chatbot Arena中已跻身全球前八，低于OpenAI O3、Gemini、DeepSeek-R1等模型，在代码与数学等文科才干上跻身全球前十。最新一轮更新中，TurboS 无文科推理、代码才干和竞赛数学三项目的上区分优化了超10%、24%与39%。

笔者了解到，混元团队正在规划多模态和全模态模型。

“多模态认知系统应该怎样去构建？一个中心观念，应该以言语模型为中心。言语的边界或许也是全球的边界，这个意思就是说言语跟认知或许是等价的，所以这个是从义务角度来说是这样的。因此，我们就基于它去做了视觉模型、语音模型，同时我们也在规划全模态模型，它都是以言语模型为中心，再启动知识推理链，这样的话我们能够运行好言语模型弱小才干，同时它也是一个混合弹性的结构。”混元团队称。

下一步，面向通用AI，腾讯混元尝试用深度、广度两个方面推进，最后目的是心愿发明一个相似于贾维斯这样的一个机器人，它能够自主去在比拟复杂的全球外面探求。

谈到具身智能，5月24日首届国际通用人工智能大会上，张正友表示，目前机器人本体才干、机械才干和身体部分才干距离人类还差很远，具身智能的机器人大脑和身体是不协调的，所以真正的具身智能，是要能够身体和智能融合，并且能够自主学习处置疑问，环境变化不确定下能够智能调整和规划系统。因此，复杂的感知才干、执行才干、学习才干、规划模型的集中智能等才干都需不时优化。

张正友强调，要探求一个最佳机器人本体外形，人形机器人当然是其中一个，但双足、人形机器人不用定是最佳的外形。

“具身智能如今正在往上展开，但到肯定水平以后，不用定是寒冬，至少资本上方会有一个缩减的环节，最后会继续往前展开。所以从我们角度来讲，我们要继续优化具身智能的才干，寒冬事前能够有更好的展开。”张正友称。

7年投入超3900亿，腾讯要与阿里、字节激战AI

“这些‘大模型六虎’正在以三倍速，走当年我们‘AI四小龙’（依图、旷视、云从、商汤）2017-2019年的老路。”依图科技结合开创人林晨曦曾对笔者表示，假定 AI 创业公司想在国际 C 端产品中取得商业化，才干和最终结果远不及字节等互联网大厂，后者有大批的投入、人力资源、流量与用户规模，这是创业公司无法做到的。

如今，腾讯选择向 AI 技术范围加大研发投入。

2024年，腾讯研发投入达706.86亿元，过去7年累计投入达3912亿元；年度资本开支更打破767亿元，同比增长221%，创历史新高。其中，AI项目展开所触及的资本开支就达390亿元。

刘炽平表示，腾讯方案2025年进一步加大资本开支，估量会占2025年总支出的“低两位数百分比”。这意味着，2025年腾讯的资本开支或许靠近1000亿元的水平。

除了腾讯，阿里、字节都在加大AI研发投入力度。阿里巴巴集团CEO吴泳铭曾经宣布，未来三年，阿里将投入逾越3800亿元，用于树立云和AI配件基础设备，总额逾越去十年总和。这也创下中国民营企业在云和AI配件基础设备树立范围有史以来最大规模投资纪录。

落地层面，腾讯关键在B端、C端两部分落地。

其中，C端方面，腾讯元宝接入“满血版”DeepSeek- R1模型，并能读懂图片后，往年2月、3月曾屡次登上苹果AppStore中国区不要钱榜前列，3月3日晚成为下载排行榜第一名。

B端层面，截至目前，腾讯外部逾越700个业务场景取得混元大模型底座支持，大约每个月接入超百个场景，已有来自批发、教育、金融、医疗、传媒、交通、政务等多个行业的客户经过腾讯云调用腾讯混元大模型API。

腾讯总裁刘炽平在此前财报会上表示，“微信搜寻的查询量和支出继续加快增长。我们整合了腾讯混元和DeepSeek大型言语模型才干，优化了微信搜寻结果的相关性和质量。目前，腾讯自有模型支持的搜寻结果已掩盖逾越90%的问答式搜寻。”

最新财报显示，2025财年第一财季，腾讯成功总支出1800亿元，同比增长13%。其中，To B业务（金融科技及企业服务）成功营收549亿元。

展望未来，AI 是一个资本型、学术交叉型复杂技术，要求超强的算力、优良的人才、拙劣的技术研发实力等，因此，新的 AI 大模型的“下半场”肯定是巨头之间的竞赛，而作为BAT三大中国互联网头部公司之一，腾讯混元将与阿里通义、字节豆包激战AI智能体和商业化落地，尤其在“AI+云”平台层面。

清华大学计算机系副教授刘知远表示，“AGI新技术还在减速演进，未来展开途径尚不明白。我们仍处于追逐阶段，曾经不是可望无法即，但也只能说是望其项背。在他人曾经探求出来的路上跟随快跑是相对容易的，接上去我们要面对一团未来迷雾。”

汤道生最近表示，AI行业还处于早期阶段。大家都在跑马圈地，尝试着不同的商业方式。有的在追Scaling Law，有的在打造To C市场新入口，有的在做产业落地，十分繁华。

“AI正在跨过产业化落地的门槛，站在普及运转的全新节点上。行业由之前的模型训练主导，展开到今天更多是运转与Agent驱动；我们看到，云上DeepSeek API调用量激增，语音交互的需求也带动了ASR（智能语音识别）与TTS（文本转语音）模型的API调用；模型推理的算力消耗正在高速增长，规模化推理的本钱优化，成为云厂商的中心竞争力。”汤道生说。

汤道生5月21日强调，模型深度思索的打破，推进生成式AI的可用性从“质变”展开到“质变”，腾讯继续加大AI投入力度，各项业务片面拥抱AI。同时也以大模型、智能体、知识库和基础设备“四个减速”，打造“好用的AI”。

（本文首发于媒体App，作者｜林志佳）

一首诗有关雪夜的

家乡，雪夜，晚安好友瘦子繁华婚宴的前奏完毕时，下雪了散散落落的雪星儿掉在鼻尖儿上，化成细细的水珠儿我走出来，到大街上，伸手感受着夜的清冷家乡的滋味还是老样子，可以深呼吸的那种回家的路上，一路霓虹从前的脚步似乎太匆忙，居然从未发现家乡的雪夜如此之美南国小城的大树早已没了叶子雪花透过户户人家的灯光在树枝间摇曳落下时一幅朴素的黑色水墨画浑然天成小城自有小城的神韵，繁复中透着委婉内敛回到家中,拍去雪星和夜色抬眼看去瘦子家灯火透明新郎在为明天的娶亲做预备吧这时他的心里一定是颜色绚丽的上网遇到丢了很久的家乡好友一同在虚拟的空间里煮咖啡竟也可以闻失掉咖啡的香气温文尔雅的咖啡色，是我想象中英伦的颜色顾自说着家乡的美丽雪景，却忘了照顾好友的感受终年在外，谁不想家呢我，又何尝不是这样捧着相机去拍照，却发现雪已停了不知多久这个暖冬的时节，雪景也变成瞬间的美丽不愿好友绝望，细心找了张从前的旧照片来抚慰在这样一个时节，这样一个时刻就用好意的流言带来一丝暖和吧好梦，我的好友；晚安，我的家乡。

急求一首英文诗歌！！！

Let me just be your friendIf I could catch a rainbow,I would do it just for youAnd share with its beauty,on the days youre feeling blueIf I could build a mountain,you could call your very ownA place to find serenity, a place to be alongIf I could take your troubles,I would toss them into the seaBut all these things Im finding are impossible for meI cannot build a mountain,or catch a rainbow fairBut let me be what I know best,a friend thats always there

弗罗斯特(Robert Frost)(1874～1963)美国诗人写的。 Stopping by Woods on a Snowy Evening (1923) Whose woods these are I think I know. His house is in the village though; He will not see me stopping here To watch his woods fill up with snow. My little horse must think it queer To stop without a farhouse near Between the woods and frozen lake The darkest evening of the year. He gives his harness bells a shake To ask if there is some mistake. The only other sound’s the sweep Of easy wind and downy flake. The woods are lovely, dark, and deep, But I have promises to keep, And miles to go before I sleep, And miles to go before I sleep. 雪夜林畔小驻 (译)余光中想来我看法这座森林，林主的庄宅就在邻村, 却不会晤我在此驻马，看他林中积雪的美景。我的小马一定颇惊讶：四望不见有什么农家，偏是一年最暗的黄昏，寒林和冰湖之间停下。它摇一摇身上的串铃，问我这中央该不该停。此外只要轻风拂雪片，再也听不见其他声响。森林又暗又深真可羡，但我还要守一些诺言，还要赶多少路才安息，还要赶多少路才安息。