本站出售,有兴趣带价格联系QQ:503594296

性能抢先行业基准 重磅!陈天桥创立的AI公司MiroMind打造出全球顶尖预测型大模型 (性能抢先行业有哪些)

发布仅一个多月,全球创新企业家、慈善家陈天桥打造的MiroMind成为全球顶尖预测大模型。

9月21日信息,在全球首个灵敏实时LLM智能体未来预测基准FutureX当中,陈天桥旗下团队打造的大模型MiroMind延续第二周蝉联冠军,搭载GPT-5的MiroFlow智能体框架在9月第1周和第 2 周延续夺得榜首,同时搭载自研模型MiroThinker的MiroFlow均位列前五,力压众多国际顶尖机构和闭源商业模型。

与专注文本输入的生成式模型不同,MiroMind采纳记忆驱动机制,专为预测与决策设计,打造全球最好的预测大模型。

Future X是字节跳动 SEED 团队结合斯坦福大学、复旦大学、普林斯顿大学共同推出的全球首个灵敏实时LLM(大言语模型)智能体未来预测基准。该基准从全球200多个高质量网站精选只需下周才会有明白结果的疑问,让AI直面未来的事情和展开趋向,如科技公司的战略走向等。

马斯克曾表示:预测未来的才干是权衡智能的最佳规范。让AI具有像人类一样在不确定环境下的决策才干,这正是通向AGI的关键一步。

因此,MiroMind登上Future X基准测试冠军的意义特殊。据了解,在测试中,MiroMind成功预测了2025年9月 9 日ATP男性单打排名第4-6位的选手,其难点在于网球排名系统极为复杂,触及积分计算、竞赛结果、时期窗口等多个变量。

对此,陈天桥表示:“我们正在全力终年投入正在终年投入,打造一个全球最好的预测大模型,让AI记住过去,洞察未来。我们继续欢迎全球情投意合的AI优秀人才介入,共同发明未来。”

地下信息显示,MiroMind是由创新企业家、慈善家、天桥脑迷信研讨院开创人陈天桥,以及国际 AI 范围迷信家、清华大学电子工程系副教授代季峰,联手预备的一家努力于打造通用(AGI)新公司,目的是打造下一个OpenAI,将围绕AGI展开基础性研讨,首个项目就是MiroMind Open Deep Research。

代季峰曾在2009年和2014年于清华大学系区分取得工学学士和博士学位;2014年-2019年在微软亚洲研讨院视觉组任务,担任首席研讨员、研讨经理;2019年至2022年在商汤科技研讨院任务,担任行动研讨总监。2022年7月起,代季峰全职介入清华大学,担任清华大学电子工程系副教授、博士生导师、硕士生导师。他的研讨方向包括视觉信息了解基础模型与中心等。

有报道称,陈天桥对代季峰领衔的这家新 AI 创业公司寄予厚望,还承诺,浩荡外部孵化的一切AI企业的一半利润将分给团队。

往年8月初,MiroMind团队迎来“”,发布了一个高性能、完全开源、开通协作的深度研讨项目MiroMind Open Deep Research(Miro ODR),其V0.1版本的GAIA测试达82.4分,性能跨越OpenAI的DeepResearch、Manus等一众开源和闭源AI深度研讨模型,成为开源最强Deep Research模型之一。

“经过一个季度的努力,MiroMind正式亮相并发布我们重磅开源项目。Miro ODR完全开源且可复现,中心模型、数据、训练流程、AI Infra、DR Agent框架统统开源,复现无压力。”代季峰走漏,团队将以每月一次性性开源升级的速度,同社区一同创作最强深度研讨模型。

详细来说,依据MiroMind技术报告,与现有的深度研讨方法相比,MiroMind ODR项目开通了深度研讨的各个阶段,关键包括MiroFlow、MiroThinker、MiroVerse和MiroTrain四个子项目,而且可以在手机端上运转。

其中,MiroFlow框架在GAIA-Validation上取得82.4%的优秀效果,并在多个基准测试中抢先众多国际对手,更值得关注的是,MiroFlow提供了完全开源、可复现的框架和性能,努力于树立一个创新者平台;同时,MiroMind团队推出的自研旗舰基础智能体模型MiroThinker,不只具有弱小的推理、决策和多模态了解才干,还能在多Agent协作中发扬中心作用,在各类榜单中已成为开源模型的引领者,并一直参与与闭源商业模型的差距。

据悉,MiroThinker 很快将以完全开源的方式向全球开发者和研讨者开通,提供可复现的模型和实验环境。

现在,MiroMind登顶全球评测基准FutureX榜单。

MiroMind 的登顶并非偶然,而是基于其在 AI 预测未来方面的信息洞察力、逻辑推理与趋向感知、概率与不确定性控制、跨范围整合才干等外围才干,且其在详细预测场景中展现出了系统性的战略与实力。

在预测男性网球排名时,模型采取六步战略,先制定详细预测方案,再经过网络检索失掉9月1日的男性网球TOP 10排名数据以树立预测基准线,随后深化研讨竞赛排名与积分对应相关并对比2024年与2025年的dropping规则以确保计算分歧性,接着搜寻9月1日之后的竞赛效果并分类处置(对已有结果的竞赛升级排名,对未完毕的竞赛识别影响),最后经过多情形剖析(针对未出结果的竞赛剖析 6 种或许状况)、引入概率数据作为外部验证基准得出最或许排名结果;在预测2025年9月11日数字加密货币Solana将打破的关键多少钱档位时,模型相同制定了六步战略,经过交叉验证确定最优预测选项,这表现了其在处置多少钱坚定类疑问上的系统建模才干与风险控制水平。

代季峰曾走漏Miro ODR项目的终极目的:在MiroMind,“我们不提供AI,但我们与您共同构建AI。”

此外,陈天桥日前稀有地地下发声,呼吁中国科资人:“不要把只当作赚钱的风口。”

此前在媒体文章《脑机反派:马斯克向左,陈天桥向右》中,陈天桥曾表示,迷信家们运行AI、深层数据、机器学习算法等技术手段,在不伤害患者大脑的状况下,可以抵达与侵入式一样的效果和反响,甚至要跨越后者。

“我们不只是投资者,更是这场科技反派的介入者和推进者。”在陈天桥看来,硬科技创新无法用互联网行业的短周期、快报答方式来权衡。“假定依然用互联网投资那套做法,要求对赌、要求马上拿证、要求立刻出现支出、要求马上上市,这种投资关于真正的科创企业会是一个双输的结果。”

从浩荡,到天桥脑迷信研讨院,再到All in AI,陈天桥四分之一个世纪以来继续探求人类未来科技的边界。目,MiroMind正在探求将终年记忆模块深度嵌入模型,在复杂、多变的环境中做出更精准牢靠的预测,成功预测,成功预测,成功预测,成功预测,成功真正的时期维度智能。

陈天桥以为,科创范围亟需“有久远目光的耐烦资本”,为企业提供终年、稳如泰山的支持,协助其从基础研讨到产业化落地,穿越技术验证和市场培育的漫长周期。

“我们情愿做有耐烦的资本。”陈天桥表示。

版权声明

本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。

热门