无聊 GPT5史诗级大更新 (无聊发朋友圈的说说)

admin1 6小时前阅读数 3 #财经

摘要：

对商业乃至更大用户集体的图谋，让OpenAI的考质变得复杂。

昨夜有多少人熬夜了？

等了一年多，北京时期8月8日清晨1点多，在全球注目中，OpenAI终于正式公布新一代大言语模型 GPT-5，并破天荒地向一切用户不要钱开通基础版。

OpenAI CEO 山姆·奥特曼在公布会上表示：“假定说 GPT-4 还只是大在校生，GPT-5 就是一位真正的专家。” 他将这次更新比作 “让我再也回不去”的技术飞跃 ，就像第一款装备视网膜屏的 iPhone 带来的体验一样。

与以往不同，GPT-5是一个分歧系统，不再分为惯例模型和独自的推理模型，而是由三个中心部分造成：一个智能高效的基础模型，能够回答大少数疑问；一个用于处置更复杂疑问的深度推理模型（GPT‑5 Thinking）；以及一个实时（智能分流系统），可依据对话类型、复杂度、工具需求以及用户的明白指示（例如提示中写道“请深化思索这个疑问”)加快判别应经常经常使用哪个模型。

OpenAI称， 这是迄今为止最弱小的 AI 系统，在编程、数学、写作、医疗、视觉感知等多个范围都成功了严重飞跃。

只是公布会刚刚完毕，全网似乎骂声不少，众望所归的“GPT5时代”，就这？

硅谷又有人要失业了？

照旧是熟习的“屠榜”。

在最新的数学推理测试 AIME 2025 中，GPT-5 无工具方式得分高达 94.6%，靠近人类顶尖水平；在 SWE-Bench 编程验证测试中得分74.9%，大幅跨越上一代模型；在多模态了解的 MMMU 基准中更是抵达 84.2%，证明它不只能读懂文字，还能深化了解图片、图表、视频等多模态内容。

图｜GPT-5编程得分

新版本引入“实时路由器”技术，能依据义务复杂度智能选择推理方式，既保证深度，又增加糜费。方便说，GPT-5学会了“先想清楚，再入手干”，效率与精度双赢。

奥特曼在公布会上也表示：“GPT-5真的让我第一次性性觉得，我们的主力模型曾经抵达了可以让你向一位真正的专家、一位博士级专家提出任何疑问。”并且他还称“它最酷的才干之一，就是能即时为你写出高质量软件。按需软件这个概念，将会成为GPT-5时代的标忘性特征之一。”

它的编程才干官方可谓史上最强。 奥特曼表示，GPT-5是“全球最强的编程与写作模型”。

在OpenAI的测试中，该模型在基准测试SWE-Bench、SWE-Lancer和 Aider Polyglot中的编程表现优于一切其他模型。在真实全球编程测试中，GPT-5在SWE-bench Verified中的得分为74.9%，在Aider Polyglot中的得分为88%。

在公布会上，OpenAI担任后训练任务的担任人扬·杜布瓦（Yann Dubois）现场演示了如何用GPT-5生成一个带有互动的法语学习网站。

短短几秒内，GPT-5就写出了数百行代码，并生成了该网站的前端界面。杜布瓦方便点击阅读了网站的各特性能，发现一切似乎都按预期失常运转。

在野着“微信”退步了

OpenAI此次为GPT-5参与了4种交互人格——愤世嫉俗者、、聆听者、书呆子。这意味着，用户不只能失掉精准答案，还能体验不同的沟通品格。据测试，这一改良让“阿谀式回答”增加了 60% 以上，让对话更真实、更有棱角。

这次GPT或许要朝着“微信”的方向退步了。

它如今支持用户自主定制聊天窗口的颜色品格，还具有了终年对话记忆的集成才干。更凶猛的是，新性能还能直接与谷歌邮箱、日历无缝对接。

如此一来，ChatGPT就能全方位融入生活与任务，为用户精准规划日程，贴心提示关键纪念日。

在医疗瘦弱范围，GPT-5也有清楚提高。

HealthBench 测试得分 46.2%，可解析复杂医疗报告并提供适用倡议，为远程医疗、瘦弱咨询带来新或许。

微软、Cursor等平台已在第一时期接入GPT-5，编程辅佐工具市场或将迎来新一轮洗牌。网友预测，GPT-5的普及会让更多人轻松写出高质量代码，甚至或许让部分初级程序员失业。与此同时，教育、科研、设计等行业的AI浸透速度也会放慢。

急着赚钱的OpenAI，走向伟大

OpenAI的此次更新之所以招致如此大的吐槽，实质上还在于一个以“推翻式创新”引领市场的佼佼者，直接走上“伟大”之路。

此次模型更新模棱两可的是优化微小，值得褒奖，无论是幻觉率的大幅降低，还是人人都不要钱的态度，都可以看出OpenAI此举意在让更多人用上好用的大模型。

面前也是OpenAI的野心，依据其8月5日的最新官方公告，ChatGPT的周生动用户将抵达7亿，每天处置的用户信息量已打破30亿条。从生动用户数来看，仅过去两个月，就增长了2亿。作为对比，谷歌AI搜寻摘要（AI Overviews）月活约20亿，Gemini聊天机器人月活超4.5亿。截至Q1，微信兼并WeChat全球月活则是14.02亿。

OpenAI的商业化也在提速，其付费用户数从2025年6月的300万增至目前的500万，年化支出（ARR）从6月的100亿美元增至 130亿美元，估量年底打破200亿美元。

对商业乃至更大用户集体的图谋，让OpenAI的考质变得复杂。

往年5月，山姆·奥特曼还任命了一位新CEO——菲吉·西莫（Fidji Simo），作为“运转CEO”（CEO of Applications），她担任指点OpenAI的产品、业务和其他职能，向奥特曼汇报。这位女将曾在Facebook任职十余年，来OpenAI显然是为下一阶段ChatGPT的增长和商业化担任。尽管彼时奥特曼曾称，他将更专注于研讨、计算和安保系统。但从GPT5交出的作业来说，奥特曼的表现很难打出高分。

颇为有意思的是，曾几何时，赚钱和商业化，从1到100的大规模落地运转曾是中国公司的主战场，中国有全球兴隆的互联网，有兴盛的用户生态。

但今天，越来越多中国公司在AI上，暂时丢弃了商业化。转而去追求模型才干的优化，当然，以后仍未有太多业绩效果交付。

往年7月时，360公司董事长周鸿祎在2025中国互联网大会上曾表示，DeepSeek开创人梁文锋一门心思做AGI，基本没有想做一个App。

周鸿祎还称，梁文锋是一个有梦想的人，不屑于做App，不在乎日活、融资和不要钱的疑问。一个最了不起的中央是：DeepSeek是全球第一个把大模型不要钱、开源的，这对中国大模型产业的展开做出了很大的奉献。

谭铁牛解读gpt-5发布延迟

谭铁牛以为GPT - 5发布延迟，说明堆算力、堆数据的蛮力AI开展形式无法继续，详细体如今三个方面：

基于以上剖析，谭铁牛提出AI开展途径应从“蛮力”向“灵巧”转移，即开展高效、轻量级的人工智能，可经过算法创新、通常创新、工程创新等成功。同时，他强调推进人工智能开展不能局限于大模型，研讨应回归根源。

谷歌Gemini 1.5深夜爆炸上线，史诗级多模态硬刚GPT-5！最强MoE首破100万极限上下文纪录

谷歌在深夜发布最新多模态大模型Gemini 1.5系列，最高支持10,000K token超长上下文，开创性地将上下文窗口优化至百万级，超越GPT-4 Turbo的20万token，创下了最长上下文窗口的纪录。这款大模型在处置百万级token的文本、音频和视频时，均能成功高精度检索。 Gemini 1.5 Pro作为谷歌最强的MoE大模型，具有1,000,000 token超超长上下文，片面碾压GPT-4 Turbo。其视野被“史诗级”拓宽，处置才干清楚增强，能够深化了解复杂信息，洞察文档细节，剖析少量代码，了解视频内容，以及翻译稀有言语如Kalamang语。 Gemini 1.5的设计基于谷歌在Transformer和混合专家（MoE）架构的前沿研讨，经过Sparsely-Gated MoE、GShard-Transformer、Switch-Transformer、M4等研讨，大幅优化模型效率，成功加快掌握复杂义务、坚持高质量输入，在训练和部署上更高效。相较于Gemini 1.0 Pro，1.5 Pro在多项性能测试中表现出色，具有更高的上下文学习才干，能够仅凭长提示掌握新技艺，无需进一步伐整，展现出弱小的言语处置才干。