刚刚！智谱开源3550亿参数GLM (智谱ai)

admin1 8小时前阅读数 1 #财经

文章标签 4.5模型 K2成全球第三刚刚！智谱开源3550亿参数GLM 多项性能或跨越Kimi

国际大模型赛道太“卷”了。

Kimi K2、MiniMax M2、阶跃星河Step-3模型公布不到一个月，这次智谱又要公布最强新模型了。

7月28日信息， 刚刚，智谱在全球公布新一代旗舰模型GLM-4.5系列，这是专为 AI Agent自动体运转打造的基础模型，采纳混合专家（MoE）架构，在推理、代码、自动体综合才干抵达开源模型SOTA水平。综合 平均分 ，GLM-4.5 取得了 全球模型 第三 、国产 模型第一 ，开源 模型 第一，多项评分跨越DeepSeek-R1-0528（55.9）和Kimi K2（53.1）等多款模型。

此次GLM-4.5系列包括两款产品：总参数量3550亿、激活参数320亿的GLM-4.5，以及1060亿参数的GLM-4.5-Air。目前，GLM-4.5和 GLM-4.5-Air曾经片面在Hugging Face与ModelScope魔搭平台同步开源，API已上线智谱开通平台，满血版GLM-4.5曾经可以在智谱清言、z.ai官方不要钱体验。

智谱CEO张鹏早前对笔者表示，智谱依然坚持在做行业Agent产品和处置计划，以及向企业提供MaaS服务。同时，AGI需模型才干的片面性，人类处置复杂义务时，会面对多模态与复杂交互状况，似乎木桶不能有短板，对才干需求是片面性的。

“无法否认的是，当下AGI之路还刚刚末尾，（以后）模型的才干还无法抵达完全类比人的这样一个水平。”张鹏曾坦言。

智谱GLM-4.5评测数据信息

据悉，智谱成立于2019年，以“让机器像人一样思索”为愿景，研发了具有国产独立知识产权的GLM大模型预训练架构。自2023年3月智谱 AI 推出千亿开源基座对话模型ChatGLM系列以来， GLM大模型经验四个大版本迭代，共公布了逾越20款 AI 模型技术和产品。

商业化方面， 截至2023年底，智谱已拥有超2000家生态协作同伴、超1000个大模型规模化运转，另有200多家企业跟智谱AI启动了深度共创，智谱GLM系列大模型已在金融、医疗、教育等多个行业失掉普遍运转；C端层面，截至2024年底，智谱清言拥有逾越2500万用户，末尾上线付费性能，ARR（年度经常性支出）支出超千万元。

融资方面，往年7月，在冲击IPO上市关口，智谱宣布取得上海国资10亿元战略融资；在此之前，智谱取得杭州城投产业基金、上城资本、珠海华发集团、四川成都高新区等机构的融资。据统计，截至目前， 智谱累计融资超百亿元，投后估值逾越200亿元，投资方包括高瓴、启明、君联资本等知名投资机构，以及美团、阿里、腾讯、小米在内的互联网公司。

智谱曾表示， 2025年将是智谱的开源年，其将很快公布包括基座模型、推理模型、多模态模型、Agent等在内的全新大模型，并将其开源。

现在，智谱终于成功开源最强模型这一目的，这得益于GLM模型的更高参数效率和强化训练流程等多种技术才干。

首先， 据引见，而GLM-4.5和GLM-4.5-Air经常经常使用了相似的训练流程，首先在 15 万亿token的通用数据上启动了预训练，尔后在代码、推理、自动体等范围的8万亿token数据上启动针对性训练，最后经过强化学习进一步增强模型推理、代码与自动体才干。

其次， GLM-4.5参数量仅为DeepSeek-R1的50%、Kimi-K2的三分之一，但在多项规范基准测试中表现得更为出色。而且，API多少钱仅为Claude的1/10，低至输入每百万tokens达0.8元，输入每百万tokens达2元。同时，高速版本实测生成速度逾越 100 tokens/秒，支持低延迟、高并发的通常部署需求，统筹本钱效益与交互体验。

最后， 评测层面，GLM-4.5分为基准和真实场景表现。其中，在包括 MMLU Pro等12个评测基准中GLM-4.5取得了优秀效果，全球模型第一是OpenAI o3（65.0）、第二是xAI Grok 4（63.6）、第三是GLM-4.5（63.2），跨越了Kimi K2（53.1）、DeepSeek R1（55.9）；真实评测方面，采纳52个编程开发义务当中，GLM-4.5相对其他开源模型展现出竞争优点，尽管略逊于Claude-4-Sonnet，但在工具调用牢靠性和义务成功度方面表现突出，大部分场景中可成功平替效果，编写较为复杂的运转、、交互网页等。

目前，GLM-4.5曾经对外开源。智谱称，公司后续会公布愈加详细的技术报告。

理想上，除了智谱GLM-4.5之外，今晚阿里又公布了新的开源模型——电影级视频生成模型通义万相Wan2.2，可将光影、颜色、镜头言语三大电影美学元素装进模型，随便组合60多个直观可控的参数，大幅优化电影级画面的制造效率；而上周，阿里AI三连发——Qwen 3最新版基础模型（非思索版）、Qwen 3推理模型和AI编程模型Qwen3-Coder，它们区分在基础模型、推理模型和编程模型等支流范围取得全球开源冠军；阶跃星河则在WAIC时期公布Step 3模型，是公司首个全尺寸、原生多模态推理模型，统筹模型效果与推理本钱，采纳 MoE 架构，总参数量3210亿，激活参数量380亿。

据悉，OpenAI也行将开释最强闭源模型GPT-5，估量最快在7月底公布，有望支持Sora 2全球模型，从而成功多模了解一体化。

一位AI行业人士7月28日向笔者表示，随着中国大模型越来越开源，硅谷模型转向闭源，而国际模型的开源关于AI行业有更多的优势。这也意味着，全球基础大模型行业有望迎来新的“洗牌”。

（本文于媒体App，作者｜林志佳，编辑｜盖虹达）

智谱AI推出新一代基座模型 GLM-4

在人工智能范围掀开了新的一章，智谱AI于2024年1月16日技艳亮相，携新一代基座模型GLM-4震撼退场。这款反派性的模型以出色性能优化60%，迫近业界标杆GPT-4的高度，展现出弱小的智能实力。在MMLU等威望数据集上，GLM-4的表现令人注目，无论是长文本了解、精准的指令执行，还是复杂的对齐义务和文生图创作，皆能随心所欲。

GLM-4的All Tools性能犹如一把多面宝剑，能够智能剖析指令并调动AI绘画、代码计算、文件处置等多元工具，清楚优化了网页阅读的精准度，逾越了GPT-4的界限。</ 为了让更多研讨者和开发者共享智能的果实，智谱AI提供了GLMs & MaaS API，让模型下载和API服务变得触手可及，MaaS平台更是开放了GLM-4等先进模型供全球探求。

作为开源理念的坚决通常者，智谱AI经过CCF-智谱大模型基金和SMP-智谱大模型交叉学科基金，为大模型研讨提供弱小支持。 2023年，这两个基金已资助了41个项目，累计投入超越1000万元，旨在降低科研门槛，激起创新火花。 2024年，智谱的资助力度继续扩展，包括1000张GPU减速卡、1000万元现金以及价值1000亿的tokens，全力推进大模型生态的兴盛开展。

Z方案更是倾力于大模型创业的孵化，总金额达10亿元人民币，聚焦原始创新，已投资诸如面壁智能和基流科技等出色企业，见证了这些创新力气的生长。智谱AI坚信，开放与协作是推进人工智能提高的基石，我们等候与全球同伴共同塑造AI的未来。</

智谱AI是什么公司——智谱AI（智谱清言）官方

智谱AI，被誉为中国“最具OpenAI气质”的企业，于2023年7月取得美团投资，估值40亿，美团持有10.42%股份。 8月31日，智谱AI推出首个生成式AI助手「智谱清言」，依托自主研发的中英双语对话模型ChatGLM2，经过万亿字符的文本与代码预训练，采用有监视微调技术，以通用对话方式提供智能服务。智谱AI努力于打造中国最佳大模型，主导了ChatGLM和ChatGLM2系列模型的研发，掩盖从6B到130B的全部规模区间，同时推进国际大模型开源生态树立。自2023年3月14日发布ChatGLM-6B，至6月25日发布ChatGLM2-6B，这两个模型在Huggingface的下载量区分超越300万和140万（截至7月底），衍生出数百个开源项目。智谱AI的代码大模型CodeGeeX，参数量达130亿，支持20多种编程言语，具有代码生成、续写、翻译等性能。智谱AI作为一家AI知识智能技术开发商，构建了高质量大规模知识图谱，研发了深度隐含关联开掘算法和认知图谱等中心技术，服务政府、企业、科研机构。悟道2.0的开发，结合高质量大规模知识图谱，构成了融合数据与知识的双轮驱动的人工智能框架，引领了第三代人工智能浪潮。智谱AI团队由张鹏、刘德兵、王绍兰、米磊等成员构成，张鹏为北京智谱华章科技有限公司CEO，指导团队不时研讨成功数据与知识双轮驱动的下一代人工智能技术。刘德兵为智谱华章董事长兼经理，王绍兰为智谱AI总裁，米磊是“硬科技”理念的提出者，中科创星开创合伙人、联席CEO，提出了“科技创业是中国未来三十年经济开展主旋律，而硬科技是中国经济开展关键支撑”的观念。

本地部署清华开源大言语模型ChatGLM3详细步骤

ChatGLM3是由智谱AI与清华大学KEG实验室共同发布的对话预训练模型，它的6B版本在对话流利性和部署门槛上承袭了前两代的优势。在2023年10月27日的中国计算机大会上，智谱AI推出了全自研的第三代基座大模型ChatGLM3及其系列，这标志着继千亿基座对话模型ChatGLM和ChatGLM2之后的又一次性严重打破。此次发布的ChatGLM3采用首创的多阶段增强预训练技术，使其训练更为充沛。在44个中英文地下数据集的评测中，ChatGLM3在国际同尺寸模型中表现出色，占据首位，其性能较前一代大幅优化，是10B以下最强基础大模型！关键的是，ChatGLM3在才干增强的同时，依然坚持开源和不要钱商用的特性。为了失掉ChatGLM3模型，你可以访问以下地址下载/THUDM/ChatGLM... 在末尾本地部署前，请确保已创立并性能好Python虚拟环境，且装置了pytorch等必要库。介绍经常使用transformers库版本4.30.2和torch版本2.0或以上，以取得最佳推理性能。接上去，启动本地加载模型的步骤：1、下载本仓库中的模型文件。 2、装置相关依赖，特别介绍经常使用transformers库版本4.30.2和torch版本2.0或以上。 3、将下载的全模型文件存入名为THUDM的文件夹中，并修正模型途径。部署环节包括以下几种启动模型的方式：1、运转python web_文件，可以选择对话形式、工具形式或代码解释器形式启动交互。 2、经过Streamlit方式加载模型，运转streamlit run web_来启动代码解释器形式。 3、经过命令行方式运转python cli_文件启动交互式对话，输入clear可清空对话历史，输入stop终止程序。 4、最后，你可以经过以下代码调用ChatGLM模型生成对话：