本站出售,有兴趣带价格联系QQ:503594296

刚刚!智谱开源3550亿参数GLM (智谱ai)

国际大模型赛道太“卷”了。

Kimi K2、MiniMax M2、阶跃星河Step-3模型公布不到一个月,这次智谱又要公布最强新模型了。

7月28日信息, 刚刚,智谱在全球公布新一代旗舰模型GLM-4.5系列,这是专为 AI Agent自动体运转打造的基础模型,采纳混合专家(MoE)架构,在推理、代码、自动体综合才干抵达开源模型SOTA水平。 综合 平均分 ,GLM-4.5 取得了 全球模型 、国产 模型 ,开源 模型 第一,多项评分跨越DeepSeek-R1-0528(55.9)和Kimi K2(53.1)等多款模型。

此次GLM-4.5系列包括两款产品:总参数量3550亿、激活参数320亿的GLM-4.5,以及1060亿参数的GLM-4.5-Air。目前,GLM-4.5和 GLM-4.5-Air曾经片面在Hugging Face与ModelScope魔搭平台同步开源,API已上线智谱开通平台,满血版GLM-4.5曾经可以在智谱清言、z.ai官方不要钱体验。

智谱CEO张鹏早前对笔者表示, 智谱依然坚持在做行业Agent产品和处置计划,以及向企业提供MaaS服务。同时,AGI需模型才干的片面性,人类处置复杂义务时,会面对多模态与复杂交互状况,似乎木桶不能有短板,对才干需求是片面性的。

“无法否认的是,当下AGI之路还刚刚末尾,(以后)模型的才干还无法抵达完全类比人的这样一个水平。”张鹏曾坦言。

智谱GLM-4.5评测数据信息

据悉,智谱成立于2019年,以“让机器像人一样思索”为愿景,研发了具有国产独立知识产权的GLM大模型预训练架构。自2023年3月智谱 AI 推出千亿开源基座对话模型ChatGLM系列以来, GLM大模型经验四个大版本迭代,共公布了逾越20款 AI 模型技术和产品。

商业化方面, 截至2023年底,智谱已拥有超2000家生态协作同伴、超1000个大模型规模化运转,另有200多家企业跟智谱AI启动了深度共创,智谱GLM系列大模型已在金融、医疗、教育等多个行业失掉普遍运转;C端层面,截至2024年底,智谱清言拥有逾越2500万用户,末尾上线付费性能,ARR(年度经常性支出)支出超千万元。

融资方面,往年7月,在冲击IPO上市关口,智谱宣布取得上海国资10亿元战略融资;在此之前,智谱取得杭州城投产业基金、上城资本、珠海华发集团、四川成都高新区等机构的融资。据统计,截至目前, 智谱累计融资超百亿元,投后估值逾越200亿元,投资方包括高瓴、启明、君联资本等知名投资机构,以及美团、阿里、腾讯、小米在内的互联网公司。

智谱曾表示, 2025年将是智谱的开源年,其将很快公布包括基座模型、推理模型、多模态模型、Agent等在内的全新大模型,并将其开源。

现在,智谱终于成功开源最强模型这一目的,这得益于GLM模型的更高参数效率和强化训练流程等多种技术才干。

首先, 据引见,而GLM-4.5和GLM-4.5-Air经常经常使用了相似的训练流程,首先在 15 万亿token的通用数据上启动了预训练,尔后在代码、推理、自动体等范围的8万亿token数据上启动针对性训练,最后经过强化学习进一步增强模型推理、代码与自动体才干。

其次, GLM-4.5参数量仅为DeepSeek-R1的50%、Kimi-K2的三分之一,但在多项规范基准测试中表现得更为出色。而且,API多少钱仅为Claude的1/10,低至输入每百万tokens达0.8元,输入每百万tokens达2元。同时,高速版本实测生成速度逾越 100 tokens/秒,支持低延迟、高并发的通常部署需求,统筹本钱效益与交互体验。

最后, 评测层面,GLM-4.5分为基准和真实场景表现。其中,在包括 MMLU Pro等12个评测基准中GLM-4.5取得了优秀效果,全球模型第一是OpenAI o3(65.0)、第二是xAI Grok 4(63.6)、第三是GLM-4.5(63.2),跨越了Kimi K2(53.1)、DeepSeek R1(55.9);真实评测方面,采纳52个编程开发义务当中,GLM-4.5相对其他开源模型展现出竞争优点,尽管略逊于Claude-4-Sonnet,但在工具调用牢靠性和义务成功度方面表现突出,大部分场景中可成功平替效果,编写较为复杂的运转、、交互网页等。

目前,GLM-4.5曾经对外开源。智谱称,公司后续会公布愈加详细的技术报告。

理想上,除了智谱GLM-4.5之外,今晚阿里又公布了新的开源模型——电影级视频生成模型通义万相Wan2.2,可将光影、颜色、镜头言语三大电影美学元素装进模型,随便组合60多个直观可控的参数,大幅优化电影级画面的制造效率;而上周,阿里AI三连发——Qwen 3最新版基础模型(非思索版)、Qwen 3推理模型和AI编程模型Qwen3-Coder,它们区分在基础模型、推理模型和编程模型等支流范围取得全球开源冠军;阶跃星河则在WAIC时期公布Step 3模型,是公司首个全尺寸、原生多模态推理模型,统筹模型效果与推理本钱,采纳 MoE 架构,总参数量3210亿,激活参数量380亿。

据悉,OpenAI也行将开释最强闭源模型GPT-5,估量最快在7月底公布,有望支持Sora 2全球模型,从而成功多模了解一体化。

一位AI行业人士7月28日向笔者表示,随着中国大模型越来越开源,硅谷模型转向闭源,而国际模型的开源关于AI行业有更多的优势。这也意味着,全球基础大模型行业有望迎来新的“洗牌”。

(本文于媒体App,作者|林志佳,编辑|盖虹达)


智谱AI推出新一代基座模型 GLM-4

在人工智能范围掀开了新的一章,智谱AI于2024年1月16日技艳亮相,携新一代基座模型GLM-4震撼退场。 这款反派性的模型以出色性能优化60%,迫近业界标杆GPT-4的高度,展现出弱小的智能实力。 在MMLU等威望数据集上,GLM-4的表现令人注目,无论是长文本了解、精准的指令执行,还是复杂的对齐义务和文生图创作,皆能随心所欲。

GLM-4的All Tools性能犹如一把多面宝剑,能够智能剖析指令并调动AI绘画、代码计算、文件处置等多元工具,清楚优化了网页阅读的精准度,逾越了GPT-4的界限。</ 为了让更多研讨者和开发者共享智能的果实,智谱AI提供了GLMs & MaaS API,让模型下载和API服务变得触手可及,MaaS平台更是开放了GLM-4等先进模型供全球探求。

作为开源理念的坚决通常者,智谱AI经过CCF-智谱大模型基金和SMP-智谱大模型交叉学科基金,为大模型研讨提供弱小支持。 2023年,这两个基金已资助了41个项目,累计投入超越1000万元,旨在降低科研门槛,激起创新火花。 2024年,智谱的资助力度继续扩展,包括1000张GPU减速卡、1000万元现金以及价值1000亿的tokens,全力推进大模型生态的兴盛开展。

Z方案更是倾力于大模型创业的孵化,总金额达10亿元人民币,聚焦原始创新,已投资诸如面壁智能和基流科技等出色企业,见证了这些创新力气的生长。智谱AI坚信,开放与协作是推进人工智能提高的基石,我们等候与全球同伴共同塑造AI的未来。</

智谱AI是什么公司——智谱AI(智谱清言)官方

智谱AI,被誉为中国“最具OpenAI气质”的企业,于2023年7月取得美团投资,估值40亿,美团持有10.42%股份。 8月31日,智谱AI推出首个生成式AI助手「智谱清言」,依托自主研发的中英双语对话模型ChatGLM2,经过万亿字符的文本与代码预训练,采用有监视微调技术,以通用对话方式提供智能服务。 智谱AI努力于打造中国最佳大模型,主导了ChatGLM和ChatGLM2系列模型的研发,掩盖从6B到130B的全部规模区间,同时推进国际大模型开源生态树立。 自2023年3月14日发布ChatGLM-6B,至6月25日发布ChatGLM2-6B,这两个模型在Huggingface的下载量区分超越300万和140万(截至7月底),衍生出数百个开源项目。 智谱AI的代码大模型CodeGeeX,参数量达130亿,支持20多种编程言语,具有代码生成、续写、翻译等性能。 智谱AI作为一家AI知识智能技术开发商,构建了高质量大规模知识图谱,研发了深度隐含关联开掘算法和认知图谱等中心技术,服务政府、企业、科研机构。 悟道2.0的开发,结合高质量大规模知识图谱,构成了融合数据与知识的双轮驱动的人工智能框架,引领了第三代人工智能浪潮。 智谱AI团队由张鹏、刘德兵、王绍兰、米磊等成员构成,张鹏为北京智谱华章科技有限公司CEO,指导团队不时研讨成功数据与知识双轮驱动的下一代人工智能技术。 刘德兵为智谱华章董事长兼经理,王绍兰为智谱AI总裁,米磊是“硬科技”理念的提出者,中科创星开创合伙人、联席CEO,提出了“科技创业是中国未来三十年经济开展主旋律,而硬科技是中国经济开展关键支撑”的观念。

本地部署清华开源大言语模型ChatGLM3详细步骤

ChatGLM3是由智谱AI与清华大学KEG实验室共同发布的对话预训练模型,它的6B版本在对话流利性和部署门槛上承袭了前两代的优势。 在2023年10月27日的中国计算机大会上,智谱AI推出了全自研的第三代基座大模型ChatGLM3及其系列,这标志着继千亿基座对话模型ChatGLM和ChatGLM2之后的又一次性严重打破。 此次发布的ChatGLM3采用首创的多阶段增强预训练技术,使其训练更为充沛。 在44个中英文地下数据集的评测中,ChatGLM3在国际同尺寸模型中表现出色,占据首位,其性能较前一代大幅优化,是10B以下最强基础大模型!关键的是,ChatGLM3在才干增强的同时,依然坚持开源和不要钱商用的特性。 为了失掉ChatGLM3模型,你可以访问以下地址下载/THUDM/ChatGLM... 在末尾本地部署前,请确保已创立并性能好Python虚拟环境,且装置了pytorch等必要库。 介绍经常使用transformers库版本4.30.2和torch版本2.0或以上,以取得最佳推理性能。 接上去,启动本地加载模型的步骤:1、下载本仓库中的模型文件。 2、装置相关依赖,特别介绍经常使用transformers库版本4.30.2和torch版本2.0或以上。 3、将下载的全模型文件存入名为THUDM的文件夹中,并修正模型途径。 部署环节包括以下几种启动模型的方式:1、运转python web_文件,可以选择对话形式、工具形式或代码解释器形式启动交互。 2、经过Streamlit方式加载模型,运转streamlit run web_来启动代码解释器形式。 3、经过命令行方式运转python cli_文件启动交互式对话,输入clear可清空对话历史,输入stop终止程序。 4、最后,你可以经过以下代码调用ChatGLM模型生成对话:

版权声明

本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。

热门