买个菜不用开坦克去 !全球AI浪潮末尾聚焦 小而美 (买个菜不用开发票吗)
在全球范围内,人工自动军备竞赛最后的终点是追求“大”: 巨型模型在海量的数据上启动训练,试图模拟具有人类自动水平的人工自动。
但是如今, 大批科技巨头和初创企业正在末尾思索参与AI软件的规模,使其更廉价、更加快、更专业……
这类AI软件被称为小型言语模型(SLM)或中型言语模型,经常经常使用较少的数据启动训练,通常专为特定义务而设计。
作为对比,那些知名的大型言语模型(LLM),如OpenAI的GPT-4,开发本钱逾越1亿美元,训练的参数抵达了逾1万亿。而较小的言语模型则通常在较窄的数据集上启动训练——例如,或许仅仅聚焦于法律疑问上,其训练本钱往往或许不到1000万美元,参数不到100亿。较小的模型也将消耗较少的算力,因此照应每个查询的本钱也较低。
近几个月来,微软就正在鼎力宣传其名为“Phi”轻量级AI模型系列。 微软首席执行官Satya Nadella表示,这些模型的大小只需OpenAI的ChatGPT不要钱模型的1/100,而执行许多义务的效果却简直一样好。
微软首席商务官Yusuf Mehdi表示,“我以为,我们越来越有理由置信,未来将是一个由不同(大小)模型组成的全球。”
Mehdi称,微软是全球首批在生成式人工自动上押注数十亿美元的大型科技公司之一。而我们也很快看法到,人工自动的运营本钱比公司最后估量的要高。
微软最近还推出了新型的AI笔记本电脑,搭载数十集团工自动模型启动搜寻和图像生成。这些模型要求用到的数据十分少,可以在终端设备上运转,而不要求像ChatGPT那样访问庞大的基于云端的数据中心。
谷歌以及人工自动初创公司Mistral、Anthropic和Cohere往年也发布了更小的模型。苹果在六月份发布该公司的AI路途图时,也方案经常经常使用小型模型,这样就可以完全在手机上运转软件,使其更为快捷简易、也更为安保。
就连不时处于大型模型模型浪潮前沿的OpenAI,也在5月发布了其旗舰模型的新版本GPT-4o,并称该模型运营本钱更低。一位发言人OpenAI表示,该公司对未来发布更小的模型持开通态度。
AI模型浪潮末尾聚焦“小而美”
关于许多义务来说——比如汇总文档或生成图像,大型言语模型如今显得或许会有些“朴素”。一些行业人士将此描画为“相当于开着坦克去买菜”。
目前从事区块链技术研讨的Illia Polosukhin是2017年谷歌一篇开创性论文的作者之一,该论文为以后的生成式人工自动热潮奠定了基础。Polosukhin近来就表示,单单计算“2+2”不应该要求启动有数次运算。
理想上, 从财务本钱的考量来看,在生成式人工自动技术的报答尚不明白的状况下,企业和消费者也不时在寻觅以更低本钱运转AI的方法。
位于以色列特拉维夫的人工自动公司AI21 Labs的结合开创人Yoav Shoham称,由于只需经常经常使用较少的算力,在许多状况下,小型模型回答疑问的本钱仅为大型言语模型的六分之一。假定你要启动数十万甚至数百万次回答,经常经常使用大模型在经济上其实行不通。
以后的关键在于,如何更有效地将这些较小的模型集中在一组数据上,如外部通讯、法律文件或销售数字,以执行撰写电子邮件等特定义务——这一训练环节被称为微调(Fine-tuning)。经过微调,可以让小型模型在执行这些义务时与大型言语模型一样有效,而本钱只是大型模型的一小部分。
初创公司Snorkel AI的结合开创人Alex Ratner表示,“让这些更小、更专业的模型在这些更单调但更关键的范围任务,是目祖先工自动的前沿范围。”
Snorkel AI目前的业务范围包括协助企业定制人工自动模型。
企业用户也正转向小模型?
在企业用户端,信誉评级公司益百利近来已将其用于金融咨询和客户服务的AI聊天,从大言语模型转向了小言语模型。
益百利首席数据官Ali Khan表示,在公司外部数据上启动训练时,小型模型的表现与大型模型不相上下,而本钱仅为大型模型的一小部分。他表示,这些小模型可以针对一个明白的疑问范围和一系列义务启动特定训练。
Salesforce人工自动部门主管Clara Shih则表示,这些小模型的照应速度相比大模型也更快。
Shih称,“经常经常使用大型模型你会付出过高的本钱并且有提早疑问。有时辰也基本用不着。”
值得一提的是,在末尾向小言语模型转变的同时,诸多AI巨头大型言语模型的迭代速度也在放缓。
自OpenAI去年发布GPT 4(与之前的模型GPT 3.5相比,性能有了清楚优化)以来,还没有新的迭代模型(GPT 5)发布。研讨人员以为,构成这种状况的要素包括用于训练的高质量新数据稀缺。
这一趋向也让人们末尾更为关注小模型。指点Phi模型项目的微软公司高管塞Sébastien Bubeck表示,“如今正是大家都在等候的一个小间歇期,这会让人们的留意力转向,他们会想,‘好吧,我们还能不能让这些东西更高效?’”
目前,还不清楚这种迭代停滞是暂时的,还是遭遇了一个更为顺手的技术瓶颈疑问。 但是,小型言语模型的大批涌现,仍说明了人工自动正在从科幻小说般的梦境演示,演化成了不那么令人兴奋的商业理想。
当然,许多公司并没有完全丢弃大型言语模型。苹果已宣布将在其Siri助手中参与ChatGPT,以执行撰写电子邮件等更复杂的义务。微软表示,其最新版的Windows也将集成OpenAI的最新模型。不过,两家公司都只是将OpenAI集成作为其全体人工自动方案的一部分,而显然并没有把一切的筹码都押注于此。
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。