本站出售,有兴趣带价格联系QQ:503594296

抖快激战人工自动 媒体AGI独家

admin1 1年前 (2024-07-17) 阅读数 131 #财经

I 生成的图片

备受关注的中国版Sora视频模型快手可灵,行将迎来新的对手。

7月16日信息,媒体AGI得知,字节跳动团队将会在7月19日(本周五)初次大范围发布文生图、类sora新视频等全新人工自动(AI)模型技术进度,尤其在长视频、高灵敏方向上具有创新技术,或将直接对标Sora效果。

早前,“字节跳动开源”群众号发布信息称,其将在新加坡举行关于全球模型(World Models)探求的AI技术菁英论坛(ByteDance AI Luminary Talks)活动,字节跳动研讨迷信家周大权将会围绕“延续高灵敏的长视频生成方案”展开演讲。

一位信息人士对媒体App表示,字节跳动外部将 AI 大模型设为集团P0最后级别的方向。另一位信息人士则指出,除了上述研讨团队之外,抖音、剪映等外部多个团队也在研发 AI 视频模型运转,估量将在近期发布。

而与此同时,国际唯二的短视频龙头快手在 AI 视频大模型范围进度迅速。继6月6日快手13周年发布并邀测可灵模型运转之后,7月6日,快手谢全球人工自动大会(WAIC 2024)时期开源可图文生图大模型,以及不要钱上线可灵Web端。

快手走漏,全球首个用户可用的真实影像级视频生成大模型可灵平台开放用户数逾越50万,开放用户数逾越30万,生成视频数达700万以上。

这意味着,曾在互联网短视频平台范围对战的两家中国公司抖快(抖音/字节跳动、快手),如今则悄然展开着一场围绕中国抢先AI视频大模型的新竞争。

中国两大短视频巨头转向人工自动

通常上,AI 是短视频平台中相关最为亲密的底层技术。

“只需短视频平台业务,在没无机器学习的时辰是不成立的。大家设想一下,大部分用户是不会由于一、两个你记得的短视频去翻开一个APP的,翻开APP肯定是相当长一段时期的沉溺式体验,能带给十分多收获的觉得。所以,AI是(快手)业务的中心,没有AI技术,这个业务是不成立的。”快手初级副总裁、快手主站业务与社区迷信担任人盖坤(快手于越)表示,相比电商、搜寻等场景,短视频更要求 AI 技术加持。

而幽默的是,担任 AI 产品的盖坤曾在字节任职过。

通常上,过去10余年互联网时期下,从桌面、阅读器,到输入法、天气软件,都在寻觅能够占领用户心智的下一个“微信”。但是,最终我们发现,能够与微信相提并论的产品是两款短视频直播产品——抖音和快手,当然这面前有5G、疫情等原因,但抖快确实曾经成为国民运转级别产品,抖音日活用户逾越6亿,快手日活用户则曾经抵达3.94亿(2024年Q1)。

2024年2月,继ChatGPT之后,OpenAI发布的Sora AI视频生成模型再度引爆全网。经过冗长或详细的提醒词描画,或一张静态图片,Sora就能生成相似电影的逼真场景,涵盖多个角色、不同类型举措和背景细节等,最高能生成1分钟左右的1080P高清视频。

“Sora是能够了解和模拟理想全球的模型的基础,我们置信这一性能将成为成功通用人工自动(AGI)的关键里程碑。”OpenAI指出,Sora不只是视频生成模型,而是“全球模拟器”。

自往年5月起,国际抵达类Sora级别的 AI 视频模型技术陆续发布,包括生数、智象未来(HiDream.ai)等多家企业都在积极规划。而就在6月6日,快手可灵 AI 视频生成模型开启邀测,整个生功效果直逼Sora,引发关注。

盖坤指出,快手的 AI 技术关键在短视频内容引见、内容消费和内容了解三个层面启动运转规划,大模型时代落地的则是快手快意言语大模型、十万亿参数规模的引见模型SIM、5月发布的可图文生图模型、6月发布的可灵 AI 视频模型等技术。

不只是技术,快手也在商业化层面启动规划。盖坤表示,基于快意大模型构建的视频和直播脚本生成、广告搜寻客服叠加数字人技术,使得AIGC日均消耗增长抵达2000万。

相比于快手,由于企业暂未上市,形成抖音和字节跳动关于 AI 大模型的规划略显微妙。

过去一年多,随着 AI 大模型浪潮席卷国际外,字节跳动片面追逐,并对AI大模型启动模型层到运转层的片面规划。

其中,在基础大模型范围,2023年8月,该公司上线首个大言语模型“豆包”及多模态大模型BuboGPT。其抖音云雀大模型经过首批《生成式人工自动服务控制暂行方法》备案,面向群众开放。同时,字节跳动基础模型在言语和图像两种模态上均启动了规划,两个团队均向TikTok技术担任人白文佳汇报。

在AI运转层,字节跳动已于去年11月成立新AI部门Flow,目前已推出三款AI对话类产品,包括豆包、扣子和Cici。其中,豆包为一款聊天产品,可以成功问答、文本生成、言语翻译等多种义务,还可以依据用户需求和上下文启动自顺应问答,提供特性化服务。扣子是一站式AI Bot开发平台,无论用户能否有编程基础,都可以在扣子平台上加快搭建基于AI模型的各类问答Bot,可成功处置方便的问答,并处置复杂逻辑的对话。

进入2024年,字节跳动加大产品研发速度,继续推出AI学习同伴河马爱学、AI剧情互动产品猫箱、AI生图产品PicPci、多模态数字人产品以及AI生图、AI生视频产品等多款AI大模型范围产品。

同时,最新信息显示,字节跳动还在围绕AI配件启动规划。其中一条产品线聚焦可穿戴AI设备,以刚刚被字节跳动收买的耳机品牌Oladance团队为基础启动探求;另一条产品线担任探求手持类AI设备,更靠近对现有支流计算设备的AI化延展,成立更早,与AI运转团队Flow也更严密。而且,字节跳动旗下剪映也在研发AI产品,名为即梦。

字节已规划的 AI 范围相关技术和产品

关于 AI 算力底层,之前字节跳动旗下火山引擎初次发布了自研的视频编解码芯片。字节跳动副总裁杨震原曾走漏,公司无通用芯片商业方案,没有涉足CPU、GPU等通用芯片业务。

因此,全体来说,抖音/字节跳动和快手从底层研发,到产品和商业化层面都在规划 AI 大模型技术,心愿在 AI 时代下抢得先机。但是,截至目前,暂未出现抖音运行 AI 大模型成功商业化的更多信息释出。

场景难通用,用 AI 赚钱的时代才刚刚末尾

“过去一年,全行业都继续投入到生成式AI和大模型热潮当中,每家企业都在努力思索如何将 AI 融入业务,都坚信 AI 将会成为未来技术创新和商业方式改造的中心,甚至有望带来比互联网更大的影响。但结果是,英伟达成为全球市值最高的公司,而期盼的 To C端 AI 杀手级原生运转迟迟没有出现。”

“乱翻书”主理人潘乱的这句话,打中了当下大模型热潮面前的隐忧与真实状况。

创新工场结合开创人汪华曾做过一个统计,中国通常上处于美国上半年第一阶段的运转迸发前期。尽管最近大家看到很多产品在大批推行,用户量也在迅速增长,但是把一切运转加在一同,日活也不过就是 1000 万,中国有 12 亿网民;而美国 3 亿人口就有大几千万的日活,相比之下还有很大的差距。

这说明,尽管 AI 未来已来,但是模型的产品化还远远没有到来,甚至可以说是模型运转落地才刚刚末尾。

“大家还是太焦虑了,大模型从末尾到如今才一年多时期,整个的运转展开,实质上还是要随着模型的成熟和整个运转生态的构建逐渐展开。”汪华以为,ChatGPT 作为通用工具,用户平均时长是七八分钟,但我看过很多做社交文娱的创业公司,他们的平均经常经常使用时长逾越 150 分钟。推理本钱只需降 10 倍,工具类的运转就可以做大体量不要钱。推理本钱降得更低,高时长文娱性的运转才干做到大体量不要钱,所以大用户量的工具,我觉得往年年底到明年年终就会成功。再往后是衣食住行,这类运转要求更高的模型性能,以及商业方式整合,从吃喝玩乐到衣食住行,这个时期周期大约在 3-4 年之内走完。

而作为抖音和快手这种短视频龙头来说,将 AI 技术“随风潜入夜,润物细无声”成功落地,这或许他们想要抵达的终极目的。

多位 AI 范围从业者向媒体App坦言,目前 AI 大模型技术更像是“文科生”,很难了解数学疑问,所以其运转场景的范围十分有限,以后模型的最大作用是优化效率的“消费力工具”。

很显然,用 AI 赚钱的时代才刚刚末尾。

据麦肯锡最新发布的一份全球考察报告称,65%的受访者表示企业会经常经常经常使用生成式AI。这比10个月前的考察(33%)简直翻了一番。其中,服务业关于 AI 技术的经常经常使用率增幅最大。

同时,四分之三(75%)的受访者预测,生成式 AI 将在未来几年内为其行业带来严重或推翻性的变化。

有熟习字节的信息人士曾通知媒体App,字节跳动外部关于 AI 模型的技术运转规划十分普遍,且存在肯定的外部“优胜劣汰”竞争战略,多个团队加紧比拼当中。

盖坤则表示,快手心愿坚决为用户做最好的 AI 技术。

MiniMax开创人、CEO闫俊杰曾对媒体App表示,往年上半年,公司末尾看法到,在一些偏消费力的场景里,“我们末尾具有部分优点了”。至少三年后,国际才有或许出现“杀手级”AI运转。估量MiniMax首款 AI 视频运行将最快于8月推出。

“坦率讲,我觉得大部分(国际)公司都还没有拉开差异化,大家都差不多,或许模型水平也差不多,产品也差不多,然后就会末尾‘拼多少钱’。我觉得这个东西不是坏事,其实是逼着大家能够更好来做技术创新。”闫俊杰表示。

(本文首发于媒体App,作者|林志佳,编辑|胡润峰)

版权声明

本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。

热门