本站出售,有兴趣带价格联系QQ:503594296

又拿钱了 中国版Sora 清华明星团队打造的 (又拿钱了中国人怎么办)

admin1 1年前 (2024-07-05) 阅读数 22 #财经

近日,OpenAI的一纸“断供”通知在国际再次掀起波涛。

这则通知显示,自7月9日起阻止来自非支持国度和地域的API流量。目前,OpenAI的API向161个国度和地域开通,由于中国未在其中,这意味着OpenAI将终止对中国提供API服务。

为了在这次“断供”中率先抢占到市场份额,国际大模型厂商纷繁推出相关“搬家”活动,一时期喧嚣四起。

无疑,OpenAI的这个举措再次证明了国产人工自动的关键性。正是如此,今天二级市场上相关概念股迅速拉升,甚至少支发生了涨停。

与此同时,哈勃入股AI公司生数科技的信息末尾浮出水面,在这种关键时期点,生数科技再次成为了业内关注的焦点。

不止中国版Sora

这并不是生数科技第一次性性出圈。

往年4月,生数科技结合清华大学公布了中国首个长时长、高分歧性、高灵敏性视频大模型—Vidu,性能片面对标Sora,事先就在国际外惹起了一阵惊扰。

据悉,Vidu支持一键生生长达16秒、分辨率高达1080P的高清视频内容,它不只能够模拟真实物理全球,还拥有丰厚设想力,具有多镜头生成、时空分歧性初等特点。

Vidu公布后,生数科技对外表示,Vidu的视频时长会继续打破,面向未来,Vidu灵敏的模型架构也将能够兼容更普遍的多模态才干。同时,关于被称为“中国版Sora”,生数科技并不算满意,由于他们的野心远比这更大。

而这种底气则来自生数科技是全球首个提出Diffusion Transformer融合架构U-ViT,在这一架构下,生数科技成功了大模型在图像、3D、视频等多模态生成义务下的性能边界的探求。

假定说这样并能让人直观感遭到生数科技的技术优点,那么其实Sora面前采纳的融合架构Diffusion Transformer即DiT,与生数科技的路途简直相反。

一个插曲是,生数科技是在2002年9月就提出了该融合架构,比DiT早两个多月,由于公布时期更早,当年计算机视觉顶会CVPR 2023只收录了U-ViT论文,并以“缺乏创新”为由拒绝了由伯克利团队宣布的DiT论文。似乎无实际方面,生数科技在视频大模型上的规划是完全早于OpenAI的。

只不过,提出U-ViT架构的生数科技并没有第一时期把资源都放在视频上,而是先放在了图像和3D上。

这是由于生数科技以为,真正的自动肯定是通用多模态的,以人为例,声响、视觉、举措这些多模态信息同时输入和输入,人类才干够将一个事物或许概念看法和表达得足够准确。

2023年,生数科技表示,图像生成效果曾经逾越了Stable Diffusion最新版基础模型,并宣称在年内赶超Midjourney。3D内容生成方面,也成功了文生3D和图生3D的才干。

此外,在往年,生数科技才末尾在视频上的集中发力,一方面基于上述两个产品的成熟,其次也是有Sora的催化。回看生数科技在视频上的频频举措,1月份,正式上线4秒短视频生成,2月份Sora公布之后,生数科技一个月后成功了8秒的视频生成,4月份视频长度再次翻倍到来16秒。

在详细打法上,生数科技目前采取模型层和运转层两条路走路的方式。一方面,构建掩盖文本、图像、视频、3D 模型等多模态才干的底层通用大模型,面向B端提供模型服务才干;另一方面,面向图像生成、视频生成等场景打造垂类运转,依照订阅等方式不要钱,运转方向关键是游戏制造、影视前期等外容创作场景。

围绕这种方式,生数科技公布了自主研发的多模态通用大模型UniDiffuser,同时推出了两款运转产品视觉创意设计平台 PixWeaver 和3D 资产创立工具 VoxCraft,以及视频大模型Vidu。

又一支清华创业团队

为何生数科技艺在如此短时期内,成功多模态范围的规划?这还得从其开创团队说起。

成立于2023年3月的生数科技,由人工自动计划提供商瑞莱智慧RealAI、蚂蚁集团和BV百度风投共同孵化。

生数科技中心研讨团队关键来自清华大学人工自动研讨院,其首席迷信家朱军,现任清华大学计算机系教授,同时也是清华人工自动研讨院副院长、清华自动技术与系统国度重点实验室主任、智源首席迷信家。

生数科技CEO唐家渝,曾任腾讯优图实验室初级产品经理和瑞莱智慧RealAI副总裁,先后担任瑞莱智慧产品团队、AI安保产研团队及业务。CTO鲍凡则是清华大学计算机系的博士生,并作为朱军教授课题组的成员,共同推进研发任务。

此外,生数科技对多模态生成式模型的探求,最早可以追溯到2013年。彼时,早期成员在清华实验室,末尾了生成式模型实际基础、高效学习和推理算法,以及音乐生成、人脸分解等多方面的研讨任务。

生数科技目前已于ICML、NeurIPS、ICLR等人工自动顶会宣布相关论文近30篇,其中提出的免训练推理算法Analytic-DPM、DPM-Solver等打破性效果,取得ICLR出色论文奖,并被OpenAI、苹果、Stability.ai等国外前沿机构采纳,运转于DALL·E 2、Stable Diffusion等明星项目中。

值得一提的是,这并非清华人工自动研讨院初次孵化AI项目,上文提到的瑞莱智慧RealAI,也是由清华大学人工自动研讨院创立,该公司由毕业于清华大学的田天博士担任公司CEO,清华大学AI研讨院首任院长张钹与朱军共同担任公司首席迷信家。

多家明星机构入股

清华明星创业团队,正确的技术路途选择以及加快的产品才干,让生数科技自成立起就备受资本关注。

2023年6月,生数科技宣布成功了近亿元的天使轮融资。此轮融资由蚂蚁集团领投,BV百度风投、卓源资本跟投,投后估值达1亿美金。

生数科技的天使轮资方均是瑞莱智慧RealAI的老股东,对此,唐家渝此前在接受媒体采访时走漏,生数科技是在2023年2月开启的天使轮融资,基本没有到市场上融资,事先瑞莱智慧RealAI多家老股东就表示了足够的兴味,所以整轮融资很快就敲定了。

不久后,生数科技又成功了由锦秋基金独家投资数千万元的天使+轮融资。

时期到来2024年,生数科技又成功了两轮高节拍融资:

3月,生数科技成功了新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI以及老股东BV百度风投和卓源亚洲继续跟投。

6月,生数科技成功了数亿元Pre-A轮融资,由北京市人工自动产业投资基金、百度结合领投,迷信城公司等跟投,启明创投、卓源亚洲等老股东继续支持。

经过四轮融资,生数科技累计取得了数亿元人民币的投资,这使得它成为除了“大模型五虎”外,目前国际多模态大模型中估值最高的初创公司之一。

可以看到,在生数科技的四次融资中,百度、卓源资本、启明创投介入了多轮,除了老股东,这些资方中还有北京人工自动产投基金这样的国度队,以及智谱AI这样的创业企业。另外,生数科技成也是蚂蚁集团投资的首个AIGC项目。

据悉,上文提到的哈勃入股生数科技也并非是新开的一轮,其也是生数科技Pre-A轮融资的资方,只不过在近期才成功了工商变卦。

在大模型公司激战的当下,算力才干成为了关键赛点,不过生数科技暂时没有算力忧虑,此前其曾表示,未来算力疑问不会继续太久,产品造成也选择了生数科技并不要求像言语模型,经常经常使用上千甚至上万张卡,另外股东也给了相当的算力和资源支持。当然,我以为除了财务和技术外,有了百度、哈勃、启明、蚂蚁等资方的加持,让生数科技不时坚持在台前,这在当下的大模型浪潮中,或许是最关键的。


1. 月之暗面,一家成立不到一年的AI公司,最近成功了一笔高达70亿人民币的融资,震惊了整个业界。 2. 这家公司的估值曾经到达了250亿美元,使其成为中国大模型范围的领军企业。 3. 月之暗面的开创人杨植麟,拥有清华大学和卡内基梅隆大学的背景,他率领团队开发了Transformer-XL和XLNet等里程碑式的产品。 4. 遭到ChatGPT的启示,杨植麟和校友们共同创立了月之暗面,并推出了智能助手Kimi Chat。 5. Kimi Chat是一款具有反派性的产品,能够支持长达20万汉字的长文本交互,其中心在于自主研发的闭源特性,以及面向团体用户的直接服务。 6. 月之暗面团队在长文本处置才干上取得了打破,其模型参数量到达了千亿级,无损长程留意力才干逾越了行业标杆。 7. 月之暗面的愿景是打造一款面向团体用户的超级运行键知,方案在2024年推出多模态产品,与OpenAI的Sora构成差异化竞争。 8. 虽然月之暗面在商业化路途上还未走完,但他们坚信自主研发的模型关于构建Super App至关关键。 9. 杨植麟以为,闭源模型关于产品差异化和壁垒构建的关键性不容无视。 10. 在国际大模型范围,互联网巨头和创业公司选择了不同的途径,大厂注重产业生态,而创业公司则追求技术深度。 11. 面对OpenAI的抢先位置,国际玩家们正在积极追逐,他们看法到这是一场关于时期和技术创新的马拉松,每个介入者都在寻觅自己的优势场景。 12. 月之暗面的崛起代表了中国AI创业公司的全新力气和远大志向。 13. 随着市场的开展和技术创新,我们等候月之暗面在AI范围书写更多的传奇故事,引领中国AI范围开启新的篇章。

版权声明

本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。

热门