迪士尼彩乐园

迪士尼彩乐园稳定吗 第一个无谈话建模视频生成AI 100亿参数大模子VideoWorld开源了

发布日期:2025-01-16 07:23 点击次数:103

今天,豆包大模子团队与北京交通大学和中国科学技艺大学配合拓荒的视频生成推行模子“VideoWorld”还是认真开源。不同于主流多模态模子Sora、DALL-E、Midjourney等,VideoWorld是业界首个不需要依赖谈话模子就能进行表现的宇宙。

现在大部分模子齐依赖于谈话或标签数据来学习常识,但很少波及到纯视觉信号的学习。干系词,谈话无法透澈捕捉到着实宇宙中的所有这个词常识。比如一些复杂的任务,比如折纸、打领结等,很难用谈话明晰地抒发出来。而VideoWorld则去掉了谈话模子,在实行说明和推理任务时杀青了息争。

另外,迪士尼彩乐园官网地址它基于一种潜在动态模子,在高效压缩视频帧间变化信息方面进展出色,显贵晋升了常识学习遵守和后果。即使在莫得任何强化学习搜索或奖励函数机制的情况下,VideoWorld还是达到专科5段9x9围棋水平,况且大略在多种环境中实行机器东说念主任务。

该名堂标论文连结是:[https://arxiv.org/abs/2501.09781]迪士尼彩乐园稳定吗,代码连结是[https://github.com/bytedance/VideoWorld],名堂主页地址是[https://maverickren.github.io/VideoWorld.github.io]。

查看更多

推荐资讯