谷歌演示了两个新的文本到视频的人工智能系统专注于质量和长度
上周,Facebook的母公司Meta分享了一种新的AI模型,可以将文本提示变成简短的无声视频。但事实证明,谷歌一直在解决同样的问题,并且最近发布了两个新的AI文本到视频系统,其中一个专注于图像质量,另一个优先考虑创建更长的剪辑。
我们先来看看高质量的模型:ImagenVideo。顾名思义,该模型建立在Google早期的文本到图像系统Imagen中磨练出来的技术之上,但将一堆新组件捆绑到管道中,以将静态帧转换为流畅的运动。
与Meta的Make-A-Video模型一样,最终结果同时令人难以置信、不可思议和令人不安。最有说服力的样本是那些复制动画的视频,比如形成“Imagen”字样的绿芽或在太空中冲浪的木雕。那是因为我们不一定期望这些镜头遵循严格的时间和空间构成规则。它们可以稍微宽松一些——这适合模型的弱点。
最不令人信服的剪辑是那些复制真实人和动物的动作的剪辑,例如铲雪的人物或在沙发上跳跃的猫。在这里,当我们对身体和四肢应该如何运动有了如此清晰的认识时,镜头的变形和恶化就更加明显了。不过,无论如何,这些视频都非常令人印象深刻,每个剪辑都是使用下面每个标题中的文本提示生成的。
谷歌的研究人员指出,ImagenVideo模型以24x48分辨率输出16帧3fps的素材。然后,这些低分辨率内容通过各种AI超分辨率模型运行,这些模型将输出提升到128帧24fps素材,分辨率为1280x768。这比Meta的Make-A-Video模型质量更高,后者被提升到768x768。
正如我们在Meta系统的首次亮相时所讨论的,即将到来的文本转视频AI带来了各种挑战;从嵌入在这些系统中的种族和性别偏见(对从互联网上抓取的材料进行培训)到它们被滥用的可能性(即,制造未经同意的色情、宣传和错误信息)。
谷歌表示“还存在几个重要的安全和道德挑战”
谷歌的研究人员在他们的研究论文中简要地回避了这些问题。“视频生成模型可用于对社会产生积极影响,例如通过放大和增强人类的创造力,”他们写道。“然而,这些生成模型也可能被滥用,例如生成虚假、仇恨、露骨或有害的内容。”该团队指出,他们尝试使用过滤器来捕捉NSFW提示并输出视频,但没有对他们的成功发表评论,并得出结论——读起来像是无意的轻描淡写——“还存在几个重要的安全和道德挑战。”嗯,相当。
这并不奇怪。ImagenVideo是一个研究项目,谷歌只是通过不向公众发布它来减轻其对社会的潜在危害。(Meta的Make-A-VideoAI同样受到限制。)但是,与文本到图像系统一样,这些模型很快就会被第三方研究人员复制和模仿,然后作为开源模型传播。当这种情况发生时,毫无疑问,更广泛的网络将面临新的安全和道德挑战。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
2025年以来,联通支付严格贯彻落实国家战略部署,以数字和科技为驱动,做好金融五篇大文章,履行支付为民社会...浏览全文>>
-
随着新能源汽车市场的不断发展,大众汽车推出的ID 4 X系列车型受到了广泛关注。2025款滁州地区的ID 4 X以...浏览全文>>
-
在安徽滁州购买长安猎手K50时,了解其落地价格以及如何节省购车成本是非常重要的。长安猎手K50作为一款实用性...浏览全文>>
-
2025款途锐作为大众旗下的一款豪华SUV,凭借其卓越的性能和高端配置,吸引了众多消费者的关注。对于计划购买这...浏览全文>>
-
在新能源汽车市场蓬勃发展的背景下,大众ID 4 X以其出色的产品力和亲民的价格赢得了众多消费者的青睐。作为...浏览全文>>
-
大众ID 系列自推出以来,凭借其出色的电动性能和时尚的外观设计,受到了广泛的关注。作为一款备受期待的新车...浏览全文>>
-
2025款济南高尔夫GTI作为一款备受关注的性能钢炮车型,其市场定位和产品力都十分突出。这款车型在动力系统、操...浏览全文>>
-
岚图汽车作为东风旗下的高端新能源品牌,近年来凭借其创新的设计理念和卓越的性能表现,在市场上赢得了广泛的...浏览全文>>
-
2024款的安庆ID 7 VIZZION作为一款备受关注的新能源车型,凭借其出色的续航能力与智能科技配置吸引了众多消...浏览全文>>
-
池州途昂作为大众汽车旗下的旗舰级SUV车型,凭借其宽敞的空间、强劲的动力以及豪华的配置,在国内中大型SUV市...浏览全文>>
- 联想日前公布了一款具有可以向上扩展的显示屏的笔记本电脑
- 联想 YOGA 智能眼镜 T1 将在 10 月 24 日开启预售
- 三星在国内正式发了三星W23系列
- 三星正式发布了折叠屏手机三星W23
- 三星举办了三星W23系列新机发布会
- 2022第十八届深南电路杯航空模型大赛将于10月29日在深圳举行
- 飞利浦公布了新的游戏外设品牌Evnia的首轮产品线
- AMD Ryzen 7 7700:65 W Zen 4 台式机 CPU 首次亮相 Geekbench
- MelGeek 现在通过 Kickstarter 众筹活动发布 Pixel
- 三星 Galaxy 智能手机获得新的便捷相机定制选项
- Realme 10 有望推出浅色和深色渐变配色
- 三星确认到 2023 年 2 月将 Android 13 分发到 49 款智能手机和平板电脑
- 三星为 Galaxy Z Fold 4 增加了一家屏下摄像头供应商
- YouTube 获得了新设计与双指缩放
- TecnoPovaNeo5G32兆像素相机和6000mAh智能手机便宜
- 三星GalaxyBuds2Pro现已上市售价200美元
- 百思买在11月7日为Totaltech会员提供购买PS5的机会
- 级别锁一直都有一个秘密的线程无线电
- 这款飞利浦设备将通过语音命令在几分钟内烹饪食物知道价格
- 这是三星在德国的 One UI 5.0 更新发布时间表