当 OpenAI 发布Sora时,这是一款人工智能驱动的工具,可以将文本描述转换为视频,由于其令人惊叹的结果,它很快就引起了全球轰动。最接近的竞争对手Pika Labs和RunwayML在文本提示的质量和连贯性方面明显落后。
也许原因之一是人工智能视频生成器需要大量的计算能力才能运行。 Sora 需要八个 NVIDIA A100 图形处理单元 (GPU) 运行三个多小时才能生成一分钟的剪辑。一台 NVIDIA A100 的售价超过 10,000 美元。
但今天,Sora 可能终于有了一个真正的竞争对手——中国刚刚推出了文本到视频的人工智能工具 Vidu。
Vidu是什么?
Vidu是由中国人工智能初创公司圣数科技和清华大学合作开发的文本到视频的人工智能模型。它于 2024 年 4 月 27 日发布,旨在通过单击生成 1080p 分辨率的高清 16 秒视频。
“它富有想象力,可以模拟物理世界,并制作出角色、场景和时间线一致的 16 秒视频。”