首页资讯正文

Veo3逼真脱口秀火爆全网，视频生成的GPT时刻到了吗？

体育正文 2025-06-01 17:11:24 236 0

Veo3逼真脱口秀火爆全网，视频生成的GPT时刻到了吗？

Veo3逼真脱口秀火爆全网，视频生成的GPT时刻到了吗？

“如果AI生成的角色拒绝相信他们(tāmen)是AI生成的，会怎么样？” 近日，海外博主用谷歌最新视频模型Veo 3生成的一些人物(rénwù)视频火(huǒ)了(le)。在这些视频中，有一群人集体高呼抗议(kàngyì)“We're not prompts（我们不是(shì)提示词）”，还有一位男士举着手机自拍，背景是美妙的高山峡谷，他指着身后，“你想说我背后的完美创造物，仅仅是0和(hé)1的结果，一串二进制代码，再无其他？这不合理。” 当然(dāngrán)台词和剧本是人创作的，但由AI生成的这些人物(rénwù)和场景都极具真实感，无论是光线在人脸上投下的阴影与高光，还是人物的长相、口型，在阳光下眯起(mīqǐ)眼睛(yǎnjīng)的神态都极为自然。配合Veo 3新的原生音频生成功能，人们再一次惊呼“真实不存在了”。事实(shìshí)是否真的如此，视频生成(shēngchéng)的GPT时刻终于来了吗？第一财经记者采访的Veo 3的使用者们并不这么认为。AI Talk主理(zhǔlǐ)人、AIGC创作者汗青提到，Veo 3确实是很(hěn)好的技术，但并没有网传那么夸张，例如视频生成质量有提升但不惊艳，价格不低，现阶段对实际生产帮助还(hái)不大。 AIGC创作(chuàngzuò)领域的KOL@尾鳍Vicky对第一(dìyī)财经表示，Veo 3的文生效果是很好，但图生(túshēng)效果与国内第一梯队产品差不多，而在AI创作中，图生视频(shìpín)是更重要的工作流模式，综合价格看还未达到使用者的预期。是时候和(hé)好莱坞说再见了？ Veo 3是谷歌(gǔgē)在近日的I/O大会上发布的一系列更新之一，在当时一众眼花缭乱的产品线更新中，并不特别突出，但目前(mùqián)已经超过了其基座模型、智能眼镜(yǎnjìng)更新，成为讨论度最高的产品。 Veo 3最大(zuìdà)的(de)(de)迭代是(shì)，新增了原生音频生成功能，即模型在生成视频的同时能生成环境音和人物对话等，走出了此前视频生成的“无声时代”。从谷歌的演示看，无论是城市街道的车流声、公园中的鸟鸣，甚至是角色对话，均可通过文本提示生成。在发布新视频模型的(de)同时，谷歌也发布了针对电影制作人的视频创作工具FLOW。汗青认为，Veo 3配合FLOW的剪辑功能，是AI影像新一代工作流(liú)的雏形(chúxíng)。 Veo 3发布后，汗青第一时间进行了(le)测试，他用大概两个(liǎnggè)多(duō)小时生成了一条一分半钟的短片《前行列车》，包括影像在内，所有的配音、音效、对口型工作均由Veo 3完成。记者观察到(dào)，无论是画面、长镜头的镜头运动、人物表情和神态都非常有电影的质感。汗青认为，Veo 3的优势是真正原生多模态，原来的工作(gōngzuò)流是生成(shēngchéng)图像(túxiàng)、生成动画、生成配音/音效/音乐，最后对口型，但Veo 3的工作流是：文字生成动画，全部搞定。 “Veo 3生成的视频，会根据你的要求自动配上音乐和音效，提示词里(lǐ)如果有台词，甚至连配音和对口型都做完(wán)了。这应该是本次(běncì)模型最大的亮点之一。在这个(zhègè)新的多模态范式里，你不用再单独去折腾音乐和找配音、对口型了。”汗青表示，这种一次性生成的体验，不是一站式生成，价值不言而喻(bùyánéryù)，如果体验打磨到位，会大大降低创作的门槛，提升效率(xiàolǜ)。国外(guówài)也不乏赞美的声音。海外(hǎiwài)AI影片制作者@PJ Ace在X上表示，自己曾经拍摄过价值50万美元的药品广告(guǎnggào)，但现在不到一天的时间内就(jiù)用500美元的 Veo 3积分完成了一个(gè)一分(yīfēn)多钟广告视频，“现在花 50 万美元的理由是什么？（此前）拍这样的广告，从剧本到最终剪辑，我和50个工作人员得花两个多月的时间。” 有网友评论表示，从上面提及的这些数字来看，一部(yībù)时长3小时的AI制作的电影成本约为(wèi) 9 万美元，“是时候和好莱坞(hǎoláiwù)说再见了(le)”。 @PJ Ace认为，AI制作相比好莱坞便宜了10到20倍。这次出圈的(de)脱口秀视频是海外博主@Hashem Al-Ghaili用Veo 3制作(zhìzuò)的，他用谷歌的Veo 3做了一个测试(cèshì)，“想象一下，如果AI角色意识到(dào)他们生活在模拟环境中会是什么样子”。谷歌DeepMind首席执行官哈萨(hāsà)比斯（Demis Hassabis）转发了这一视频，并表示，Veo 3在建模直观物理方面的(de)表现令人惊叹，在他看来(kànlái)，这对(duì)世界的计算复杂性有着重要的意义。他透露，Veo 3的逼真效果源于其对复杂物理现象的推断(tuīduàn)能力。在帖子下面，科技圈名人马斯克也现身称赞(chēngzàn)，认为Veo 3“Nice work（干得漂亮(piàoliàng)）”。在磐霖资本风险合伙人陈利人看来，一个高中生用Veo 3生成的短片(duǎnpiàn)就能在TikTok获得百万播放(bōfàng)量，画面质量堪比漫威电影预告片，这就像数码相机终结柯达(kēdá)对影像的垄断(lǒngduàn)，GitHub让程序员(chéngxùyuán)不必挤进硅谷才能创造伟大产品。“当工具将专业创作能力赋予普通人，垄断文化生产的传统中心将失去存在的必要性。” I/O大会之前，谷歌组织了一次媒体沟通会，第一财经记者曾问及(wènjí)谷歌的(de)产品经理David，他们(tāmen)是如何实现Veo视频模型的质量提升的，他回复称，团队通过早期版本的实践，了解了需要改进的方向、适用的架构、数据类型，以及如何为模型提供准确、高质量和充足(chōngzú)的数据，所有这些经验都融入了迭代过程，这才(zhècái)有了Veo模型的惊喜(jīngxǐ)。也有业内人士(yènèirénshì)认为，谷歌模型的进展离不开“数据金矿”YouTube，凭借海量的视频资源，谷歌可以(kěyǐ)轻松训练AI模型，生成效果(xiàoguǒ)自然远超竞争对手。哈萨比斯近日在播客节目中提到Veo 3表示，在视频模型方面，“我们对数据质量管理非常严格(yángé)”。尽管Veo 3的视频生成(shēngchéng)质量有提升，但长期接触视频生成产品(chǎnpǐn)的AI创作者们并不觉得这是“GPT时刻”。汗青认为，从生成效果上看Veo 3有提升但并不(bù)惊艳，“相比Veo 2，效果低于(dīyú)我的预期。”而在(zài)真实度这方面(zhèfāngmiàn)，他提到，Veo系列本来就是天花板，此前发布的Veo 2真实性已经很强，Veo 3是向前又走了一步。与此同时，视频生成的瑕疵还有很多，例如，在(zài)火出圈的视频中，一个“方头(fāngtóu)小孩”明显生成失误，还有被采访的女孩说话时，嘴型(zuǐxíng)与发音略有偏差。汗青体验发现，偶尔出现没有音频的现象(xiànxiàng)，一致性很难把控等等。汗青用Veo 3生成了一个女主和蜘蛛侠一起做播客访谈的视频(shìpín)，可以看到其仿真度非常高(gāo)，但背后LOGO的“AI.TALK”一直没能显示(xiǎnshì)正确。汗青也尝试了在8秒(miǎo)的生成长度中能容纳对话的上限能力(nénglì)，发现在台词较多的时候，会出现丢台词、对话主体混乱（A说了B的话）之类的问题，同时对中文的支持并不好，大部分情况下都会出错。这些(zhèxiē)都是Veo 3需要不断完善的，远远(yuǎnyuǎn)达不到完美。汗青(hànqīng)肯定了Veo 3音画同出的方式，确实大幅度提升了创作效率，但目前体验(tǐyàn)下来很多效果远远不够理想，“它的意义是提出(tíchū)一个很有价值的方向，并且比Sora实现得要好得多(hǎodéduō)，但千万别指望现在就能用它做大量的商业生产。” 实际上(shíjìshàng)，第一财经问及视频生成现阶段的挑战(tiǎozhàn)时，David也(yě)表示，这个领域仍处于早期阶段，视频生成的首要挑战是非常基础的问题——指令遵循。用户提出需求后，是否能得到预期的结果，这也是谷歌在持续(chíxù)改进的方向。对于创作者来说，除开(chúkāi)这些瑕疵点，Veo 3最大问题(wèntí)是文生工作流模式和昂贵的价格。 @尾鳍Vicky与(yǔ)多个视频生成平台都有合作，她表示，Veo 3主要是文(wén)生效果很好，但(dàn)从现阶段真实的商业化生产场景来说，文生视频并不是主要生产力。实际上(shíjìshàng)创作者们“干活”用即梦、可灵、PixVerse、Vidu较多。 AI影视(yǐngshì)出现至今，AI创作者们有一个业内基本遵循的工作流范式，即以图像为核心，按图像去生成视频、再去音频融合（配音(pèiyīn)口型），最后剪辑，这是基本流程，而文生(érwénshēng)视频的流程，不确定性更高。因此(yīncǐ)当一个新模型不支持图生视频时，则(zé)意味着创作者们无法将其用于生产流程。 “即便是Veo 3的出现(chūxiàn)，我也不认为AI创作基本流程在短期内会有太大的变化，因为控图(kòngtú)比控视频的成本低太多了。”汗青也认为，传统的工作流在效率上存在很大的提升空间，Flow的发布(fābù)让人们看见这种可能性正在形成(xíngchéng)，不过，还有很长的路要走。 Veo 3另一个问题是价格。目前(mùqián)要(yào)使用(shǐyòng)Veo 3，首先需要谷歌美区账号，同时订阅谷歌最(zuì)贵的AI ultra套餐，费用高达每月249.99美元(měiyuán)（约为人民币1800元），这比OpenAI旗下最贵(zuìguì)套餐ChatGPT Pro还(hái)贵近50美元。不过，目前首次使用AI ultra的用户在前三个月可以享受50%的特别优惠，现价暂时是124.99美元每月（约为人民币900元）。但如果用于(yòngyú)商业(shāngyè)流程，AI ultra套餐(tàocān)也并不够用。汗青介绍，目前每个8秒的(de)Veo 3视频需要150积分，ultra的套餐只赠送12500积分/月，超出部分需要加油包，100个积分1美元，算下来大约1个8秒的镜头就需要1.5美元。 “套餐里这点积分(jīfēn)拿来做商业项目是肯定不(bù)够的(de)，一般都要涉及加油包的购买。由于文生视频的不可控性，成片率并不高(gāo)。”汗青表示，以他做的《前行列车》为例，这条一分半的视频，用了6000-7000积分，花费在70美元左右。从整体上来看，汗青认为Flow和Veo 3是有里程碑意义的一次发布，但绝不推荐大部分人目前重度使用(shǐyòng)它，除非是氪金玩家(wánjiā)，或者有明确(míngquè)商业回报的项目。“恼人的瑕疵非常多，远谈不上完美，也很贵。但意义是让我们看到了(le)新的AI影像工作流的雏形。” (本文(běnwén)来自第一财经)

标签

太原诗唯特 236 0

0

相关推荐

取消回复欢迎你发表评论:

评论列表

暂时没有评论

暂无评论，快抢沙发吧~