|

财经

“国产Sora”落地提速,Al改写视频产业链丨AI应用之道⑤

来源:21世纪经济报道

2024-06-25 21:03:01

(原标题:“国产Sora”落地提速,Al改写视频产业链丨AI应用之道⑤)

21世纪经济报道记者孔海丽、实习生芦子衿 北京报道

被称为“国产Sora”的快手可灵视频大模型,又有新动作,其近日增加了图生视频和视频续写功能,最长可生成约3分钟视频,一举成为Sora的“3倍量”。

今年6月初,快手自主研发的AI大模型“可灵”成为“首个面向用户开放的Sora级文生视频大模型”,据21世纪经济报道记者了解,至今仍无法使用Sora的国外网友们心痒难耐,甚至寻求中国手机号申请加入可灵测试。截至6月20日,可灵内测的排队申请人数超过14万人。

这场AI视频大模型落地之争,赛道明显拥挤了起来。Sora之后,Stability AI 宣布Stable Video公测,紧接着谷歌、阿里巴巴、字节等公司也纷纷加入,更新或是公布自己的AI视频模型。

一定程度上,Sora迟迟未向公众开放,给市面上的同类竞争选手留下了空间与时间。

一方面,AI视频大模型初创公司正在加紧壮大队伍,比如Pika于近日新获得了5.8亿元融资,投后估值约为34亿元;另一方面,国内对标Sora的公司,在面向用户开放与商业落地上先行一步,让市场看到了AI视频大模型应用的具体场景与商业可能性。

据21世纪经济报道记者了解,目前,AI大模型已经在影视、动画设计等行业实际应用,提升效率的同时,也在一定程度上替代了人工。

实测可灵,3分钟生成5秒视频

目前,可灵大模型已经可以通过快手旗下剪辑软件“快影”申请测试,21世纪经济报道记者实测发现,对于毫无视频制作经验的人群而言,可灵已经可以轻松化身“5秒短视频”制作工具,砍掉了超短视频的制作门槛。

一年前,AI生成视频名场面——初代“威尔史密斯吃面”还处在粗制滥造阶段,如今,多家AI视频大模型都已经可以产出符合逻辑的吃面视频。

(一年前,AI生成的“威尔史密斯吃面”视频)

在可灵生成的视频中,模拟出了主角用筷子夹起面条、甩汤、吃面的连贯动作。虽然细看还是会有一些小的瑕疵和形变,但可以看到,在吞咽时,中年男子面部的肌肉动态真实,碗中面条的运动轨迹合理。

(可灵生成视频。提示词:一个中国男人坐在桌前,用筷子吃面条)

21世纪经济报道记者从快手方面了解到,可灵大模型采用了原生的文生视频技术路线,替代了“图像生成+时序模块”的组合,所以能够准确处理复杂运动。

另外在时序信息建模上,快手大模型团队设计了一款全注意力机制(3D Attention)作为时空建模模块,该方法可以更准确地建模复杂时空运动,同时兼顾运算成本,提升了模型的建模能力。

目前的AI视频中,生成双人互动依旧是比较弱势的一环。21世纪经济报道记者试着对双人情景进行测试,除去动作幅度较小之外,可灵将两位老人的手以及表情处理得很好,作为背景的街边路人也并未出现明显错误。

(可灵生成视频。提示词:在黄昏的城市街头,两位白发苍苍的老人紧紧拥抱)

但可灵相对Sora也有不足之处。在测试Sora最出圈的视频“东京女子漫步街头”时,可以看到,可灵生成的街景和人物面部都产生了一些相应的形变,女子的眼睛闭合不全。

(可灵生成视频。提示词:在东京街头,一位时髦的女性穿梭在充满霓虹灯的街道上 )

不过可以理解的是,快手是把视频制作的权限完全交到了用户手中,用户可以直观看到未经雕琢的第一手视频作品,而非官方经过精心训练、挑选过的demo,针对瑕疵视频,用户可以选择继续扩大提示词、多次尝试。

国内其他主流视频企业虽然暂时还未出现类Sora的大型AI视频生成模型,但同样发布了一些短视频生成模型。目前,抖音集团也有专门的AIGC产品即梦(Dreamina),支持生成3秒视频,腾讯的混元大模型则能生成16秒视频。

值得注意的是,与可灵发布时间相差不久,极佳科技联手清华大学自动化系所研发的AI视频模型“视界一粟(Yisu)”也公开发布了。据悉,视界一粟拥有模型原生的16秒时长,并可生成1分钟以上视频,主打性能与性价比。

AI改变了作业方式

从2023年到2024年,AI的飞速成长为视频产业链打开了一扇新的窗户。谈及AI视频大模型,亦是“喜忧参半”。

在看到AI视频模型的颠覆性迭代后,演员、电影制片人兼制片厂老板泰勒·佩里 (Tyler Perry)为此搁置了耗资8亿美元的制片厂扩建计划。“当我看到它时,我立刻想到了每个行业中会受此影响的人,包括演员、配音和编辑。我认为这会触及到我们每个人的行业。”佩里曾表示。

此前,佩里已经在两部电影中运用了AI技术。他谈到,通过人工智能的特效加持,仅仅在老化妆容的部分就省略了数个小时。

未来, “创意”在视频行业的价值将大大提升。一位视频制作从业者告诉21世纪经济报道记者,AI的出现,极大降低了视频制作难度,对创作者个人审美和创意的考验随之提升。

受到冲击的并非只有影视行业。

一位在广告公司工作的宣传海报设计师向21世纪经济报道记者透露,一些比较简单的海报已经可以用AI生成,后期再进行人工修饰,这样的制作过程省略了许多以往制作海报的繁琐步骤。“人工智能的出现的确为我们的工作提供了一把趁手的工具。”她评价说。

如果有创作者拥有好的想法而苦于经费不足或是技术问题,那么视频生成AI或许能帮助创作者把他们天马行空的想法变为现实。

但事物本身具有两面性,AI同样如此。

从事原画工作的一位场景概念设计师告诉21世纪经济报道记者,由于ChatGPT、Midjourney及国内的竞品等AI生成软件的出现,许多美术公司已经将“会用AI”纳入招聘需求,能够熟练运用AI是跨入公司的第一道门槛。

“AI工具也加速了人员优化,毕竟它们产出快、成本低、可以反复调试。”前述人士表示。

在欣赏过央视播出的AIGC诗词动画《千秋诗颂》后,一位动画专业的高校学生表示,AI特效能力让他反思起自己的专业能力。“AI所创作的动画目前已经能够达到比较完整的程度,并且还在持续发展。我不确定以后是否能够创作出比AI更加优秀的动画作品。”他坦言。

“AI是不可抵挡的时代趋势,我们应该适当地改变教学内容。”一位高校教师表示。

关于AI视频大模型的应用将为视频产业链带来哪些影响,快手视觉生成与互动中心负责人万鹏飞认为,当AI视频生成效果接近图形渲染时,将为特效、游戏、动画行业带来变革;当效果接近视频拍摄时,将对泛视频行业带来新挑战和新机遇。

“此外视频创作者和消费者的界限会逐渐模糊,未来如果有越来越多的视频消费者变成创作者,对于整个视频内容生态的繁荣是非常有帮助的。”万鹏飞说,好技术与好产品之间还存在着巨大的鸿沟,仍有非常多的工作待完成,才能够真正把一个好技术推向市场。

无论如何,AI已经真实改变了视频产业链,接下来,如何用好这把利刃,是行业需要好好思考的问题。

证券之星资讯

2024-06-28

证券之星资讯

2024-06-28

首页 股票 财经 基金 导航