Sora来了会砸掉谁的饭碗?
国内不少企业提早布局,内容创作的蓝领工作将被替代
输入寥寥数语便能生成效果炸裂的60秒视频!美国开放人工智能研究中心(OpenAI)推出的视频生成模型Sora近日震惊全球。
OpenAI 推 出ChatGPT才过去一年多,就再度扔出一枚重磅炸弹。“文生视频”AI模型Sora的惊艳之处在哪儿?对行业有何影响?存在哪些隐患?
Sora有何本领?
Sora理解、模拟真实世界加速通用人工智能的实现
Sora生成的多条短视频“大片”在全网刷屏,场景逼真丝滑、细节丰富。
这是OpenAI首次进军AI视频生成领域。据公司介绍,Sora使用Transformer架构,可根据文本指令创建现实且富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。
换句话说,给Sora一些提示语,它就能生产出一条高质量短视频。一起感受一下Sora的创作实力。
OpenAI官网发布的Sora生成视频图像显示,一辆SUV行驶在盘山公路上。
Sora还能够根据静态图像生成视频,扩展现有视频或填充缺失的帧。
OpenAI说,Sora能深刻地理解语言,不仅理解用户文本提示,还理解所述事物在物理世界中的存在方式。“我们正在教授人工智能理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要与现实世界交互的问题。”
不过,OpenAI官网晒出的视频作品是Sora创造的平均水准还是最高水准呢?
OpenAI承认,目前Sora生成视频中可能包含不合逻辑的图像,混淆左右等空间细节,难以准确模拟复杂场景的物理原理和因果关系实例等。例如,一个人可能咬了一口饼干,但饼干上没有咬痕。不过,随着算力增强、模型改进,人们可能会在短期内获得更加完善、先进的视频生成功能。
差距有多大?
国内不少企业提早布局
在AI视频领域,除了国外的竞争者外,国内也有不少企业已经入局。360创始人周鸿祎在其社交平台发布对Sora的评论时表示,国内企业跟OpenAI之间的差距,“表面看起来是离3.5比较近了。但实际上跟4.0比有一年半的差距……我觉得奥特曼是一个营销大师,知道怎么样掌握节奏,就从这儿来看,中国跟美国的AI的差距在加大。”
对于国内、国外AI行业的差距,YY联合创始人、天使投资人曹津表示,国内单纯AI内容的辅助创作工具,相对而言差距较小,“但通用AI或AGI的差距较大,甚至有逐渐拉大差距的趋势,是科研、数据、算力的整体差距落后较多,需要业内人士共同努力。”
去年3月,腾讯发布了AI智能创作助手“腾讯智影”。“智影数字人”是腾讯智影最核心的功能,用户只需要输入文本或音频内容,几分钟内即可生成数字人播报视频。腾讯智影还接入了数字人直播,智影数字人可以直接替代真人,实现7×24小时不间断开播。
其他高校、企业也在申请文生视频相关专利。天眼查数据显示,近日,清华大学申请的“一种定制化多主体文生视频方法、装置、设备及介质”专利公布。摘要显示,该申请涉及神经网络技术领域,基于第一损失、第二损失与第三损失对文生视频模型的参数进行优化,使优化的模型基于文本描述生成视频中的图像时,文本描述与定制化主体保持一致,且在每个主体生成过程中的特征不会发生混淆的同时消除合成痕迹。
此外,度小满科技(北京)有限公司也于2023年8月申请“文生视频生成方法、装置、电子设备及可读存储介质”专利,该申请已于同年11月公布,其能够以极低的资源实现任意长度长视频的生成。
万兴科技AI创新中心总经理齐镗泉指出,一方面,Sora对于当前视频类大模型的技术选型有较大的冲击,它验证了世界模型可行性,验证了大模型做视频生成的可行性,也进一步验证了在当今无视频不传播的时代,“视频+大模型”的应用市场空间扩展;另一方面,当前大模型进入2.0时代,一定是从全球化走向本土,无法指望一个大模型解决全世界的问题,算力本地布局、更本土化的数据、更本土化的应用一定是大势所趋。
可能砸掉谁的饭碗?
内容创作的蓝领工作将被替代
一些分析人士认为,So-ra再次凸显人工智能技术进步对现实生活和传统行业的深远影响。人工智能在视频生成领域的巨大发展前景为塑造影视产业新业态打开大门的同时,恐将颠覆现存影视产业。
Sora推出第二天,主营图像处理、视频制作软件的奥多比公司股价应声下跌超过7%。
好莱坞去年遭遇63年来首次编剧和演员全行业罢工,因为该行业的部分工作机会可能被人工智能取代。Sora横空出世让这一威胁变得更迫近和真切。
齐镗泉认为,Sora有望开启一个全新的视觉叙事时代,大大降低用户创作视频的门槛,“相信很快国内外各视频类平台,会出现不少Al原生Short视频,并会辐射影响到诸如视频剪辑、视觉特效、音乐MV等多个行业,视频内容个体化时代正在加速到来。”
曹津指出,视频内容的影响和应用,还是要回到内容的本质上,内容要好看好听好玩,“AI工具帮助我们提高了效率,扩充了知识库。但最终,还是基于人类的审美,依赖人类的创意,依托不同的文化。”他认为,内容创作的蓝领工作无疑将被替代。
带来那些新职业?
学会用工具的高级从业者会出现
周鸿祎认为,Sora的面世并不会打击影视工业,人的创意仍然非常重要,但他指出“对电影预告片、广告业、短视频行业可能会有巨大的颠覆,但我还是坚持说,这东西也未必就能击败(替代)TikTok,它可能成为TikTok(平台)更多内容创作者的创作工具。”
谦寻控股CIO廖俊龙表示,对于内容创作者来说,Sora能够进一步降低制作的难度和成本,过去需要依赖经验丰富的团队创作精致的内容,现在通过AI可以更轻松低成本实现,未来的内容市场会呈现更丰富的场景,也大大降低了从业门槛。
对于大众担心的Sora会抢走工作的疑虑,廖俊龙指出,“学会用工具的高级从业者会出现”。他认为,AI视频大规模的应用“还需要一些时间,但不会很久”。
乐正传媒副总裁彭侃表示,Sora可以辅助进行影视创作,在短视频、纪录片、专题片中,都能得到应用。他指出,将来可能会催生一种新职业,就是需要懂影视美学的人作为“提词者”和人工智能对话,“总体来说,中文的人工智能工肯定跟英文的差距很大,所以短时间内还是要通过英文工作。所以我认为,对于影视专业的学生来说,要提高英文写作的能力,否则就很难去和最先进的人工智能工具对话。
边界何在?
让伪造更逼真难辨
OpenAI在Sora技术报告的标题中写道,视频生成模型是“世界模拟器”。
如果世界可以被模拟,那么真与假的边界何在?不少业内人士担心,Sora将为“深度伪造”(Deepfake)技术推波助澜。加利福尼亚大学伯克利分校信息学院副院长法里德表示:“当新闻、图像、音频、视频——任何事情都可以伪造时,那么在那个世界里,就没有什么是真实的。”
针对造假顾虑,OpenAI称在真正面向公众推出产品时,将确保生成视频包含来源元数据,并推出检测视频真伪的工具。OpenAI还承诺,在产品中使用Sora前将采取安全措施,包括由“错误信息、仇恨内容和偏见等领域的专家”对模型进行对抗性测试以评估危害或风险;核查并拒绝包含极端暴力、性内容、仇恨图像、他人IP等文本输入提示等。
不过,OpenAI承认,即便进行了广泛的研究和测试,“我们无法预测人们使用我们技术的所有有益方式和滥用我们技术的所有方式”。
能管得住吗?
仅靠企业无法确保安全
科技领域颠覆式创新不断涌现,如何实现拥抱技术进步和确保社会安全的平衡,越来越受到各界关注。
OpenAI表示,将与世界各地的政策制定者、教育工作者和艺术家合作,了解他们的担忧,确定Sora的积极使用案例,并认为从现实世界的使用中学习是创建和发布越来越安全的人工智能系统的关键组成部分。
业内人士指出,在当下治理框架、管控措施都未跟上的情况下,仅靠企业恐无法提供社会所需的人工智能安全性和信任度。
(综合新华社、南方都市报)