出道即巅峰,OpenAI的Sora怎么了?

发布日期:2024-09-18 14:24

来源类型:一禅小和尚 | 作者:唐静

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【管家婆一码一肖100中奖】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【2023资料免费大全】【2O24澳彩管家婆资料传真】
【494949澳门今晚开什么】 【2024新澳免费资料】 【4949澳门精准免费大全】

文丨寄语

AI视频模型中,国内可灵、海螺等崭露头角,国外Runway Gen-3 Alpha、Dream Machine也爆火,不仅接近Sora实力,还可以免费用。

而曾名噪一时,大模型霸主OpenAI的Sora却迟迟不发,究竟是何原因?

出道即巅峰

近日,有外媒称,Sora可能在研究上陷入了困境。

其背后原因,一方面是必须要和政府深入探讨安全风险;另一方面则亟需好莱坞和艺术家们的入驻合作。有网友对此猜测,Sora必须接受审查才能放出。

这么看来,OpenAI首席技术官Mira Murati曾表示,“可以肯定的是,Sora将在今年发布”,不知道今年是否能如期而至。此外, Murati还表示,目前Sora要比现有的其他AI系统所花费的成本昂贵得多,降低生成成本是当务之急。

2024年2月16日,OpenAI在AI生成视频领域扔出自己的AI文生视频大模型“王炸”Sora,但OpenAI并未单纯将其视为视频模型,而是作为“世界模拟器。”

Sora的名字取自日语“空”,意为天空。OpenAI团队表示,选用该词是因其让人联想到无限的创作潜力。

Sora的优点是可以根据用户输入的提示词,快速制作最长一分钟、准确反映用户提示、可一镜到底的视频(其他AI视频工具当时还在突破几秒内的连贯性),视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景。”

雨后东京街头,Sora出圈代表作。

行驶中的列车窗外偶遇遮挡,车内人物倒影短暂出现显得惊艳。

Sora一经发布,引起舆论的滔天巨浪。

有人说,端掉行业饭碗,又有人要要失业了,整个行业都要消亡了。

有人问,中国作为追赶者差在哪里?Sora“生成”了一个怎样的新世界?

有人感叹,AI创业者和投资人们一夜无眠,Sora引领AI视频生成新纪元。

总的来说,Sora的优势主要是三方面:

第一:可以生成长达60秒钟的视频,包括多个角色、特定类型动作和主题背景;

第二:可以在单个生成的视频中创建多个镜头,模拟复杂的摄像机运镜,实现多角度镜头无缝切换,整个画面干净流畅,同时准确地保持角色和视觉风格;

第三:使用的基础模型架构,能够理解物体在现实世界中的物理规律和存在方式,内容更符合逻辑,令人信服。

Sora的推出,确实让大家看到惊艳的AI视频生成效果,不少人用“Sora前时代”和“Sora后时代”来描述Sora的亮眼。对比国内海螺和可灵,Sora也是可圈可点。

一只白色和橙色的虎斑猫在大雨中穿过后街小巷寻找庇护。

效果不相上下吧。

微距镜头的叶子,微小的火车移动通过它的叶脉。

小编觉得海螺的更唯美,可灵费力不讨好,力图还原轨道,却让人感觉有点诡异。

一条雄伟的白龙的特写,有珍珠般的银边鳞片,冰冷的蓝眼睛,优雅的象牙角,薄雾般的气息,在柔和模糊的背景下,重点关注细节面部特征和纹理鳞片。

大家自行感受,Sora版卡姿兰大眼睛实在一言难尽!

在大苏尔的garay角海滩上,海浪拍打着崎岖的悬崖,无人机尽收眼底。汹涌的蓝色海水形成了白色的波浪,落日的金色光芒照亮了岩石海岸,远处坐落着一个带灯塔的小岛。

感觉OpenAI的无人机视角更真实一些。

两艘海盗船在一杯咖啡里航行时相互打斗的逼真特写视频。

自行感受吧。

中国农历新年舞龙。

这个属实难绷,传统艺能玩出了新姿势,看来舞龙素材国内还没学习到,国外先投喂了。

赛博朋克背景下机器人的生活故事。

感觉各有各的故事风格呢。

短中期内,难以实现颠覆

Sora的姗姗来迟并非情理之外。在Sora发布之时,OpenAI就直面其当前存在的弱点,毫不避讳,指出Sora可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

确实如此,翻车的案例也不少。例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失,太魔幻了。

如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。

这么看来,Sora可能难以准确模拟复杂场景的物理原理,无法理解因果关系,混淆提示的空间细节,难以精确描述随着时间推移发生的事件。

所以,当下OpenAI的重点之一,正是教 AI 理解和模拟运动中的物理世界,通过训练模型来让AI理解人们现实世界交互的问题。

Sora可能引发侵权争议以及潜在法律问题。Sora在训练过程中使用了YouTube数据训练模型等相关素材,即使只是用这些素材进行训练,也可能存在潜在的侵权风险,面临相关的潜在法律问题。

而Sora所生成的视频版权是否受到保护更是尚不明确,这些视频的主体可能面临侵权索赔和版权保护追溯的风险。这些都使得Sora无法快速进入大众视野。

当然,不得不提的是Sora引发的关于虚假信息传播的争议。

Sora的视频生成效果已经达到了以假乱真,人们“眼见为实”的传统已经不太可靠,AI视频生成带来一系列社会问题,如视频证据真实性和有效性的验证难题。

确实,在Sora问世前已有多起利用AI伪造视频进行诈骗的案例引发社会关注,Sora类工具的普及可能会进一步降低制作高质量虚假视频的门槛,加剧虚假信息的传播。

网络上的合成内容必将随着这些技术的发展而大量存在,这不仅要求人们在技术上持续改进,还需建立更全面的治理体系来有效应对虚假信息的挑战。

Sora刚推出之时,大家在赞叹颠覆性革命的同时,又直言国内在科技竞争中的乏力。

现在国内可灵、海螺的开放,是不是在AI视频生成中扳回一局?

技术一直在进步,而人们所能做的只有一件事,那就是保持创新。

笃连忠:

7秒前:一条雄伟的白龙的特写,有珍珠般的银边鳞片,冰冷的蓝眼睛,优雅的象牙角,薄雾般的气息,在柔和模糊的背景下,重点关注细节面部特征和纹理鳞片。

Sanábio:

1秒前:总的来说,Sora的优势主要是三方面:第一:可以生成长达60秒钟的视频,包括多个角色、特定类型动作和主题背景;第二:可以在单个生成的视频中创建多个镜头,模拟复杂的摄像机运镜,实现多角度镜头无缝切换,整个画面干净流畅,同时准确地保持角色和视觉风格;第三:使用的基础模型架构,能够理解物体在现实世界中的物理规律和存在方式,内容更符合逻辑,令人信服。

恬恬:

8秒前:小编觉得海螺的更唯美,可灵费力不讨好,力图还原轨道,却让人感觉有点诡异。

Buscombe:

7秒前:Sora的优点是可以根据用户输入的提示词,快速制作最长一分钟、准确反映用户提示、可一镜到底的视频(其他AI视频工具当时还在突破几秒内的连贯性),视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景。