胰腺炎是什么原因引起的| bigbang什么意思| 八月十三号是什么星座| 玉皇大帝和王母娘娘是什么关系| 沉香手串有什么好处| e是什么牌子| 羊下面是什么生肖| 杨桃是什么季节的水果| 吃什么排便顺畅| 无水焗是什么意思| 妇炎康片主要治什么妇科病| 下午四点多是什么时辰| 人民币代码是什么符号| 2005年属什么生肖| 助力车是什么车| 比热容是什么| 镀18k金是什么意思| 胸部痛是什么原因| 男人吃秋葵有什么好处| 饭后痰多是什么原因| 什么地唱| 喝碳酸饮料有什么危害| 心脏房颤吃什么药好| 身上长癣是什么原因| 吃什么可以治痔疮| 回声欠均匀是什么意思| 江小白是什么酒| 多少年婚姻是什么婚| 侄子是什么意思| 月经来了不走是什么原因| 为什么会长结石| 血糖高可以吃什么水果| 洗内裤用什么洗比较好| 1968年五行属什么| 女人山根低代表什么| 洽谈是什么意思| 免疫力和抵抗力有什么区别| 睡几个小时就醒了是什么原因| 入木三分是什么意思| 送男朋友什么礼物合适| 中医为什么下午不把脉| 肌肉痉挛用什么药能治好| 练字用什么笔好| c肽高说明什么| 打喷嚏流鼻涕吃什么药好| 七月份什么星座| 斗鱼吃什么食物| 品保是做什么的| 输液葡萄糖有什么作用| 血糖低吃什么补的最快| 人流后什么叫重体力活| 脂溢性皮炎是什么症状| 什么是小奶狗| 垂爱是什么意思| 中老年吃什么钙片比较好| 贫血严重有什么症状| 滑精是什么意思| 厨娘是什么意思| 血管痉挛吃什么药| 胃复安是什么药| 存在是什么| 3f是什么意思| 什么人容易得类风湿| 什么颜色不显黑| 睡眠不好总做梦是什么原因| 网恋是什么意思| 扁肉是什么| 喝蜂蜜水有什么好处| 办独生子女证需要什么材料| 咳嗽是什么原因| 蔷薇色是什么颜色| 甲状腺球蛋白低是什么意思| 开理疗店需要什么证件| 1207是什么星座| 咳嗽打什么点滴效果好| 小龙虾不能和什么一起吃| 2pcs是什么意思| 爬坡是什么意思| 抗核抗体谱检测查什么的| 看见黄鼠狼有什么预兆| 帆船像什么| 11月27号什么星座| 320是什么意思| 马眼是什么意思| 六六无穷是什么意思| 植树造林的好处是什么| 前列腺钙化是什么意思| 1950年属虎的是什么命| 哪吒妈妈叫什么| 茶油有什么功效| 血氧饱和度低于90有什么危害| 想吃咸的是身体缺什么| 肝实质弥漫性回声改变什么意思| 威化是什么意思| 感冒吃什么| 疮疖是什么样子图片| 死鬼什么意思| 1310是什么意思| 姜黄是什么东西| 5.2号是什么星座| 梦见看病是什么意思| 牙齿酸胀是什么原因| salute什么意思| 处女座男生喜欢什么样的女生| 什么东西能去脸上的斑| 梦见房子倒塌是什么意思| 男孩叫什么名字| 明油是什么油| 肾虚是什么原因造成的| 胃病四联疗法是什么药| 西米是什么做的| 沙弥是什么意思| 为什么身上有红色的痣| 农历六月十四是什么日子| 蛇和什么属相相冲| 水瓜壳煲水有什么功效| 什么药降尿酸最好| 亡羊补牢说明什么道理| 慧眼识珠是什么意思| 黄瓜籽有什么功效| 治飞蚊症用什么眼药水| 十月十二日是什么星座| 鼻炎和鼻窦炎有什么区别| 焯是什么意思| 大虾炒什么菜好吃| 膝盖缝里面疼什么原因| 下体有异味是什么原因| 女人梦见老虎是什么预兆| 肝囊肿是什么意思| 三教九流代表什么生肖| 有什么别有病| gi是什么| 夏枯草有什么作用| 高锰酸钾有什么作用| 什么是冷暴力| 恩赐是什么意思| 吃什么蔬菜可以降血脂| 开颌是什么意思| 开业送什么礼物好| 2月2号是什么星座| 心血管科是看什么病| 背上长痘痘是什么原因| 什么药和酒一起吃必死| 什么床垫好| 歪果仁是什么意思| 清福是什么意思| 湿气重吃什么中药好| 湿气重吃什么能去湿气| 养什么能清理鱼缸粪便| 什么是阴虱| 墨池为什么不爱柔嘉了| 什么样的菊花| flair呈高信号是什么意思| 血压低吃什么补| 什么十分什么| 印度属于什么亚| 武则天属什么生肖| 三伏天吃什么对身体好| 左耳朵痒代表什么预兆| 佛山有什么特产| 膀胱癌早期是什么症状| 睾丸皮痒用什么药| 双侧卵巢显示不清是什么意思| 使节是什么意思| 为什么一吃东西就拉肚子| 腰肌劳损是什么原因引起的| 扑感敏又叫什么名字| 感冒流黄鼻涕吃什么药| 朱元璋是什么朝代| 2009年是什么年| dose是什么意思| 腿上长痣代表什么| 胃不好吃什么水果好| 什么是佝偻病有什么症状| 女人为什么会喷水| 长长的什么| 月经不调吃什么药效果好| 斐乐什么档次| 甘油是什么成分| 调经吃什么药效果最好| 劲酒加红牛有什么功能| 颧骨长斑是什么原因| 双侧乳腺腺病是什么意思| 滞纳金是什么| 中药先煎是什么意思| 学历证是什么| 胃手术后吃什么好| 胃胀气是什么原因引起的| 什么叫绝对值| 窗口期什么意思| 止步不前什么意思| 114514是什么梗| 搬家送什么礼物最好| 大骨节病是一种什么病| 左卵巢囊性结构是什么意思| 长疮是什么原因| 经期可以喝什么| 油嘴滑舌指什么生肖| hpv疫苗什么时候打最好| 机械性窒息死亡是什么意思| 台湾三小是什么意思| 抖s是什么意思| 贻笑大方什么意思| 子宫囊肿严重吗有什么危害| 林彪为什么反革命| 男生13厘米属于什么水平| 浮生若梦什么意思| 尿里有红细胞是什么原因| 栗棕色是什么颜色| 养性是什么意思| 回迁是什么意思| 龙的九个儿子都叫什么名字| 什么是化学性肝损伤| 脾围是什么意思| 观音坐莲什么意思| 吃什么补雌激素最快| 清醒的反义词是什么| 柠檬泡蜂蜜有什么功效| 什么是谈恋爱| 真金白银是什么意思| 腹泻吃什么药见效最快| 糖尿病主食吃什么好| 浙江大学什么专业最好| 香港电话前面加什么| 红糖荷包蛋有什么功效| 甜不辣是什么| 梦见花生是什么意思| 2008是什么年| 亮晶晶的什么填空| 怕空调冷风什么原因| 什么是包皮过长| h2o是什么意思| 子宫彩超能检查出什么| 籺是什么意思| 梦见自己会飞是什么意思| 中央空调什么牌子好| ms是什么| 慢性胃炎吃什么药效果好| 为什么叫印度三哥| 喝什么汤下奶最快最多| 血糖高有什么表现| 大将军衔相当于什么官| 韩束适合什么年龄段的人用| 瓜尔佳氏现在姓什么| 小孩晚上睡觉出汗是什么原因| 意念是什么意思| 桔色搭配什么颜色好看| 两鬓斑白是什么意思| 女性做结扎手术对身体有什么危害| 周公解梦是什么意思| spank是什么意思| 不全性骨折是什么意思| inv是什么意思| 水痘是什么样的| 龙是什么命| 戊肝是什么病| 早上起来后背疼是什么原因| otc药物是什么意思| 梦见妖魔鬼怪是什么意思| 农业户口和居民户口有什么区别| tommy什么牌子| 西贝是什么| 中单是什么| 五道杠是什么牌子| 百度
"); //-->

博客专栏

EEPW首页 > 博客 > OpenAI首个AI视频模型炸裂登场,彻底端掉行业饭碗!60秒一镜到底惊人,世界模型真来了?

洛桑江村齐扎拉分别会见美国参议员戴安斯一行

发布人:传感器技术 时间:2025-08-04 来源:工程师 发布文章
百度 杨大正在老婆郑宜农出柜后支持并透露,婚后某天妻子就坦承性向出柜,确实度过一段很煎熬的日子,甚至夜夜失眠度日,经过反覆的沟通与确认,两人才下定决心重新定义彼此关系,同时放手让爱妻做自己,杨大正在郑宜农被网友攻击时也帮忙出面反击。

【导读】刚刚,OpenAI发布首个AI视频模型Sora,60秒的一镜到底,神级效果生成。网友纷纷惊呼AI视频要变天。

卷疯了卷疯了,短短十几小时内,OpenAI和谷歌接连发布核弹级成果。

国内还没睡的人们,经历了过山车般的疯狂一晚。

就在刚刚,OpenAI突然发布首款文生视频模型——Sora。简单来说就是,AI视频要变天了!

它不仅能够根据文字指令创造出既逼真又充满想象力的场景,而且生成长达1分钟的超长视频,还是一镜到底那种。

Runway Gen 2、Pika等AI视频工具,都还在突破几秒内的连贯性,而OpenAI,已经达到了史诗级的纪录。

60秒的一镜到底,视频中的女主角、背景人物,都达到了惊人的一致性,各种镜头随意切换,人物都是保持了神一般的稳定性。 

,时长00:59

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

OpenAI究竟是怎么做到的?根据官网介绍,「通过一次性为模型提供多帧的预测,我们解决了一个具有挑战性的问题。」

显然,这个王炸级技术有着革命般的意义,连Sam Altman都沉迷到不能自拔!

他不仅疯狂发推安利,而且还亲自下场为网友生成视频:你们随意来prompt,我一一输出。


一位戴着尖顶帽,身披绣有白色星星的蓝色长袍的巫师正在施法,他的一只手射出闪电,另一只手中拿着一本旧书。



在一间拥有电影级灯光设置的充满托斯卡纳乡村风情的厨房里,一位擅长利用社交媒体的奶奶,正在教你制作美味的自制诺奇面。



我们将带你进行一次未来城市的街头巡览,在这里,高科技与自然和谐共处,展现出一种独特的赛博朋克风格。

这座城市洁净无瑕,到处可见的是先进的未来式有轨电车、绚丽的喷泉、巨型的全息投影以及四处巡逻的机器人。

想象一下,一个来自未来的人类导游正带领一群好奇的外星访客,向他们展示人类极致创造力的结晶——这座无与伦比、充满魅力的未来城市。

多项技术破纪录


借助于对语言的深刻理解,Sora能够准确地理解用户指令中所表达的需求,把握这些元素在现实世界中的表现形式。

也因此,Sora创造出的角色,能够表达丰富的情感!

它所制作出的复杂场景,不仅可以包括多个角色,还有特定的动作类型,以及对对象和背景的精确细节描绘。

看,下图中人物的瞳孔、睫毛、皮肤纹理,都逼真到看不出一丝破绽,完全没有AI味儿。

从此,视频和现实究竟还有什么差别?!


Prompt: Extreme close up of a 24 year old woman’s eye blinking, standing in Marrakech during magic hour, cinematic film shot in 70mm, depth of field, vivid colors, cinematic

此外,Sora还能在同一视频中设计出多个镜头,同时保持角色和视觉风格的一致性。

要知道,以前的AI视频,都单镜头生成的。

而这次OpenAI能在多角度的镜头切换中,就能实现对象的一致性,这不得不说是个奇迹!

这种级别的多镜头一致性,是Gen 2和Pika都完全无法企及的……


Prompt: A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.

举个例子:「雪后的东京熙熙攘攘。镜头穿过繁忙的街道,跟随着几位享受着美丽雪景和在附近摊位购物的人们。美丽的樱花瓣伴随着雪花在风中飘舞。」

Sora根据这个提示所呈现的,便是东京在冬日里梦幻的一幕。

无人机的镜头跟随一对悠闲散步的情侣穿梭在街道上,左侧是车辆在河岸路上行驶的声音,右侧是顾客在一排小店之间穿梭的景象。


Prompt: Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.

可以说,Sora的效果已经领先到了恐怖的级别,完全跳出了用冷兵器短兵相接的时代,其他AI视频被彻底干趴。

世界模型成真了??


最最最可怕的一点来了,Sora身上,竟已经有了世界模型的雏形?

通过观察大量数据,它竟然学会了许多关于世界的物理规律。

下面这个片段太令人印象深刻了:prompt中描绘了「一个短毛绒怪物跪在一支红蜡烛旁的动画场景」,同时描述了怪物的动作和视频的氛围。

随后,Sora就创造了一个类似皮克斯作品的生物,它似乎融合了Furby、Gremlin和《怪兽公司》中Sully的DNA。

让人震惊的是,Sora对于毛发纹理物理特性的理解,准确得令人惊掉下巴!

想当初,在《怪兽公司》上映时,皮克斯为了创造出怪物在移动时超级复杂的毛发纹理,可是费了好大一番功夫,技术团队直接连肝几个月。

而这一点,Sora轻而易举地就实现了,而且从没有人教过它!

「它学会了关于 3D 几何形状和一致性的知识,」项目的研究科学家Tim Brooks表示。

「这并非我们预先设定的——它完全是通过观察大量数据自然而然地学会的。」


Prompt: Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. The art style is 3D and realistic, with a focus on lighting and texture. The mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. Its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. The use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.

得益于DALL·E 3所使用的扩散模型,以及GPT-4的Transformer引擎,Sora不仅能够生成满足特定要求的视频,而且能够展示出对电影拍摄语法的自发理解。

这种能力体现在它对讲故事的独特才能上。

例如,在一个以「色彩缤纷的鱼类和海洋生物充斥的,由纸艺精心构建的珊瑚礁世界」为主题的视频中,项目研究员Bill Peebles指出,Sora通过其摄影角度和拍摄时机,成功地推进了故事的发展。

「视频中实际上发生了多次镜头转换——这些镜头并非后期拼接而成,而是模型一气呵成地生成的,」他解释道。「我们并没有特别指令它这么做,它却能自动完成。」


Prompt: A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures.

不过,当前的模型并不完美。它在模拟复杂场景的物理效果上可能会遇到难题,有时也难以准确理解特定情境下的因果关系。比如,某人吃掉饼干的一部分后,饼干可能看起来仍然完整无损。

此外,模型在处理空间细节,如区分左右时可能会出错,也可能在描述随时间变化的事件,如特定的摄影机动作轨迹时,表现不够精确。好在,它还并不完美。否则,虚拟和现实的界限,还能区分得清吗?这不是现实?但是无可否认的是,可怕的事实已经就在面前:一个已经能够理解和模拟现实世界的模型,也就意味着AGI已经不远了。

「唯一真正的视频生成工作」


业内大佬张启煊评价道,「Sora是我目前看到唯一跳脱出空镜头生成、真正的视频生成工作。」在他看来,目前看来Sora跟Pika、Runway是有代差的,视频生成领域终于被OpenAI支配。或许某天3D视频领域,有朝一日也能体会到这种恐惧。

网友们都被震惊到失语:「下一个十年会是疯狂的十年。」

图片

「都结束了,我的饭碗要丢了。」

图片

「整个素材行业都会随着这篇成果的发布而消亡……」

图片

OpenAI就是没法停下干死初创公司的脚步,是吗?

图片

「好莱坞即将发生核爆」。

图片

AI电影制作人和他们目前的项目。


技术介绍


Sora是一种扩散模型,它能够通过从一开始看似静态噪声的视频出发,经过多步骤的噪声去除过程,逐渐生成视频。

Sora不仅能够一次性生成完整的视频,还能延长已生成的视频。

通过让模型能够预见多帧内容,团队成功克服了确保视频中的主体即便暂时消失也能保持一致性的难题。

与GPT模型类似,Sora采用了Transformer架构,从而实现了卓越的性能扩展。

OpenAI把视频和图像分解为较小的数据单元——「patches」,每个「patches」相当于GPT中的一个「token」。

这种统一的数据表示方法能够在更广泛的视觉数据上训练扩散Transformer,覆盖了不同的持续时间、分辨率和纵横比。

Sora基于DALL·E和GPT模型的研究成果,采用了DALL·E 3的重标注技术,通过为视觉训练数据生成详细描述的标题,使模型更加准确地遵循用户的文本指令生成视频。

除了能根据文本指令生成视频外,这款模型还能将现有的静态图像转化成视频,精确细致地赋予图像中内容以生动的动画。模型还能扩展现有视频或补全缺失的帧。

Sora为理解和模拟现实世界的模型奠定了基础,对此OpenAI认为这是实现通用人工智能(AGI)的重要步骤。

作品欣赏


一列火车穿越东京郊区时,窗户上反射出的迷人景象。


Prompt: Reflections in the window of a train traveling through the Tokyo suburbs.

在雪地草原上,几只巨大的羊毛猛犸象缓缓前行,它们长长的毛皮在微风中轻轻飘扬。远处是雪覆盖的树木和雄伟的雪山,午后的阳光穿透薄云,给这个场景增添了一抹温暖的光彩。低角度的拍摄令这些庞大的毛茸茸动物显得尤为壮观,景深效果引人入胜。


Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.

无人机从空中俯瞰大苏尔加雷角海滩附近的崎岖悬崖,海浪冲击着岩石,形成白色的浪尖,落日的金色光辉照亮了岩石海岸。远处有一个小岛上立着灯塔,悬崖边缘覆盖着绿色植被。从道路到海滩的陡峭下降和悬崖边缘凸出的景象,展现了海岸的原始美丽和太平洋海岸公路的崎岖风景。


Prompt: Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance, and green shrubbery covers the cliff’s edge. The steep drop from the road down to the beach is a dramatic feat, with the cliff’s edges jutting out over the sea. This is a view that captures the raw beauty of the coast and the rugged landscape of the Pacific Coast Highway.

蓝色时刻下的圣托里尼岛航拍视图,展现了白色基克拉迪建筑和蓝色圆顶的绝美建筑。火山口的景色令人叹为观止,灯光营造出一种美丽而宁静的氛围。


Prompt: Aerial view of Santorini during the blue hour, showcasing the stunning architecture of white Cycladic buildings with blue domes. The caldera views are breathtaking, and the lighting creates a beautiful, serene atmosphere.

一位20多岁的年轻人坐在天空中的一朵云上,沉浸在书本中。


Prompt: A young man at his 20s is sitting on a piece of cloud in the sky, reading a book.

一群活泼的金毛寻回犬小狗在银白色的雪地上嬉戏,它们好奇的小脑袋时而从雪地中探出,被雪花点缀,萌态十足。


Prompt: A litter of golden retriever puppies playing in the snow. Their heads pop out of the snow, covered in.

在意大利布拉诺一排排鲜艳的彩色建筑中,一只可爱的斑点狗正通过窗户好奇地望向外面。与此同时,街道上人来人往,有的步行,有的骑行。


Prompt: The camera directly faces colorful buildings in burano italy. An adorable dalmation looks through a window on a building on the ground floor. Many people are walking and cycling along the canal streets in front of the buildings.

一幅充满工人、设备和重型机械的建筑工地的移轴摄影。


Prompt: Tiltshift of a construction site filled with workers, equipment, and heavy machinery.

在一个培养皿中,生长着一片竹林,其中小熊猫们在欢快地奔跑。


Prompt: A petri dish with a bamboo forest growing within it that has tiny red pandas running around.

一只卡通袋鼠正在迪斯科舞池中跳舞。


Prompt: A cartoon kangaroo disco dances.

在一杯咖啡中,两艘海盗船展开了激烈的战斗,超写实的近景视频。


Prompt: Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee.

大佬猜测:游戏引擎加持?


Pytorch联合创始人Soumith Chintala猜测道,「根据Sam Altman发布的所有用户请求视频,Sora似乎是由游戏引擎提供支持,并为游戏引擎生成作品和参数」。

图片

英伟达高级科学家Jim Fan对全新Sora模型,发表了一些自己的观点:

Sora是一个数据驱动的物理引擎。它是对许多世界的模拟,无论是真实的,还是虚构的。该模拟器通过去噪和梯度学习方式,学习了复杂的渲染、「直观的」物理、长期推理和语义理解。

如果Sora使用虚幻引擎5接受过大量合成数据的训练,我不会感到惊讶的。必须如此!


同样,爱丁堡大学的博士生Yao Fu表示,「生成式模型学习生成数据的算法,而不是记住数据本身。就像语言模型编码生成语言的算法(在你的大脑中)一样,视频模型编码生成视频流的物理引擎。语言模型可以视为近似人脑,而视频模型近似物理世界」。


重塑视频行业


虽然,文本转视频技术要威胁到传统电影制作,可能还需要很长时间——

你无法通过简单地将120个Sora生成的一分钟视频拼接起来制作出连贯的电影,因为这些模型无法确保内容的连续性。


但是,这并不妨碍Sora和类似的程序彻底改变TikTok等社交平台。

「制作一部专业电影需要大量的昂贵设备。」Peebles 说,「这个模型将让普通人在社交媒体上制作出高质量的视频内容成为可能。」

 


*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。



关键词: OpenAI

技术专区

关闭
柔式按摩是什么意思 菁字五行属什么 天津是什么省 贪嗔痴是什么意思 尿白蛋白高是什么原因
什么是框架协议 脚为什么脱皮 image是什么意思 中阴身是什么意思 母亲节要送什么礼物
金多水浊什么意思 火加木是什么字 抱怨是什么意思 脚掌脱皮是什么原因 沙茶酱什么味道
西红柿什么时候成熟 淋巴结发炎吃什么药 嗓子疼有痰吃什么药 阳绿翡翠属于什么级别 piv是什么病毒
12月9号是什么星座hcv8jop7ns0r.cn 肺胀是什么病hcv9jop8ns0r.cn 三个又读什么onlinewuye.com 胸口痛吃什么药hcv9jop6ns3r.cn 汗疱疹是什么引起的gysmod.com
小孩耳朵痛什么原因hcv9jop3ns1r.cn 角膜炎是什么症状hcv8jop2ns1r.cn 莱赛尔纤维是什么面料hcv8jop0ns4r.cn 女人性高潮是什么感觉hcv9jop8ns3r.cn 清宫和刮宫有什么区别hcv8jop3ns9r.cn
肠镜什么情况下取活检hcv8jop0ns9r.cn 年上和年下是什么意思zhongyiyatai.com 致电是什么意思hcv8jop3ns5r.cn tod是什么hcv8jop1ns4r.cn 什么叫射频消融hcv7jop7ns1r.cn
想留不能留才最寂寞是什么歌hcv8jop9ns1r.cn cfp是什么证书hcv7jop6ns7r.cn 刺激是什么意思wmyky.com 什么是基本养老金hcv8jop8ns3r.cn 孕妇梦见下雨是什么意思hcv9jop5ns8r.cn
百度