Sora意味着AGI实现将从10年缩短

Sora意味着AGI实现将从10年缩短
年前我在风马牛演讲上分享了大模型十大趋势预测，没想到年还没过完，就验证了好几个，从Gemini、英伟达的Chat With RTX到 OpenAl发布Sora，大家都觉得很炸裂。朋友问我怎么看 Sora，我谈几个观点，总体来说就是我认为 AGI很快会实现，就这几年的事儿了:
第一，科技竞争最终比拼的是让人才密度和深厚积累。很多人说Sora的效果吊打Pika和
Runway。这很正吊，和创业者团队比，
OpenAl 这种有核心技术的公司实力还是非常强劲的。有人认为有了 AI以后创业公司只需要做个体户就行，实际今天再次证明这种想法是非常可笑的。
第二，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。今天很多人谈到 Sora 对影视工业的打击，我倒不觉得是这样，因为机器能生产一个好视频，但视频的主题、脚本和分镜头策划、台词的配合，都需要人的创意，至少需要人给提示词。一个视频或者电影是由无数个60秒组成的。今天Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败TikTok，更可能成为TikTok的创作工具。

第三，我一直说国内大模型发展水平表面看已经接近GPT-3.5了，但实际上跟4.0比还有一年半的差距。而且我相信 OpenAI 手里应该还藏着一些秘密武器，无论是GPT-5，还是机器自我学习自动产生内容，包括AIGC。奥特曼是个营销大师，知道怎样掌握节奏，他们手里的武器并没有全拿出来。这样看来中国跟美国的AI差距可能还在加大。
第四，大语言模型最牛的是，它不是填空机，而是能完整地理解这个世界的知识。这次很多人从技术上、从产品体验上分析Sora，强调它能输出 60 秒视频，保持多镜头的一致性，模拟自然世界和物理规律，实际这些都比较表象，
最重要的是Sora 的技术思路完全不一样。因为
这之前我们做视频做图用的都是Diffusion，你可以把视频看成是多个真实图片的组合，它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在2D 平面上对图形元素进行操作，并没有适用物理定律。但Sora产生的视频里，它能像人一样理解坦克是有巨大冲击力的，坦克能撞毁汽车，而不会出现汽车撞毁坦克这样的情况。所以我理解这次 OpenAl利用它的大语言模型优势，把LLM 和 Diffusion 结合起来训练，让 Sora 实现了对现实世界的理解和对世界的模拟两层能力，这样产生的视频才是真实的，才能跳出2D 的范围模拟真实的物理世界。这都是大模型的功劳。
这也代表未来的方向。有强劲的大模型做底
子，基于对人类语言的理解，对人类知识和世界模型的了解，再叠加很多其他的技术，就可以创造各个领域的超级工具，比如生物医学、蛋白质和基因研究，包括物理、化学、数学的学科研究上，大模型都会发挥作用。这次Sora对物理世界的模拟，至少将会对机器人具身智能和自动驾驶带来巨大的影响。原来的自动驾驶技术过度强调感知层面，而没有工作在认知层面。其实人在驾驶汽车的时候，很多判断是基于对这个世界的理解。比如对方的速度怎么样，能否发生碰撞，碰撞严重性如何，如果没有对世界的理解就很难做出一个真正的无人驾驶。
所以这次 Sora 只是小试牛刀，它展现的不仅仅是一个视频制作的能力，它展现的是大模型对真实世界有了理解和模拟之后，会带来新的成果和突破。
第五，Open Al训练这个模型应该会阅读大量视频。大模型加上Diffusion 技术需要对这个世界进行进一步了解，学习样本就会以视频和摄像头捕捉到的画面为主。一旦人工智能接上摄像头，把所有的电影都看一遍，把YouTube上和 TikTok 的视频都看一遍，对世界的理解将远远超过文字学习，一幅图胜过千言万语，而视频传递的信息量又远远超过一幅图，这就离
AGI真的就不远了，不是10年20年的问题，可能一两年很快就可以实现。

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

Sora意味着AGI实现将从10年缩短

普通用户能使用OpenAI的视频生成工具Sora吗？

谷歌加速修复 AI 助手 Gemini 问题，拒绝响应比例减半

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

普通用户能使用OpenAI的视频生成工具Sora吗？

谷歌加速修复 AI 助手 Gemini 问题，拒绝响应比例减半

OpenAI 阿尔特曼雄心勃勃：筹集 7 万亿美元挣脱芯片桎梏，推动通用人工智能落地

重磅！OpenAI发布文生视频模型Sora，一次可生成1分钟！

OpenAI和谷歌，AI对线中的飞驰人生

Sora 团队负责人称 Sora“还不是一个产品”，短期不会向公众开放

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注