AI模型系列报告：从世界模型看算力需求变化

　　核心观点

　　Sora是第一个表现出"涌现"能力的视频生成模型：随着模型规模增大而出现“理解世界”的能力。虽然许多LLM，如ChatGPT和GPT-4，表现出涌现能力，但在Sora出现之前，展示类似能力的视觉模型一直很少。根据Sora的技术报告，它是第一个表现出确认的涌现能力的视觉模型，标志着计算机视觉领域的一个重要里程碑。

　　Sora的成功源于DiffusionTransformer架构的引入，和过去多年高质量数据的积累。

　　从架构上看，视频生成模型的技术路线开始收敛，Sora的DiffusionTransformer架构证实了有效scale-up也即是增加算力能够对提升视频生成的精细度和效果，是视频生成领域的"GPT-3时刻"。类似于GPT-3证明了更大的训练量、模型参数量、Token数量，训练效果越好。引入了Transformer的Sora也表现出了同样的趋势，OpenAI进行了32x训练量和1x、4x训练量的对比，从结果上看，32x训练量的生成效果远远强于1x和4x的生成效果。在Sora发布后Google、Snap也发布了采用类似技术的视频生成模型，确定了DiffusionTransformer的视频生成路线，并且算力的需求会大大提升。

　　从数据上

声明：本站所有报告及文章，如无特殊说明或标注，均为本站用户发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

文章展示

AI社交行业深度：强用户粘性、高变现潜力赛道，关注头部产品玩法创新

建筑行业2024年春季投资策略：新国九条催化央企市值国改，低空经济AI与铜矿有色弹性大

汽车行业2024年智能底盘行业投资策略系列报告：空气悬架，高附加值集成部件，国产替代新蓝海

传媒行业行业专题研究：360AI浏览器：国内首款真智能浏览器

国海证券新材料产业框架之三：人形机器人带来新材料机遇

AI的内存瓶颈，高壁垒高增速

最热报告

2020信创发展研究报告及60强企业

互联网下一个正循环：从业务、战略、能力看百度下一个五年

“消费与美好生活”调研报告

消费升级背景下零食行业发展报告

2021年中国智慧医疗行业发展研究报告

2020年中国跨境电商供应链专题研究报告

艾瑞咨询：中国VR AR市场研究报告

2020年互联网人才招聘白皮书

食品饮料行业 2013年投资策略

海外疫情重新影响供应链新能源原材料锂、钴价格全面上行——中观行业数据观察