-
内容大纲
如何快速了解Sora文生视频这一强大模型,制作AI短视频,抢占市场先机,赚取第一桶金?
本书包括8章专题内容布局+73个官方视频示例分析+490多张图片全程图解,随书还赠送了8大资源:106分钟同步教学视频+111页PPT教学课件+112组AI视频生成提示词+119个效果文件+57集AI绘画教学视频+56集AI文案写作教学视频+15000多组AI绘画关键词等。具体内容从下面两条线展开。
一条是技能线:从AI短视频的相关技术入手,介绍Sora的概念特点、基本能力、技术原理、模型架构、生成式AI功能、指令编写、提示词库、商业变现等内容,通过学习和实践读者将能够充分发挥Sora的强大功能,创作出令人惊叹的短视频作品,实现自己的创作和商业目标。
一条是案例线:本书非常注重Sora的实际应用,并通过大量的视频案例分析,包括人像风光、动物、植物、幻想、旅行等多种题材,同时涉及动画短片、电影预告片、无人机航拍视频、历史镜头视频、电商广告视频、游戏视频等多个领域,全方位展示了Sora在不同场景下的应用效果。
本书是一本不可多得的AI短视频生成技术指南,适合短视频创作者、影视制作人员、摄影师、市场营销人员、AI技术爱好者与开发者、教育工作者及研究人员等广大群体阅读。此外,本书还可以作为相关培训机构和职业院校的参考教材。 -
作者介绍
明机,AI训练师:对人工智能三要素算法、算力、算据(数据)拥有深厚的研究,熟悉AI算法和模型特性,擅长使用TensorFlow、PyTorch等框架技术进行模型训练与产品开发; AI工程师:对Sora生成连贯视频序列的循环神经网络,Sora处理复杂视觉内容的空间时间补丁,Sora加快视频生成速度的自回归变压器等技术,Sora成为世界模拟器等技术掌握颇深; AI先行者:AI提示词库创作者,首批应用ChatGPT、gemini、Stable Diffusion、Midjourney、DALLoE、Firefly、Sora、Pika、Runway等AI工具的从业人员,擅长AI文案编写、AI绘画与AI视频生成训练。 -
目录
第1章 认识Sora:强大的人工智能视频生成模型
1.1 Sora是什么
1.1.1 Sora的基本介绍
【示例1】:走在东京街头的时尚女性
1.1.2 Sora的功能特点
【示例2】:穿过东京郊区的火车窗外的倒影
1.1.3 Sora的竞品对比
【示例3】:坐在天空中的一片云上看书的年轻人
1.1.4 Sora的核心优势
1.1.5 Sora的创意用途
【示例4】:培养皿里的竹林和奔跑的熊猫
1.2 面对Sora,我们该思考的5个问题
1.2.1 文生视频模型为什么会火
【示例5】:在日落时分惬意地漫步
1.2.2 Sora的发布意味着什么
【示例6】:手机镜头下的未来城市风貌
1.2.3 我们与Sora有何关系
【示例7】:“云人闪电”的科幻电影片段
1.2.4 我们该如何应对Sora
1.2.5 普通人该怎么入局
【示例8】:冬日长毛猛犸象的壮丽景色
第2章 能力解析:Sora如何高效地生成视频
2.1 Sora的技术创新点
2.1.1 支持多样化视频格式
【示例9】:在大海中游动的海龟
2.1.2 改进的画面构图和框架
【示例10】:兔子和松鼠的奇妙混合物
2.1.3 语言理解与视频生成
【示例11】:不同的人物在不同的城市散步
2.1.4 多模态输入处理
【示例12】:无人机环绕拍摄的海边建筑
2.1.5 可变的持续时间、分辨率、宽高比
【示例13】:白发男人的特写镜头
2.2 Sora强大的视频生成能力
2.2.1 3D一致性:以3D的视角呈现物体和人物的运动
【示例14】:推镜头展示熙熙攘攘的东京城市街道
【示例15】:摇镜头展示令人惊叹的山水风光
2.2.2 长期一致性:保持视频中的人物和场景的不变
【示例16】:一只达尔马提亚狗从窗户向外看
2.2.3 世界交互模拟:模拟人物与环境之间简单的互动
【示例17】:模拟画家的创作过程
【示例18】:模拟人物吃汉堡的场景
2.2.4 模拟数字世界:探索与创造的无界数字世界
【示例19】:模拟《我的世界》游戏场景
2.2.5 复杂元素生成能力:打造出逼真的虚拟场景
【示例20】:一大堆老式电视播放着不同的节目
【示例21】:逼真的动画特写场景
2.2.6 多镜头生成能力:呈现出丰富的视觉盛宴
【示例22】:用不同的镜头展示的机器人
2.3 Sora面临的一些局限性和挑战
2.3.1 模拟物理世界的局限性
【示例23】:破碎的玻璃杯
2.3.2 生成长视频的难度
【示例24】:在沙漠中发现的塑料椅子
【示例25】:篮球通过篮筐后爆炸
2.3.3 理解复杂提示词的准确性
【示例26】:庆祝生日的温馨家庭场景
2.3.4 训练模型的复杂性
【示例27】:35毫米电影风格的跑步动作场景
2.3.5 提升视频生成的时效性
【示例28】:偏僻路上小狼嬉戏的场景
第3章 技术原理:解析Sora的技术特性与优势
3.1 解析Sora的技术原理
3.1.1 Sora如何根据文本生成内容——Diffusion模型
3.1.2 Sora如何处理复杂视觉内容——时间空间补丁
3.1.3 Sora如何生成连贯的视频序列——循环神经网络
【示例29】:中国农历新年庆祝视频
3.1.4 Sora如何生成不同风格的视频——生成对抗网络
3.1.5 Sora如何加快视频的生成速度——自回归变换器
3.2 Sora在视频生成过程中的3个关键步骤
3.2.1 步骤1:视频压缩网络
【示例30】:一窝金毛寻回犬在雪地里玩耍
3.2.2 步骤2:时间空间潜在补丁提取
3.2.3 步骤3:视频生成的Transformer模型
【示例31】:淘金热期间加利福尼亚州的历史录像
3.3 Sora技术的未来展望
3.3.1 技术革新与性能升级:速度更快、稳定性更强、体验更流畅
3.3.2 跨领域融合与拓展应用:让生活更加多姿多彩、充满无限可能
第4章 模型架构:Sora的基础是世界通用模型
4.1 认识世界通用模型
4.1.1 什么是世界通用模型
4.1.2 世界通用模型的作用是什么
【示例32】:Santorini的航拍建筑美景
4.1.3 多模态模型促进AI更好地理解真实世界
【示例33】:一列蒸汽火车行驶在高架桥上
4.1.4 世界通用模型打破了虚拟与现实的边界
【示例34】:惬意漫步的南非妇女
4.1.5 世界通用模型的代表——Runway
4.2 Sora将视频生成模型作为世界模拟器
4.2.1 用大语言模型的方法理解视频
【示例35】:一群纸飞机在茂密的丛林中飞舞
【示例36】:愉快漫步的老人
【示例37】:白雪皑皑的东京城
4.2.2 实现对物理世界的“涌现”
【示例38】:可爱的达尔马提亚狗
4.2.3 模拟真实物理世界的运动
【示例39】:壮观的海岸风光
4.3 Sora模型训练的核心技术
4.3.1 自然语言理解
4.3.2 生成式人工智能模型
【示例40】:老年人的悠闲生活与美丽的自然风光
4.3.3 场景构建与精细化渲染
4.3.4 AI驱动的动画技术
【示例41】:眨眼的特写镜头
4.3.5 个性化定制与持续优化
【示例42】:不同风格的袋鼠漫步场景
第5章 功能详解:使用Sora快速生成视频
5.1 Sora的文生视频功能
5.1.1 Sora的注册方法
5.1.2 申请Sora的内测资格
5.1.3 使用文生视频功能
5.2 Sora的其他AI生成功能
5.2.1 图生视频:为DALL·E图像制作动画
【示例43】:活泼可爱的柴犬
【示例44】:一个多样化的怪物家族
【示例45】:由字母组成的云朵图片
【示例46】:冲浪者在历史大厅中驾驭巨浪
5.2.2 视频生视频:向前或向后扩展视频的时长
【示例47】:旧金山的高空城市缆车
【示例48】:永无止境的骑行场景
5.2.3 视频到视频编辑:转换视频的风格和环境
【示例49】:飞驰在丛林中的跑车
5.2.4 连接视频功能:创建神奇的无缝过渡效果
【示例50】:无人机视频与蝴蝶视频的连接
【示例51】:越野车视频与豹子视频的连接
5.2.5 图像生成功能:为用户带来卓越的体验
第6章 指令编写:优化提示词提升Sora的生成效果
6.1 编写Sora提示词的基础思路
6.1.1 明确具体的视频元素
【示例52】:一只在拍摄视频的柯基犬
6.1.2 详细描述场景细节
【示例53】:一朵花生长的定格动画
6.1.3 创造性地使用提示词
【示例54】:一群鱼在纽约的街道上游动
6.1.4 构思引人入胜的角色和情节
【示例55】:一只猫叫醒正在睡觉的主人
6.1.5 用逐步引导的方式构建提示词
【示例56】:挤满了工人的建筑工地
6.2 Sora提示词的编写技巧
6.2.1 如何选择Sora的提示词
【示例57】:基纳巴丹干河上的野生动物
6.2.2 Sora提示词的编写顺序
【示例58】:美术馆内的艺术盛宴
6.2.3 编写Sora提示词的注意事项
【示例59】:跳迪斯科舞的卡通袋鼠
第7章 提示词库:打造专业级视频效果的要素
7.1 Sora内容型提示词
7.1.1 主体特征
【示例60】:在南极洲愉快漫步的女人
【示例61】:不同主体特征的视频效果
7.1.2 场景特征
【示例62】:色彩斑斓的鱼类和海洋生物
7.1.3 艺术风格
【示例63】:太空冒险故事的电影预告片
7.2 Sora标准化提示词
7.2.1 画面构图
【示例64】:变色龙的特写镜头
7.2.2 视线角度
【示例65】:维多利亚冠鸽的侧面视角
7.2.3 画面景别
【示例66】:玻璃球体里的小矮人
7.2.4 色彩色调
【示例67】:在茂密的花园里奔跑的虎斑猫
7.2.5 环境光线
【示例68】:月光下的狼嚎剪影动画
【示例69】:在霓虹灯城市中嬉戏的小狗
7.2.6 镜头参数
【示例70】:深海中的大章鱼和帝王蟹之战
第8章 商业变现:从文本到视频的创收之路
8.1 Sora未来可能的商业场景应用
8.1.1 电商产品展示
8.1.2 视频广告制作
8.1.3 游戏开发和动画片制作
【示例71】:展示游戏《我的世界》
【示例72】:水獭的热带冲浪冒险
8.1.4 电影电视节目制作
【示例73】:海盗船激战瞬间
8.1.5 教育内容制作
8.2 如何利用Sora实现多渠道变现
8.2.1 广告收入与赞助变现
8.2.2 知识付费变现
8.2.3 提示词交易变现
8.2.4 内容创作变现
8.2.5 Sora的其他变现方式
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
