《AI视频生成研究报告》显示: AI视频生成未来可期
2024年,AI视频生成成为最受关注的领域之一,从年初Sora亮相到Luma的Dream Machine、Runway的Gen-3 Alpha模型,以及国内快手的可灵Web端,AI视频生成技术以其独特的视频生成能力和灵活性,正逐步改变着内容创作和信息传递的方式。由量子位智库日前发布的《AI视频生成研究报告》(以下简称《报告》)就指出,AI视频市场潜力巨大,未来发展前景广阔,随着技术的成熟,AI视频生成有望在更多领域得到应用,推动相关行业的创新和发展,但AI视频生成的发展也面临诸多挑战,需要警惕和解决。
技术侧推动发展
AI视频生成成为新媒体领域中不可忽视的力量,得益于人工智能技术的飞速发展。对此,《报告》指出,目前大规模各模态呈现的总体情况为多模态发展趋势清晰,文本、图像商业化规模和成熟度较高,AI视频生成正在迅速发展,但由于技术复杂,对于算力、数据等资源要求较高,成熟相对文本、图像较慢。
《报告》分析了未来的技术趋势,即“视频生成正在由检索生成、局部生成走向依靠自然语言提示词的全量生成,生成内容更加灵活丰富,应用空间广阔”,“视频生成正由扩散模型主导的格局走向与语言模型结合的路线,Transformer将在视频生成方面发挥主导作用”。
《报告》认为,AI视频生成模型的能力将在算力驱动下快速进步,稳定性、可控性、丰富度将持续提升,解锁更多应用空间。同时,AI视频生成的推理成本也将持续下降,生成速度进一步提高,加速应用层技术扩散和商业化规模增长。
尽管AI视频生成模型不仅限于生成视频内容,或将成为通向AGI的重要路径,但《报告》也指出,目前视频生成技术依然面临多重挑战,其中,算力需求大、数据要求高、算法复杂是目前主要制约视频生成模型能力的三大挑战。
应用侧需求增加
事实上,AI视频生成技术的快速发展,一方面归功于人工智能技术的快速进步,另一方面则应归功于场景的广阔。《报告》提到,2017年到2022年,全球互联网视频流量占消费互联网流量比例从73%增长到82%,而在移动互联网的用户使用总时长占比中,短视频稳居第一位,达28%。同时,移动视频用户规模达10.76亿,月人均时长为64.2小时,视频平台成为流量核心。
《报告》认为,这样的情况让视频流量成为主要的互联网信息流量,视频是移动互联网最大的内容消费形式。《报告》分析,从消费端来看,视频是消费时间最长的内容形态,有丰富的应用的场景和大规模内容分发平台,长期或有诞生超级应用的机会;随着AI视频生成的能力不断提升,AI生成视频占视频消费内容的比例将不断提升,推动内容供给端变革,逐步渗透视频消费市场。
《报告》认为,得出上述结论的主要原因是,AI生成视频的成本远低于各类现有视频内容的制作成本。
《报告》指出,尽管AI视频生成技术已经能够创造出一些优秀视频内容,但目前模型能力不足的问题不能忽视,生成效果尚无法与传统制作方式竞争。
布局端各有侧重
随着AI视频生成的关注度不断提升,以及其巨大的市场需求,众多企业也纷纷开始布局。
《报告》根据目前市面AI视频生成领域的发展现状,将AI视频生成领域的公司分为OpenAI、互联网公司、技术创业公司、内容工具软件、垂类创业公司5类。《报告》通过分析表示,OpenAl聚焦AGI,认为视频模型是世界模拟器、通往AGI的重要路径,有充足的资源和决心重注scaling路线,主要发力模型层,Sora的成功源自其在数据、算法、算力等层面的优势累加,在未来将对模型持续进行迭代部署,引领行业发展。
对于互联网公司而言,《报告》表示,字节跳动强调AI视频生成和核心业务强相关,在战略层面高优先,资源充足保持自研策略,视频生成已经开始初步产品化;阿里则延续了AI方面的总体策略,偏好通过内部自研加对外投资的方式加强在视频生成领域的布局;腾讯主打混元DiT多模态大模型,将支持高质量图片和视频生成,产品化进展较慢;快手推出可灵视频生成大模型,同时匹配生成控制和文生图功能,视频生成效果领先;谷歌、Meta则发表了多项视频生成领域的前沿研究和基础模型,但整体风格偏研究向,产品化进展速度缓慢。
可以看到,AI视频生成技术方兴未艾,各行业不断广泛入局,然而,其在带来技术革命的同时,也需要我们更加谨慎地应对其带来的挑战。
作者:本报记者 张博
来源:《中国新闻出版广电报》
- 2025-01-15
- 2025-01-15
- 2025-01-14
- 2025-01-14
- 2025-01-14
- 2025-01-13
- 2025-01-13
- 2025-01-10
- 2025-01-10
- 2025-01-09
- 2025-01-09
- 2025-01-08