在人工智能技术的飞速发展中,视频生成技术已成为一个令人瞩目的领域。2024年6月6日,快手公司推出了一款名为“快手可灵”的AI视频生成大模型,它不仅是中国版的Sora,更是在技术上实现了重大突破。这款由快手AI团队自研的产品,基于快手在视频技术方面的深厚积累,采用了类似Sora的DiT技术路线,并结合了多项自研技术创新,效果对标Sora,展现了国产AI视频模型的强大技术实力。

技术革新:原生文生视频技术

快手可灵采用了原生的文生视频技术路线,这一创新替代了传统的图像生成加时序模块的组合方式。这种技术的应用使得可灵在生成视频的时长和帧率上都有了显著提升,能够准确处理复杂的运动场景。在完成度上,可灵能够模拟物理世界的特性,完成大幅度的合理运动;在创新度上,它具备强大的概念组合能力和想象力,能够将用户丰富的想象力转化为具体的画面。

功能体验:艺术视频创作的新纪元

快手可灵大模型的视频生成能力,让用户能够轻松高效地完成艺术视频创作。通过简单的文字描述,可灵能够生成具有以下特点的视频:

  1. 大幅度的合理运动:采用3D时空联合注意力机制,可灵能够生成符合运动规律的复杂、大幅度的时空运动视频内容。
  2. 长达2分钟的视频生成:得益于高效的训练基础设施和极致的推理优化,可灵能够生成长达2分钟、帧率达到30fps的视频。
  3. 模拟物理世界特性:基于自研模型架构,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。
  4. 强大的概念组合能力:基于对文本-视频语义的深刻理解,可灵能够将用户的想象力转化为具体的画面。
  5. 电影级的画面生成:基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是宏大场景还是细腻特写,都能生动呈现。
  6. 支持自由的输出视频宽高比:采用可变分辨率的训练策略,可灵能够输出多种宽高比的视频,满足不同场景的视频素材使用需求。

行业视角:AI视频应用的加速发展

快手作为头部短视频公司的积极布局AI,不仅展现了其在AI大模型技术方面的深厚积累,也体现了国产AI视频模型的技术实力。随着AI技术的持续迭代和中国厂商技术的加速追赶,我们有理由相信,AI视频应用将加速发展,并在商业化探索中取得更多突破,同时降低内容创作的门槛,为创作者带来更多可能性。

结语

快手可灵的推出,不仅是对Sora的一次有力对标,更是国产AI视频生成技术的一次革命性突破。它不仅为用户带来了全新的视频创作体验,更为整个行业的发展注入了新的活力。随着技术的不断进步和应用的不断拓展,我们期待快手可灵能够在AI视频生成领域创造更多的辉煌。

风险提示:市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。