返回
Vimi
Vimi

Vimi

2025-06-08 Vimi是商汤科技发布的全球首个可控人物的AI视频生成大模型

Vimi是什么

Vimi是商汤科技发布的全球首个可控人物的视频生成AIGC产品,基于商汤日日新大模型能力,Vimi可以通过动作视频、动画、声音、文字等多种驱动元素来驱动人物类图片,从而生成和目标动作一致的人物类视频。除了可控性外,Vimi在生成人物稳定性、生成视频时长上,也突破了其它大模型AI视频生成的限制,可以稳定的生成分钟级的单镜头人物视频。

与常规图片表情控制类技术只能控制头部表情动作不同,Vimi人物视频大模型不但可以控制人物表情,还可以控制肢体动作,并生成合理的头发、服饰、背景,并支持光影变化,是全球首个稳定的可控人物视频生成产品。

Vimi产品优势

✅ 可控人物
Vimi可控生成高一致性的人物表情及肢体动作视频。

✅ 多种控制方式
Vimi可以通过人物视频、动画参数、语音文字等输入驱动。

✅ 分钟级单镜头
Vimi支持生成分钟级的单镜头人物视频。

✅ 生成合理的视频场景
Vimi支持人物合理的头发、服饰、背景补全,并支持光影变化。

Vimi如何使用

Vimi于2024年7月4日的世界人工智能大会上推出,目前处于内测阶段,可以访问Vimi官网申请内测资格。

  • Vimi官网:https://vimi.sensetime.com/
  • Vimi内测申请入口:https://www.wjx.cn/vm/mhSxfGv.aspx#
声明:Vimi的网站信息数据仅供评估该网站价值及影响力做参考。如有错误,欢迎纠错
  • Figstack
    Figstack
    一个基于 Web 的AI代码伴侣工具,可以帮助跨不同编程语言管理和解释代码。
  • 豆包大模型
    豆包大模型
    字节跳动自主研发的一系列大型语言模型
  • 通义灵码
    通义灵码
    阿里云出品的一款基于通义大模型的智能编码辅助工具,提供代码智能生成、研发智能问答能力
  • Project IDX
    Project IDX
    Google推出的一个实验性的AI辅助开发平台
  • Wordware
    Wordware
    Wordware是一个自然语言编程工具,使任何人都可以开发、迭代和部署有用的AI应用程序。
  • Seed-TTS
    Seed-TTS
    Seed-TTS 是一个高质量多功能的文本到语音生成模型
  • Stenography
    Stenography
    一个AI驱动的代码库API
  • AliGenie 天猫精灵开放平台
    AliGenie 天猫精灵开放平台
    天猫精灵开放平台
  • Movie Gen
    Movie Gen
    Movie Gen 是 Meta 公司最新推出的AI视频生成大模型
  • CodeWP
    CodeWP
    针对 WordPress 训练的AI代码生成器
  • 文章推荐