商汤发布首个「可控」人物视频生成大模型

gate.io · 2年前 (2024-07-05)

7 月 4 日，商汤科技在世界人工智能大会（WAIC）上发布了首个「可控」人物视频生成大模型 Vimi，通过一张任意风格的照片就能生成和目标动作一致的人物类视频，并支持多种驱动方式，可通过已有人物视频、动画、声音、文字等多种元素进行驱动。与图片表情控制类技术只能控制头部表情动作不同，商汤称 Vimi 不但可以实现精准的人物表情控制，还可实现在半身区域内控制照片中人物的自然肢体变化，并自动生成与人物相符的头发、服饰及背景变化。同时 Vimi 可稳定生成 1 分钟的单镜头人物类视频，画面效果不会随着时间的变化而劣化或失真，满足娱乐互动等需要长时间稳定视频生成需求。据了解，Vimi 将完全面向 C 端用户开放使用，用户只需上传不同角度的高清人物图片，即可自动生成数字分身和不同风格的写真视频。（IT之家）

Gate.io - 芝麻交易所，又称芝麻开门交易所，是原比特儿交易所国际版本，是全球第二大交易所支持人民币OTC交易让财富更自由一点

比尔盖茨：白领比蓝领更早被 AI 取代

腾讯「AI翻译公司」上线，成本只有专业译者的 1/80

发表评论

电子邮件地址不会被公开。必填项已用*标注

商汤发布首个「可控」人物视频生成大模型

上一篇

下一篇

发表评论

文章评论已关闭！

评论信息