蒙娜丽莎Rap的秘密！这个AI算法绝不能错过！！

首页版块访问AI主站注册发帖

官

用户已被禁言发布于2021-12 浏览:2059 回复:2

快速回复

蒙娜丽莎说 Rap、苏轼先生开口念诗、Gollum 唱 Black Pink 的 Ice Cream。是的，你没有看错，本篇给大家介绍的这个 AI 算法可以让你零基础5分钟实现上述超级 Fancy 的特效，亲手制作点击量过百万、霸榜热搜的超级视频。

话不多说，让我们先看效果！

不仅如此哦～最近大火的虚拟美妆博主柳夜熙、上周百度发布的央视总台首个 AI 手语主播以及各大虚拟偶像等等数字人的核心技术中，让数字人开口说话的也是这个 AI 算法。

那这到底是什么神奇的技术呢？

答案就是飞桨开源套件 PaddleGAN 中的新晋宠儿——Wav2lip 模型

赶紧上项目查看源码及文档教程吧，这个项目还提供热门 GAN 模型，如 AnimeGANv2、GauGAN、First Order Motion 的实现，开源不易，希望大家 Star 支持！

https://github.com/PaddlePaddle/PaddleGAN/blob/develop/README_cn.md

更贴心的是，完整项目代码已公开于 AI Studio，大家动动手指即可体验：

https://aistudio.baidu.com/aistudio/projectdetail/3156519?ref=baiduai2

下面给大家拆解下技术原理和具体的操作步骤，手把手教你实现苏轼念诗，蒙娜丽莎唱 Rap 或者任何你心仪的 Idol 说情话⁄(⁄ ⁄•⁄ω⁄•⁄ ⁄)⁄。

这是一个输入一段语音，使目标人物图片、视频的唇形，根据语音进行自动匹配并运动起来的任务。因此，我们需要准备一段音频和一段人像/动漫人物视频，将音频和视频输入 Wav2lip 模型中，经过 Wav2lip 模型预测后，便会输出一段目标人物/动漫人物说出输入音频的视频，至此，「千万级」配音视频就完成啦~

PaddleGAN 的唇形迁移能力——Wav2lip

Wav2lip 模型实现唇形与语音精准同步突破的关键在于：

采用了唇形同步判别器，以强制生成器持续产生准确而逼真的唇部运动。
此外，通过在鉴别器中，使用多个连续帧而不是单个帧，并使用视觉质量损失（而不仅仅是对比损失）来考虑时间相关性，从而改善了视觉质量。

万能的 Wav2lip 模型适用于任何人脸、任何语音、任何语言！对任意视频都能达到很高的准确率，都可以实现无缝地与原始视频融合，无论是视频效果还是语音效果都很逼真。

与此同时，PaddleGAN 针对 Wav2Lip 模型进行了高清优化，使唇形拟合更细腻，更加逼真。

PaddleGAN Wav2lip 的使用方法

在 PaddleGAN 的帮助下，完成上述神奇的自制「配音/对口型」只需两步：

1、下载 PaddleGAN 并所需安装包

# 下载 PaddlePaddle 安装包

# 从 github 上克隆 PaddleGAN 代码（如下载速度过慢，可用 gitee 源）

!git clone

https://gitee.com/PaddlePaddle/PaddleGAN

#!git clone

https://github.com/PaddlePaddle/PaddleGAN

#本地安装 PaddleGAN

%cd /home/aistudio/PaddleGAN

!pip install -v -e .

!pip install -r requirements.txt

!pip install librosa!pip install numba==0.53.1

2、使用唇形合成命令

%cd applications/

!python tools/wav2lip.py \

--face /home/aistudio/1.jpeg \

--audio /home/aistudio/2.m4a \

--outfile /home/aistudio/pp_put.mp4 \

--face_enhancement

只需在如下命令中的 face 参数和 audio 参数分别换成自己的视频和音频路径，然后运行即可生成和音频同步的视频，运行完成后，会在当前文件夹下生成文件名为 outfile 参数指定的视频文件，该文件即为和音频同步的视频文件：

lface：原始视频，视频中的人物的唇形将根据音频进行唇形合成
laudio：驱动唇形合成的音频，视频中的人物将根据此音频进行唇形合成
loutfile：成品视频名
lface_enhancement：添加人脸增加特效

PaddleGAN 的花样玩法

以为 PaddleGAN 就止于此？NoNoNo~

免费开源的宝藏套件 PaddleGAN 的能力当然不止于唇形迁移/生成的技术，里面满满都是种类丰富、趣味的图像/视频生成、处理能力。热门的前沿模型，如 AnimeGANv2、GauGAN、First Order Motion 等模型等待大家探索。

如图像风格迁移、视频修复、图像超分辨率、人像动漫化、照片动漫化、人脸编辑等等。

PaddleGAN 就如一个「游乐场」，欢迎各位「玩家」加入，体验各类「游戏设施」，无需门票，如果玩得开心，记得点 Star 支持下~

https://github.com/PaddlePaddle/PaddleGAN/blob/develop/README_cn.md

点击链接：https://aistudio.baidu.com/aistudio/projectdetail/3156519?ref=baiduai2 ，了解更多详情

平台资讯

个赞

共2条回复最后由用户已被禁言回复于2022-04

#5用户已被禁言回复于2022-04

http://search.pudn.com/Download?keyword=%E5%B1%B1%E4%B8%9C%E6%96%B0%E6%B3%B0%E7%BD%91%E4%B8%8A%E9%BE%99%E8%99%8E%E3%80%90%E5%AE%98%E7%BD%91%E2%86%92TL262%C2%B7C%EF%BC%AFM%E3%80%91%E8%8D%86%E5%B7%9E%E4%BA%BA%E6%89%8D%EF%BC%B9%EF%BD%8E http://so.v.ifeng.com/video?q=%E7%BC%85%E7%94%B8%E8%80%81%E8%A1%97%E9%87%91%E9%BC%8E%E8%B5%8C%E5%9C%BATL262%C2%B7C%EF%BC%AFM%E6%B1%A0%E5%B7%9E%E7%83%AD%E6%90%9C%EF%BC%B8&c=5 http://v.qq.com/x/search/?q=%E9%87%91%E5%B1%B1%E8%B4%B5%E5%AE%BE%E4%BC%9A%E6%89%8B%E6%9C%BA%E7%89%88%E3%80%90%E5%AE%98%E7%BD%91%E2%86%92B2024%C2%B7CN%E3%80%91%E9%98%B3%E6%B3%89%E4%BA%BA%E5%8A%9B%E8%B5%84%E6%BA%90%EF%BC%BB%EF%BD%9A%EF%BF%A5?type=3 https://www.oschina.net/search?scope=news&q=%E6%96%B0%E9%87%91%E5%AE%9D%E5%AE%98%E6%96%B9%E5%85%85%E5%80%BC%E5%BE%AE%E4%BF%A1%E3%80%90TL262%C2%B7C%EF%BC%AFM%E6%AC%A2%E8%BF%8E%E6%82%A8%E3%80%91%E5%90%89%E5%AE%89%E7%83%AD%E6%90%9C%EF%BD%86&days=0&onlytitle=0&sort_by_time=0 https://quanmin.baidu.com/wise/growth/querypage?keyword=%E6%96%B0%E7%99%BE%E8%83%9C%E5%9C%A8%E7%BA%BF%E4%B8%8A%E5%88%86QQ%E6%8E%A8%E8%8D%90TL262%C2%B7C%EF%BC%AFM%E6%9F%B3%E5%B7%9E%E4%BA%A4%E7%AE%A1%E5%B1%80%EF%BD%90%EF%BC%BF%EF%BD%9D.htm

#2yugiohskyhigh回复于2021-12

越来越高级了，感觉可以整新的娱乐项目了

快速回复

小编推荐

【开奖啦】投稿赢大奖-奇思妙想+AI技术=？

用户已被禁言 55回复

百度AI社区开发者联盟集结！！

用户已被禁言 9回复

社区积分商城上线啦～

用户已被禁言 25回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服