Anitalker-音频驱动图片说话数字人离线一键包 离线终端版 AniTalker 是一个基于深度学习的开源项目,专注于通过 AI 语音驱动面部动画技术,将静态肖像与音频文件结合,生成逼真的说话视频。该项目采用身份解耦的面部运动编码技术,支持多种控制模式,包括纯音频驱动、姿态控制以及全控制模式,能够满足不同场景下的需求。AniTalker 还集成了超分辨率模块,可以将生成的 256×256 视频提升至 512×512 分辨率,有效解决渲染模糊问题。