AI数字人与交互：虚拟人物创建与情感化沟通的新前沿

LatentSync1.5-音频对口型数字人离线一键包

离线终端版

LatentSync是一个轻量级跨设备AI模型同步解决方案，针对边缘计算场景优化，最低6GB显存（兼容NVIDIA GTX 1660及以上显卡）即可支持多节点模型参数实时同步。项目通过将模型权重编码为低维潜在表示，减少90%以上的通信带宽需求，同时支持增量学习（Incremental Learning）与联邦学习（Federated Learning）模式，允许设备在本地数据上独立训练后合并全局模型，适用于智能家居、工业物联网、自动驾驶车队等需要隐私保护与低延迟协作的场景。

2026-03-28 72"

HeyGem-AI数字人离线一键包

离线终端版

HeyGem是一个面向低硬件环境的开源AI数字人项目，通过模型量化与推理优化技术，最低仅需8GB显存即可实现从单张照片或1秒视频中快速克隆数字人形象，并支持声音克隆、多语言口型同步及4K超清视频生成，全程可离线私有化部署，兼顾高效能与数据隐私安全。

2026-03-28 156"

Anitalker-音频驱动图片说话数字人离线一键包

离线终端版

AniTalker 是一个基于深度学习的开源项目，专注于通过 AI 语音驱动面部动画技术，将静态肖像与音频文件结合，生成逼真的说话视频。该项目采用身份解耦的面部运动编码技术，支持多种控制模式，包括纯音频驱动、姿态控制以及全控制模式，能够满足不同场景下的需求。AniTalker 还集成了超分辨率模块，可以将生成的 256×256 视频提升至 512×512 分辨率，有效解决渲染模糊问题。

2026-03-10 139"

加载更多

AI数字人

月光墟，一个令你着迷，能淘金的网站！