AI数字人

 一级分类
站内搜索

LatentSync1.5-音频对口型数字人离线一键包

LatentSync是一个轻量级跨设备AI模型同步解决方案,针对边缘计算场景优化,最低6GB显存(兼容NVIDIA GTX 1660及以上显卡)即可支持多节点模型参数实时同步。项目通过将模型权重编码为低维潜在表示,减少90%以上的通信带宽需求,同时支持增量学习(Incremental Learning)与联邦学习(Federated Learning)模式,允许设备在本地数据上独立训练后合并全局模型,适用于智能家居、工业物联网、自动驾驶车队等需要隐私保护与低延迟协作的场景。

HeyGem-AI数字人离线一键包

HeyGem是一个面向低硬件环境的开源AI数字人项目,通过模型量化与推理优化技术,最低仅需8GB显存即可实现从单张照片或1秒视频中快速克隆数字人形象,并支持声音克隆、多语言口型同步及4K超清视频生成,全程可离线私有化部署,兼顾高效能与数据隐私安全。

Anitalker-音频驱动图片说话数字人离线一键包

AniTalker 是一个基于深度学习的开源项目,专注于通过 AI 语音驱动面部动画技术,将静态肖像与音频文件结合,生成逼真的说话视频。该项目采用身份解耦的面部运动编码技术,支持多种控制模式,包括纯音频驱动、姿态控制以及全控制模式,能够满足不同场景下的需求。AniTalker 还集成了超分辨率模块,可以将生成的 256×256 视频提升至 512×512 分辨率,有效解决渲染模糊问题。
加载更多

月光墟,一个令你着迷,能淘金的网站!

返回首页 about us