moshi—可实时对话的语音模型该项目利用先进的流式神经音频编码器 Mimi,实现了一个能够进行实时、同时听和说(全双工)、自然对话的语音系统。它不仅能听懂你说的话,还可以像正常对话一样回答你kyutai-labs·Python·2 个月前1.6k
Retrieval-based-Voice-Conversion-WebUI—开箱即用的 AI 变声器该项目是基于 VITS 的变声框架,仅需少量语音数据和普通的显卡,就能快速训练出高质量的语音转换模型。它提供了简单易用的 Web 和 GUI 界面,支持实时变声RVC-Project·Python·4 个月前2.2k
buzz—音频转录与翻译工具1该项目是基于 Whisper 的音频转录和翻译工具,它开箱即用且操作简单,支持语音转文字、音频翻译、多种语言和离线使用,适用于 macOS、Windows 和 chidiwilliams·Python·4 个月前1.1k
audacity—一款免费、开源的音频编辑工具该项目是最受欢迎的开源音频编辑软件之一,它拥有容易上手的界面,提供了音频的编辑和录制功能,支持多语言、录音、多音轨混音以及杂音消除等特性,适用于 Windowsaudacity·C·9 个月前755
GPT-SoVITS—少样本语音转换和合成工具强大的少样本语音转换和语音合成 WebUI 工具,输入 5 秒的声音样本就能体验文本到语音转换。支持少样本 TTS、英语、日语和中文,集成了声音伴奏分离、中文自RVC-Boss·Python·10 个月前1.7k
audioFlux—用于音频分析和特征提取的库这是一个用于音频和音乐分析、特征提取的深度学习工具库,支持数十种时频分析变换方法和数百种对应的时域、频域特征组合,它可以提供给深度学习网络进行训练,用于研究音频libAudioFlux·C·1 年前1.8k
SpleeterGui—一款 Windows 上的音轨分离工具它是第三方制作的 Spleeter 桌面应用,支持中文在内的多国语言,可以将音乐里的人声和乐器声分离,轻松实现提取音乐中的伴奏。boy1dr·C#·2 年前881