音频处理标签的开源项目

音频处理

标签

CapsWriter-Offline—超低延迟的离线语音输入工具
3

这是一款完全离线的语音输入工具，按住 CapsLock 键说话、松开即可转换为文字。支持实时语音识别、音频文件转录、数字格式转换、热词替换、LLM 润色等功能，

HaujetZhao

·Python·1 个月前

2.1k

miniaudio—极简易用的 C 语言音频库

这是一个单文件、零依赖、跨平台的 C 语言音频库。它将各种主流操作系统的底层音频 API 封装成简单易用的接口，让你轻松实现音频播放、录制和处理等功能，适用于游

mackron

·C·10 个月前

1.3k

shairport-sync—开源的 AirPlay 音频无缝接入方案
1

这是一款支持 AirPlay/AirPlay 2 协议的音频播放器，能够接收并播放来自苹果设备的 AirPlay 音频流。只需树莓派等低成本设备，就可以将普通音

mikebrady

·C·1 年前

1.7k

OpenUtau—开源的歌声合成工具

这是一款用于创作和编辑歌声合成作品的工具，兼容 UTAU 的音色库和重采样器。它拥有简洁直观的界面，支持鼠标与键盘协同操作，并提供 MIDI 编辑、歌词调整、音

openutau

·C#·1 年前

moshi—可实时对话的语音模型

该项目利用先进的流式神经音频编码器 Mimi，实现了一个能够进行实时、同时听和说（全双工）、自然对话的语音系统。它不仅能听懂你说的话，还可以像正常对话一样回答你

kyutai-labs

·Python·2 年前

4.7k

Retrieval-based-Voice-Conversion-WebUI—开箱即用的 AI 变声器

该项目是基于 VITS 的变声框架，仅需少量语音数据和普通的显卡，就能快速训练出高质量的语音转换模型。它提供了简单易用的 Web 和 GUI 界面，支持实时变声

RVC-Project

·Python·2 年前

7.2k

buzz—音频转录与翻译工具
1

该项目是基于 Whisper 的音频转录和翻译工具，它开箱即用且操作简单，支持语音转文字、音频翻译、多种语言和离线使用，适用于 macOS、Windows 和

chidiwilliams

·Python·2 年前

3.9k

audacity—一款免费、开源的音频编辑工具

该项目是最受欢迎的开源音频编辑软件之一，它拥有容易上手的界面，提供了音频的编辑和录制功能，支持多语言、录音、多音轨混音以及杂音消除等特性，适用于 Windows

audacity

·C++·2 年前

3.4k

GPT-SoVITS—少样本语音转换和合成工具
1

强大的少样本语音转换和语音合成 WebUI 工具，输入 5 秒的声音样本就能体验文本到语音转换。支持少样本 TTS、英语、日语和中文，集成了声音伴奏分离、中文自

RVC-Boss

·Python·2 年前

audioFlux—用于音频分析和特征提取的库

这是一个用于音频和音乐分析、特征提取的深度学习工具库，支持数十种时频分析变换方法和数百种对应的时域、频域特征组合，它可以提供给深度学习网络进行训练，用于研究音频

libAudioFlux

·C·3 年前

SpleeterGui—一款 Windows 上的音轨分离工具

它是第三方制作的 Spleeter 桌面应用，支持中文在内的多国语言，可以将音乐里的人声和乐器声分离，轻松实现提取音乐中的伴奏。

boy1dr

·C#·3 年前

2.3k

- 到底了，目前只开放了这些 -

推荐项目

换一换