LivePortrait—让静态照片“活”起来3该项目能够通过一张照片快速生成高质量、生动的视频,尤其擅长捕捉和还原面部表情,支持人类和动物肖像的动画生成。KwaiVGI·Python·3 个月前5.9k
FramePack—用笔记本轻松玩转 AI 生成长视频1这是一款用于视频生成的预测神经网络结构,可以在资源有限的设备上生成高质量的视频。它通过将上下文压缩成固定长度,使得生成任务的工作量与视频长度无关,从而实现高效且lllyasviel·Python·4 个月前2.4k
Open-Sora—全新开源的视频生成模型3这是一款开源的 SOTA(State-of-the-Art)视频生成模型,仅用 20 万美元(224 张 GPU)就能训练出商业级 11B 参数的视频生成大模型hpcaitech·Python·6 个月前5.3k
TRELLIS—生成 3D 作品的开源模型该项目是微软开源的 3D 生成模型,可通过文本或图像提示生成具有复杂形状和纹理细节的 3D 作品。由于采用了 CUDA 技术,运行该模型至少需要 16GB 内存microsoft·Python·8 个月前2.8k
Genesis—生成式物理引擎和模拟平台1这是一个专为机器人、嵌入式 AI 和物理 AI 应用打造的综合物理平台,旨在简化物理仿真过程。它整合了全新设计的物理引擎、高速的照片级真实感渲染系统,以及强大的Genesis-Embodied-AI·Python·8 个月前976
Prompt_Engineering—全面的提示工程实战指南这份教程致力于帮助用户掌握与大型语言模型(LLM)沟通的技巧。内容涵盖从基础到高级的提示工程技术,附有详细的实现指南和示例代码。NirDiamant·Jupyter·10 个月前1k
MoneyPrinterTurbo—一键生成短视频的 AI 工具2该项目是基于大模型服务的 AI 视频生成工具,只需要提供一个主题或关键字,就可以自动生成高清的短视频。它拥有简单易用的 Web 界面,支持批量生成、设置视频时长harry0703·Python·1 年前9.8k
fish-speech—所有人都能用的开源语音合成模型1该项目是由 Fish Audio 开发的基于 VQGAN+Llama 的文本转语音模型,它仅需 4GB 显存即可在个人设备上轻松运行和微调(16GB),支持中英fishaudio·Python·1 年前4.7k
hallo—让静态图片开口“说话”1这是一个音频驱动的视觉合成系统,可以根据输入的音频和图像生成肖像动画。它可以让静态的肖像图像,根据音频中的声音变化动起来,就像真人说话一样。fudan-generative-vision·Python·1 年前5.5k
ChatTTS—强大的对话式文本转语音模型该项目是专门为对话场景设计的文本转语音模型,支持中、英双语。它不仅能够生成自然、流畅的语音,还能控制和添加笑声、停顿和语气词等。ChatTTS 生成较短的语音效2noise·Python·1 年前3.3k
Omost—极简提示词的文生图工具该项目基于 LLM 的编程能力帮用户自动完善文生图的提示词,可以根据用户输入的简短提示词生成高质量的图片,还支持图片局部修改等功能,比如将图片中的龙变成恐龙,极lllyasviel·Python·1 年前2.2k
generative-ai-for-beginners—面向初学者的生成式人工智能教程这是由微软开源的面向初学者的生成式 AI 免费课程,课程共 18 节,涵盖了创建生成式 AI 应用所需要了解的一切,包括生成式 AI 和 LLMs 的简介、提示microsoft·Jupyter·1 年前3.4k
Suno-API—Suno 文生音乐 AI 转 APISuno AI 是一款免费的 AI 音乐生成工具,用户可以通过文本提示词生成包含歌声和乐器的完整音乐作品。该项目是基于 Python 和 FastAPI 开发的SunoAI-API·Python·1 年前2.5k
Mr.-Ranedeer-AI-Tutor—打造你的个性化 AI 老师该项目通过提示词让 AI 对话机器人充当老师和学习助手的角色,为你生成学习计划、授课解惑、出练习题等,还可以选择不同的授课风格和深度。它可搭配任意大模型,作者推JushBJJ·Other·1 年前1.8k
PhotoMaker—AI 生成各种风格人类照片的工具该项目可以通过上传的人物照片,生成任意风格的人物图像,如写实、卡通、艺术等风格,可用于生成别具一格的头像。TencentARC·Jupyter·2 年前2.1k