TRELLIS—生成 3D 作品的开源模型该项目是微软开源的 3D 生成模型,可通过文本或图像提示生成具有复杂形状和纹理细节的 3D 作品。由于采用了 CUDA 技术,运行该模型至少需要 16GB 内存microsoft·Python·6 天前573
MoneyPrinterTurbo—一键生成短视频的 AI 工具1该项目是基于大模型服务的 AI 视频生成工具,只需要提供一个主题或关键字,就可以自动生成高清的短视频。它拥有简单易用的 Web 界面,支持批量生成、设置视频时长harry0703·Python·6 个月前5.8k
fish-speech—所有人都能用的开源语音合成模型1该项目是由 Fish Audio 开发的基于 VQGAN+Llama 的文本转语音模型,它仅需 4GB 显存即可在个人设备上轻松运行和微调(16GB),支持中英fishaudio·Python·5 个月前3.2k
hallo—让静态图片开口“说话”这是一个音频驱动的视觉合成系统,可以根据输入的音频和图像生成肖像动画。它可以让静态的肖像图像,根据音频中的声音变化动起来,就像真人说话一样。fudan-generative-vision·Python·6 个月前3.6k
Prompt_Engineering—全面的提示工程实战指南这份教程致力于帮助用户掌握与大型语言模型(LLM)沟通的技巧。内容涵盖从基础到高级的提示工程技术,附有详细的实现指南和示例代码。NirDiamant·Jupyter·2 个月前426
ChatTTS—强大的对话式文本转语音模型该项目是专门为对话场景设计的文本转语音模型,支持中、英双语。它不仅能够生成自然、流畅的语音,还能控制和添加笑声、停顿和语气词等。ChatTTS 生成较短的语音效2noise·Python·7 个月前2.4k
Fooocus—一款开箱即用的图片生成软件1该项目在设计时吸收了 Stable Diffusion 和 Midjourney 的优点,它安装简单、操作方便,省去了复杂的参数调节步骤。用户只需要输入提示词,lllyasviel·Python·1 年前1.7w
Omost—极简提示词的文生图工具该项目基于 LLM 的编程能力帮用户自动完善文生图的提示词,可以根据用户输入的简短提示词生成高质量的图片,还支持图片局部修改等功能,比如将图片中的龙变成恐龙,极lllyasviel·Python·7 个月前1.7k
AnyText—轻松 DIY 图片文字,定制你的创意设计1该项目提供了文字生成和文字编辑两种模式,它能够根据提示词生成图文融合的图片,并确保文字的准确性,还支持对上传图片中的文字进行编辑后,重新生成图片。支持中文、英语tyxsspa·Python·1 年前3.6k
generative-ai-for-beginners—面向初学者的生成式人工智能教程这是由微软开源的面向初学者的生成式 AI 免费课程,课程共 18 节,涵盖了创建生成式 AI 应用所需要了解的一切,包括生成式 AI 和 LLMs 的简介、提示microsoft·Jupyter·9 个月前1.9k
AnimateDiff—让 AI 生成的图动起来1这是一款可以在 Stable Diffusion 中制作动图的库,支持将大多数开源模型转换为动画生成器。让原本通过文字生成的图片,变成 gif 图片动起来。guoyww·Python·1 年前2.4k
screenshot-to-code—将截图转化为 HTML 代码的工具1该项目可以将屏幕截图转化为 HTML/JS/Tailwind CSS 代码,它使用 GPT-4 Vision 生成代码、DALL-E 3 生成相似的图片。abi·Python·1 年前4k
PhotoMaker—AI 生成各种风格人类照片的工具该项目可以通过上传的人物照片,生成任意风格的人物图像,如写实、卡通、艺术等风格,可用于生成别具一格的头像。TencentARC·Jupyter·10 个月前1.5k
Suno-API—Suno 文生音乐 AI 转 APISuno AI 是一款免费的 AI 音乐生成工具,用户可以通过文本提示词生成包含歌声和乐器的完整音乐作品。该项目是基于 Python 和 FastAPI 开发的SunoAI-API·Python·9 个月前1.8k
Mr.-Ranedeer-AI-Tutor—打造你的个性化 AI 老师该项目通过提示词让 AI 对话机器人充当老师和学习助手的角色,为你生成学习计划、授课解惑、出练习题等,还可以选择不同的授课风格和深度。它可搭配任意大模型,作者推JushBJJ·Other·9 个月前1.4k