Open-Sora—全新开源的视频生成模型3这是一款开源的 SOTA(State-of-the-Art)视频生成模型,仅用 20 万美元(224 张 GPU)就能训练出商业级 11B 参数的视频生成大模型hpcaitech·Python·20 天前2.4k
MoneyPrinterTurbo—一键生成短视频的 AI 工具2该项目是基于大模型服务的 AI 视频生成工具,只需要提供一个主题或关键字,就可以自动生成高清的短视频。它拥有简单易用的 Web 界面,支持批量生成、设置视频时长harry0703·Python·9 个月前7k
TRELLIS—生成 3D 作品的开源模型该项目是微软开源的 3D 生成模型,可通过文本或图像提示生成具有复杂形状和纹理细节的 3D 作品。由于采用了 CUDA 技术,运行该模型至少需要 16GB 内存microsoft·Python·4 个月前2.2k
hallo—让静态图片开口“说话”1这是一个音频驱动的视觉合成系统,可以根据输入的音频和图像生成肖像动画。它可以让静态的肖像图像,根据音频中的声音变化动起来,就像真人说话一样。fudan-generative-vision·Python·10 个月前4.4k
fish-speech—所有人都能用的开源语音合成模型1该项目是由 Fish Audio 开发的基于 VQGAN+Llama 的文本转语音模型,它仅需 4GB 显存即可在个人设备上轻松运行和微调(16GB),支持中英fishaudio·Python·9 个月前3.9k
Fooocus—一款开箱即用的图片生成软件1该项目在设计时吸收了 Stable Diffusion 和 Midjourney 的优点,它安装简单、操作方便,省去了复杂的参数调节步骤。用户只需要输入提示词,lllyasviel·Python·2 年前1.8w
ChatTTS—强大的对话式文本转语音模型该项目是专门为对话场景设计的文本转语音模型,支持中、英双语。它不仅能够生成自然、流畅的语音,还能控制和添加笑声、停顿和语气词等。ChatTTS 生成较短的语音效2noise·Python·10 个月前2.8k
Prompt_Engineering—全面的提示工程实战指南这份教程致力于帮助用户掌握与大型语言模型(LLM)沟通的技巧。内容涵盖从基础到高级的提示工程技术,附有详细的实现指南和示例代码。NirDiamant·Jupyter·5 个月前629
AnyText—轻松 DIY 图片文字,定制你的创意设计1该项目提供了文字生成和文字编辑两种模式,它能够根据提示词生成图文融合的图片,并确保文字的准确性,还支持对上传图片中的文字进行编辑后,重新生成图片。支持中文、英语tyxsspa·Python·1 年前3.9k
generative-ai-for-beginners—面向初学者的生成式人工智能教程这是由微软开源的面向初学者的生成式 AI 免费课程,课程共 18 节,涵盖了创建生成式 AI 应用所需要了解的一切,包括生成式 AI 和 LLMs 的简介、提示microsoft·Jupyter·1 年前2.3k
Omost—极简提示词的文生图工具该项目基于 LLM 的编程能力帮用户自动完善文生图的提示词,可以根据用户输入的简短提示词生成高质量的图片,还支持图片局部修改等功能,比如将图片中的龙变成恐龙,极lllyasviel·Python·10 个月前1.9k
AnimateDiff—让 AI 生成的图动起来1这是一款可以在 Stable Diffusion 中制作动图的库,支持将大多数开源模型转换为动画生成器。让原本通过文字生成的图片,变成 gif 图片动起来。guoyww·Python·1 年前2.7k
screenshot-to-code—将截图转化为 HTML 代码的工具1该项目可以将屏幕截图转化为 HTML/JS/Tailwind CSS 代码,它使用 GPT-4 Vision 生成代码、DALL-E 3 生成相似的图片。abi·Python·1 年前4.2k
Genesis—生成式物理引擎和模拟平台1这是一个专为机器人、嵌入式 AI 和物理 AI 应用打造的综合物理平台,旨在简化物理仿真过程。它整合了全新设计的物理引擎、高速的照片级真实感渲染系统,以及强大的Genesis-Embodied-AI·Python·3 个月前565
ComfyUI—基于节点流程的 AI 绘图操作界面1该项目将 Stable Diffusion 流程分成多个节点,通过拖拽各种节点构成图像生成到处理的工作流,支持 Stable Diffusion 1.x 和 2comfyanonymous·Python·1 年前4.1k