这里是按照「分类」阅读往期的 HelloGitHub 月刊内容, 您目前在查看 HelloGitHub 人工智能 集合。
开源的 AI 浏览器。该项目是基于 Chromium 的开源 AI 浏览器,能够在本地浏览器中运行 AI Agents,可作为 ChatGPT Atlas、Perplexity Comet 和 Dia 的开源替代方案。在保留 Chrome 熟悉界面与扩展兼容性的同时,帮助用户实现 AI 驱动的浏览器自动化与智能问答任务,并支持自定义 LLM 服务或本地大模型。

免训练的 DiT 模型缓存加速框架。该项目是为 Diffusers 提供统一缓存加速的框架,支持几乎所有的 DiT 扩散模型,包括 Qwen-Image-Lightning、Qwen-Image、HunyuanImage、Wan、FLUX 等。它通过简单的代码即可实现高效的缓存加速功能,无需重新训练模型即可显著提升推理速度。
import cache_dit from diffusers import DiffusionPipeline pipe = DiffusionPipeline.from_pretrained("Qwen/Qwen-Image") # Can be any diffusion pipeline cache_dit.enable_cache(pipe) # One-line code with default cache options. output = pipe(...) # Just call the pipe as normal. stats = cache_dit.summary(pipe) # Then, get the summary of cache acceleration stats. cache_dit.disable_cache(pipe) # Disable cache and run original pipe.

为 AI 智能体构建实时知识图谱。这是一个专为 AI 智能体设计的框架,用于构建和查询实时、具有时间感知能力的知识图谱。它能够持续集成用户交互、结构化或非结构化等动态数据,形成连贯且可查询的知识图谱。支持增量数据更新、高效检索和历史查询,适用于开发交互式、上下文感知的 AI 应用。

超低存储占用的向量数据库。这是一款开源的轻量级向量数据库,通过按需计算嵌入向量,实现极低的存储占用。用户可以在个人设备(笔记本电脑)上构建强大且完全私有的检索增强生成 (RAG) 系统,支持对本地文件、电子邮件、浏览器历史、聊天记录等多种数据源进行语义搜索。
from leann import LeannBuilder, LeannSearcher, LeannChat from pathlib import Path INDEX_PATH = str(Path("./").resolve() / "demo.leann") # Build an index builder = LeannBuilder(backend_name="hnsw") builder.add_text("LEANN saves 97% storage compared to traditional vector databases.") builder.add_text("Tung Tung Tung Sahur called—they need their banana‑crocodile hybrid back") builder.build_index(INDEX_PATH) # Search searcher = LeannSearcher(INDEX_PATH) results = searcher.search("fantastical AI-generated creatures", top_k=1) # Chat with your data chat = LeannChat(INDEX_PATH, llm_config={"type": "hf", "model": "Qwen/Qwen3-0.6B"}) response = chat.ask("How much storage does LEANN save?", top_k=1)

跨媒体的个人 AI 笔记应用。这是一款本地优先的 AI 笔记本工具,能够将多种媒体类型(如本地文件、网页、视频等)整合至本地资料库,并借助 AI 快速生成笔记。它帮助用户在学习和研究过程中,免去在浏览器、笔记应用、PDF 阅读器等多个应用和媒体之间切换、搜索和手动复制粘贴的繁琐操作,同时支持灵活选择 AI 模型。

从零实现 AI 编程助手的实战教程。这是一个教你用 Go 语言结合 Claude API,从零开发本地 AI 编程助手的项目。从简单的聊天机器人开始,逐步实现文件操作、命令执行、代码编辑和搜索等功能。

给大模型立规矩的智能体开发框架。这是一款专为实际场景控制设计的 LLM 智能体开发框架,旨在解决传统 LLM 对话系统在复杂业务中难以精准控制的问题。它通过自然语言定义智能体行为规则,灵活控制 AI 的对话行为,避免“幻觉”或偏离业务目标。
import asyncio import parlant.sdk as p async def main(): async with p.Server() as server: agent = await server.create_agent( name="Otto Carmen", description="You work at a car dealership", ) await agent.create_guideline( # This is when the guideline will be triggered condition="the customer greets you", # This is what the guideline instructs the agent to do action="offer a refreshing drink", ) asyncio.run(main())

AI 模型训练跟踪与可观测平台。这是一款专为 AI 模型训练打造的跟踪、记录、分析与协作工具,旨在帮助研究者优化训练过程,提升团队协作效率。它通过简洁的 Python API 和直观的界面,提供了训练可视化、自动日志记录、硬件监控、实验管理和多人协同等功能。已集成 40+ 主流训练框架,适用于大模型训练、计算机视觉、音频处理、AIGC 等任务场景。

开箱即用的本地语音转写工具。这是一款集实时语音转文本、翻译和说话人分离于一体的开源工具,自带服务器端和 Web UI,一条命令即可私有化部署。它基于最新的增量流式技术,无需联网和写前端代码,就能实现超低延迟的会议实时记录和跨语言交流。
# 使用 large-v3 模型,并将英语翻译为中文 whisperlivekit-server --model large-v3 --language en --target-language zh # 说话人分离,服务器监听 80 端口 whisperlivekit-server --host 0.0.0.0 --port 80 --model medium --diarization --language zh

