项目详情
由分享
HelloGitHub 评分
10.0
2 人评分
开源•Apache-2.0
认领
讨论
收藏
分享
18.6k
星数
否
中文
HTML
主语言
是
活跃
25
贡献者
111
Issues
否
组织
无
最新版本
1k
Forks
Apache-2.0
协议
更多
这是一款用 Python 开发的异步爬虫框架,能够将网站上的数据转化成 Markdown、JSON 等 LLM 友好的输出格式。它完全开源且免费,极大地简化了异步爬虫的编写。相比于付费的 Firecrawl,它具有更快的爬取速度,支持同时抓取多个 URL、页面截图、关键字优化提取(基于 LLM)和复杂的多页面会话管理等功能。
评论
评分:
暂无精选评论