下拉刷新
项目详情
navbar_avatar分享
repo_avatar
HelloGitHub 评分
0 人评分
基于《基于文本及符号密度的网页正文提取方法》论文用 Python 实现的正文抽取器,可以用来提取 HTML 中正文的内容、作者、标题
开源GPL-3.0
认领
收藏
分享
3.8k
星数
中文
Python
主语言
活跃
5
贡献者
28
Issues
组织
0.3.1
最新版本
537
Forks
GPL-3.0
协议
更多
GeneralNewsExtractor image
基于《基于文本及符号密度的网页正文提取方法》论文用 Python 实现的正文抽取器,可以用来提取 HTML 中正文的内容、作者、标题。之前我看到这篇论文也想实现该抽取工具,但是我因为懒癌晚期躺下了,感谢[kingname](https://github.com/kingname) ‘带趟’ ✌️
收录于:
第 42 期

评论

评分:
暂无精选评论