项目详情
由
分享


HelloGitHub 评分
0 人评分
基于《基于文本及符号密度的网页正文提取方法》论文用 Python 实现的正文抽取器,可以用来提取 HTML 中正文的内容、作者、标题
过去 7 天共收获 1 颗 Star ✨
开源•GPL-3.0
认领
讨论
收藏
分享
3.8k
星数
是
中文
Python
主语言
否
活跃
5
贡献者
28
Issues
是
组织
0.3.1
最新版本
537
Forks
GPL-3.0
协议
更多

基于《基于文本及符号密度的网页正文提取方法》论文用 Python 实现的正文抽取器,可以用来提取 HTML 中正文的内容、作者、标题。之前我看到这篇论文也想实现该抽取工具,但是我因为懒癌晚期躺下了,感谢[kingname](https://github.com/kingname) ‘带趟’ ✌️
收录于:
第 42 期
评论
评分:
暂无精选评论