spaCy—强大的自然语言处理 Python 库这是一个工业级的自然语言处理(NLP)库,支持 70 多种语言的分词和训练。它采用 Python 编写,可实现标注、解析和文本分类等功能,并支持模型打包与部署。explosion·Python·2 个月前772
textdistance—计算文本距离的常用算法 Python 库计算文本距离的常用算法库。包含计算文本相似度、多样性、编辑距离、压缩等多种算法,所有算法均采用 Python 实现,容易理解调用方便 ```python implife4·Python·3 年前2k
flair—简单易用的 NLP 框架基于 PyTorch 的 NLP 框架,支持文本命名实体识别(NER)、词性标注(PoS)、词义消歧和分类。项目中包含详细的使用教程,介绍了如何标记文本、训练语flairNLP·Python·2 年前3.3k
python-pinyin—中文转拼音的 Python 库汉语转拼音的 Python 库。不知道有没有小伙伴和我一样,刚看到这库不知道能用来干啥。其实它可以用来丰富被搜索的中文内容,通过该项目可实现拼音搜索内容、容错同mozillazg·Python·3 年前619
DeepMoji—通过深度学习把自然语言转化成 emoji 表情的项目通过深度学习把自然语言转化成 emoji 表情的项目。用机器学习来了解文字表达的情感,最后返回几个感情相近的 emoji 表情。该项目有趣且易于学习,包含机器学bfelbo·Python·4 年前645
HanLP—多语种自然语言处理工具包该项目是面向生产环境的多语种自然语言处理工具包,它基于 PyTorch 和 TensorFlow 2.x 双引擎,支持中文分词、词性标注、命名实体识别、关键词提hankcs·Python·7 年前514