这里是按照「分类」阅读往期的 HelloGitHub 月刊内容, 您目前在查看 HelloGitHub Python 项目 集合。
字符编码检测 Python 库。这是一款通用的字符编码检测 Python 库,能够自动识别出文本所使用的编码格式,支持 UTF-8、GB2312、ISO-8859-1 等 99 种编码和 49 种语言,可作为库或命令行工具使用。

Crontab 终端可视化管理工具。这是一款基于 Textual 构建的 crontab 可视化管理工具,可用于管理本地和远程服务器的定时任务,支持搜索任务、路径自动补全、表达式转为自然语言描述等功能。

罗技鼠标按键重映射工具。这是一款轻量级、免账号登录的罗技鼠标按键重映射工具,可根据不同应用自动切换按键配置,支持自定义鼠标灵敏度、滚动方向和手势。

终端里的交互式数据文件浏览工具。这是一款 Python 开发的多功能查看数据文件的命令行工具,能够直观且流畅地浏览百万行的数据文件,支持 csv、sqlite、json、xlsx 和 hdf5 等多种数据格式,部分格式需要额外安装相应的 Python 库。

免费开源的动作捕捉系统。这是一款基于 Python 开发的动作捕捉系统,无需标记点和 GPU,仅用普通摄像头即可实现全身 3D 动作数据采集,适用于动画制作、游戏开发和教育等场景。

基于 GitHub 贡献生成太空射击动图。该项目能够根据用户的 GitHub 贡献图生成太空射击游戏风格的动图,支持自定义动图帧率以及通过 GitHub Actions 定时生成并自动更新到个人主页。

像写单元测试一样验证数据质量。这是一个基于 Python 的数据质量验证框架,可通过简洁的代码定义验证规则,就像为数据编写单元测试,支持 pandas、Spark 和 SQLAlchemy 等多种数据接入方式。
import great_expectations as gx context = gx.get_context() file_path = "./data/folder_with_data/yellow_tripdata_sample_2019-01.csv" batch = context.data_sources.pandas_default.read_csv(file_path) expectation = gx.expectations.ExpectColumnMaxToBeBetween( column="passenger_count", min_value=1, max_value=6 ) validation_results = batch.validate(expectation) print(validation_results)
开源的库存管理系统。这是一款基于 Python 和 Django 开发的库存管理平台,内置 Web 管理界面和 REST API 服务,支持扫码入库、零件追踪、物料清单和供应商管理等功能。

纯 Python 实现的 C 语言解析器。这是一个纯 Python 实现、无第三方依赖的 C 语言解析器,可将 C 代码解析为抽象语法树,从而实现用 Python 轻松分析与操作 C 语言代码,支持完整的 C99 标准和部分 C11 特性。
