teable—PostgreSQL 无代码平台该项目是基于 PostgreSQL 构建的无代码数据库应用平台,将电子表格的直观操作界面和企业级数据库功能相结合。它提供简洁易用的电子表格式界面,简化了数据库应teableio·TypeScript·7 个月前1.4k
umap—高维数据降维的 Python 库该项目是用于将高维数据映射到低维空间的 Python 库,帮助研究人员理解复杂数据集。与 t-SNE 相比,它在保持数据全局结构方面更加出色,能够高效地执行高维lmcinnes·Python·6 个月前647
pygwalker—用可视化的方式操作 pandas 数据集该项目可以将 pandas 的 dataframe 数据对象转化成一个可交互的图形界面,支持通过拖拽字段的方式进行数据分析。Kanaries·Python·1 年前4k
datasette—用于探索和发布数据的 Python 工具该项目可以将 CSV、JSON、数据库等各种形式的数据,在几分钟内发布成 API 接口或网页,轻松实现数据集的 Web 可视化、搜索、分析等功能。simonw·Python·2 年前2k
tablib—轻松处理表格数据集的 Python 库该项目能够将不同格式的表格数据集,转化成统一的 Dataset 对象。它提供了动态列、标签、过滤等功能,支持 csv、df、json、yaml、xls 等格式的jazzband·Python·1 年前1.3k
cudf—支持 GPU 的数据库处理 Python 库它相当于支持 GPU 的 pandas,处理数据的速度直接起飞。提供了类似 pandas 的 API,支持加载、合并、聚合、过滤等方式操作数据。rapidsai·C++·1 年前3.2k
orange3—互动式数据分析桌面工具一款面向不会编程人群的数据挖掘和数据可视化工具箱。内置多种图表类型、支持可视化编程,无需写代码即可做出简单、实用的数据分析软件,多用于教学和实验室等场景。biolab·Python·2 年前1.1k
qlib—微软开源的 AI 量化交易平台微软开源的 AI 量化交易平台。它包含了数据处理、模型训练、回测等模块,涵盖了 Alpha 挖掘、风险建模、组合优化等功能 microsoft·Python·3 年前5.1k
lux—自动将 pandas 数据可视化的项目一个用于数据科学方面的 Python 开源库。这个库适用于实验室分析数据的场景,基于 Jupyter 的数据可视化和操作界面,再加上 pandas 丰富的数据接lux-org·Python·4 年前700
bigdata_analyse—大数据分析实战项目集合大数据分析实战项目的集合。该项目包含了淘宝、租房、招聘等数据的分析实例,不仅有 Python、SQL、HQL 的实例代码,还附上了数据集下载地址。想学习大数据的TurboWay·Python·3 年前1k
modin—更快、类 pandas 的数据处理和分析库更快、类似 pandas 的数据处理和分析库。底层通过 Ray 或 Dask 加速计算,上层兼容大部分 pandas API。所以使用起来十分简单,仅需更改一行modin-project·Python·3 年前663
OpenRefine—一款用于清理数据的桌面工具通过可视化的方式分析、整理数据,支持 Windows、Linux 和 macOS 操作系统。拥有查询、过滤、去重、分析等功能,可以把杂乱的数据变成整洁的电子表格OpenRefine·Java·4 年前1k
polars—用 Rust 实现的速度极快的 DataFrames 库多线程、类 Pandas 的数据处理库。底层采用 Apache Arrow 从而带来了更高效的数据处理性能、占用内存更少、处理速度更快,再加上简单易用的 APIpola-rs·Rust·3 年前840