teable—PostgreSQL No-Code PlatformThis project is a no-code database application platform constructed on PostgreSQL, combining the intteableio·TypeScript·6 months ago1.4k
umap—Python library for high-dimensional data dimensionality reductionThis project is a Python library used to map high-dimensional data to low-dimensional spaces, aidinglmcinnes·Python·5 months ago570
pygwalker—Visually Manipulate pandas DatasetsThis project transforms pandas' dataframe data objects into an interactive graphical interface, suppKanaries·Python·a year ago4k
datasette—Python Tool for Exploring and Publishing DataThis project can publish various forms of data, such as CSV, JSON, databases, etc., into API interfasimonw·Python·2 years ago2k
tablib—A Python Library for Easily Handling Tabular DatasetsThis project is capable of transforming various formats of tabular datasets into a unified Dataset ojazzband·Python·10 months ago1.3k
cudf—Database Processing Python Library Supporting GPUIt is equivalent to pandas with GPU support, which significantly boosts the speed of data processingrapidsai·C++·a year ago3.2k
orange3—互动式数据分析桌面工具一款面向不会编程人群的数据挖掘和数据可视化工具箱。内置多种图表类型、支持可视化编程,无需写代码即可做出简单、实用的数据分析软件,多用于教学和实验室等场景。biolab·Python·2 years ago1k
qlib—微软开源的 AI 量化交易平台微软开源的 AI 量化交易平台。它包含了数据处理、模型训练、回测等模块,涵盖了 Alpha 挖掘、风险建模、组合优化等功能 microsoft·Python·3 years ago5k
lux—自动将 pandas 数据可视化的项目一个用于数据科学方面的 Python 开源库。这个库适用于实验室分析数据的场景,基于 Jupyter 的数据可视化和操作界面,再加上 pandas 丰富的数据接lux-org·Python·4 years ago648
bigdata_analyse—大数据分析实战项目集合大数据分析实战项目的集合。该项目包含了淘宝、租房、招聘等数据的分析实例,不仅有 Python、SQL、HQL 的实例代码,还附上了数据集下载地址。想学习大数据的TurboWay·Python·3 years ago964
modin—更快、类 pandas 的数据处理和分析库更快、类似 pandas 的数据处理和分析库。底层通过 Ray 或 Dask 加速计算,上层兼容大部分 pandas API。所以使用起来十分简单,仅需更改一行modin-project·Python·3 years ago627
polars—用 Rust 实现的速度极快的 DataFrames 库多线程、类 Pandas 的数据处理库。底层采用 Apache Arrow 从而带来了更高效的数据处理性能、占用内存更少、处理速度更快,再加上简单易用的 APIpola-rs·Rust·3 years ago785
OpenRefine—一款用于清理数据的桌面工具通过可视化的方式分析、整理数据,支持 Windows、Linux 和 macOS 操作系统。拥有查询、过滤、去重、分析等功能,可以把杂乱的数据变成整洁的电子表格OpenRefine·Java·4 years ago959