关于Pandas
发展历史
2008 年,AQR Capital Management开始了pandas 的开发。到 2009 年底,它已经开源,并且今天得到了世界各地志同道合的个人社区的积极支持,他们贡献了宝贵的时间和精力来帮助开源pandas成为 可能。感谢我们所有的贡献者。
自 2015 年起,pandas成为NumFOCUS 赞助的项目。这将有助于确保pandas作为世界级开源项目的成功开发。
时间线
- 2008年:开始开发pandas
- 2009:pandas开源
- 2012 年:第一版Python 数据分析出版
- 2015 年:pandas成为NumFOCUS 赞助项目
- 2018:第一次现场核心开发冲刺
图书馆亮点
-
快速高效的DataFrame对象,用于具有集成索引的数据操作;
-
用于在内存数据结构和不同格式之间读写数据的工具:CSV 和文本文件、Microsoft Excel、SQL 数据库以及快速 HDF5 格式;
-
智能数据对齐和缺失数据综合处理:在计算中实现基于标签的自动对齐,轻松将杂乱的数据整理成有序的形式;
-
数据集的灵活重塑和旋转;
-
基于智能标签的切片、花式索引和 大型数据集的子集;
-
可以在数据结构中插入和删除列,以实现大小可变;
-
使用强大的分组引擎聚合或转换数据,允许对数据集进行拆分-应用-组合操作;
-
数据集的高性能合并和连接;
-
分层轴索引提供了一种在低维数据结构中处理高维数据的直观方法;
-
时间序列-功能:日期范围生成和频率转换、移动窗口统计、日期平移和滞后。甚至创建特定于域的时间偏移并连接时间序列而不会丢失数据;
-
高度优化性能,关键代码路径用 Cython或 C编写。
-
Python 与pandas广泛应用于各种学术和商业领域,包括金融、神经科学、经济学、统计、广告、网络分析等。
使命
pandas 的目标是成为用 Python 进行实际、真实世界数据分析的基本高级构建块。此外,它还有更广泛的目标,即成为任何语言中最强大、最灵活的开源数据分析/操作工具。
想象
数据分析和操作软件的世界是:
- 每个人都可以访问
- 免费供用户使用和修改
- 灵活的
- 强大的
- 便于使用
- 快速地
价值观
pandas的核心是尊重和欢迎每个人、用户、贡献者和更广泛的社区。无论经验水平、性别、性别认同和表达、性取向、残疾、个人外表、体型、种族、民族、年龄、宗教或国籍。