关于Pandas

发展历史

2008 年，AQR Capital Management开始了pandas 的开发。到 2009 年底，它已经开源，并且今天得到了世界各地志同道合的个人社区的积极支持，他们贡献了宝贵的时间和精力来帮助开源pandas成为可能。感谢我们所有的贡献者。

自 2015 年起，pandas成为NumFOCUS 赞助的项目。这将有助于确保pandas作为世界级开源项目的成功开发。

时间线

2008年：开始开发pandas
2009：pandas开源
2012 年：第一版Python 数据分析出版
2015 年：pandas成为NumFOCUS 赞助项目
2018：第一次现场核心开发冲刺

图书馆亮点

快速高效的DataFrame对象，用于具有集成索引的数据操作；
用于在内存数据结构和不同格式之间读写数据的工具：CSV 和文本文件、Microsoft Excel、SQL 数据库以及快速 HDF5 格式；
智能数据对齐和缺失数据综合处理：在计算中实现基于标签的自动对齐，轻松将杂乱的数据整理成有序的形式；
数据集的灵活重塑和旋转；
基于智能标签的切片、花式索引和大型数据集的子集；
可以在数据结构中插入和删除列，以实现大小可变；
使用强大的分组引擎聚合或转换数据，允许对数据集进行拆分-应用-组合操作；
数据集的高性能合并和连接；
分层轴索引提供了一种在低维数据结构中处理高维数据的直观方法；
时间序列-功能：日期范围生成和频率转换、移动窗口统计、日期平移和滞后。甚至创建特定于域的时间偏移并连接时间序列而不会丢失数据；
高度优化性能，关键代码路径用 Cython或 C编写。
Python 与pandas广泛应用于各种学术和商业领域，包括金融、神经科学、经济学、统计、广告、网络分析等。

使命

pandas 的目标是成为用 Python 进行实际、真实世界数据分析的基本高级构建块。此外，它还有更广泛的目标，即成为任何语言中最强大、最灵活的开源数据分析/操作工具。

想象

数据分析和操作软件的世界是：

每个人都可以访问
免费供用户使用和修改
灵活的
强大的
便于使用
快速地

价值观

pandas的核心是尊重和欢迎每个人、用户、贡献者和更广泛的社区。无论经验水平、性别、性别认同和表达、性取向、残疾、个人外表、体型、种族、民族、年龄、宗教或国籍。