更新日期:2018年12月12日
pandas是一个提供快速,灵活和表达性数据结构的Python包,旨在使“关系”或“标记”数据变得简单直观。它旨在成为在Python中进行实用的真实世界数据分析的基本高级构建块。此外,它的更广泛的目标是成为最强大和最灵活的任何语言的开源数据分析/操作工具。它已经很好地朝着这个目标前进了。
注意:
本文档假定你熟悉NumPy。如果你还没有熟练使用NumPy或者根本没用过numpy,请先花一些时间学习NumPy。
目录:
新功能
安装
为pandas贡献
常见问题(FAQ)
套装概述
10分钟入门pandas
教程
指引
数据结构简介
基本基本功能
使用文本数据
选项和设置
索引和选择数据
MultiIndex /高级索引
计算工具
使用缺失数据
分组:split-apply-combine
合并,连接和连接
整形和数据透视表
时间系列/日期功能
时间Deltas
分类数据
可视化
样式
IO工具(文本,CSV,HDF5,...)
远程数据访问
增强性能
稀疏数据结构
告诫和诀窍
rpy2 / R interface
pandas生态系统
与R / R库比较
与SQL比较
与SAS的比较
API参考
内部
发行说明