[TOC]
*****
## 1.2. DataFrame 与 Series
dataframe是二维结构化数据,series是一维数据。 dataframe有一个或者多个series组成,dataframe的一行或者一列就是一个series。
### 1.2.1. Series的创建
**Series是能够存储任意数据类型的一维标签数组**
```
# 根据字典创建series
a = {"name":"xiaoming","age":18,"sex":"male"}
pd.Series(a,name='dict')
```
![](https://img.kancloud.cn/b2/e2/b2e2f141a28064270ea0683bb356195a_311x88.png)
```
# From scala
pd.Series(5,index=list("abcdef"))
```
![](https://img.kancloud.cn/9d/a5/9da59fe396f508a15e0f7d9c05a7978c_186x146.png)
```
#根据列表创建series s1
b = [1,2,3,4,5,6]
s1 = pd.Series(b,index = list("abcdef"))
```
series的values属性和index属性
![](https://img.kancloud.cn/b7/83/b7834681561148f67f5e9f858d9101c0_195x154.png)
![](https://img.kancloud.cn/3a/50/3a5029d95f254232932174cbb6c8f525_535x179.png)
### 1.2.2. DataFrame的创建
DataFrame中的任意一行或一列用type()都可知类型是series
```
#根据字典创建series
a = {"name":["xiaoming","xiaohong","xiaogang"],"age":[12,13,14]}
pd.DataFrame(data = a,index = list('abc'))
```
![](https://img.kancloud.cn/13/e8/13e8f340cadafa19a770cf4688e3f25e_184x137.png)
```
b = [
[1,2,3,4],
['a','b','c','d']
]
#根据二维数组创建series,abcd是列名,ab是索引
pd.DataFrame(b,columns=list("ABCD"),index= list('ab'))
```
![](https://img.kancloud.cn/00/81/00813cc8bcadebf7d1f6a4404bc29a3d_151x113.png)
```
a = {"name":"xiaoming","age":18,"sex":"male"}
s1 = pd.Series(a)
df_ = pd.DataFrame(s1,columns = ['Values'])
df_
```
![](https://img.kancloud.cn/90/30/903002254ab3e93d4509b178915429e5_140x153.png)
![](https://img.kancloud.cn/96/5e/965e53f4e1963e6d96cb490403dcfcc5_424x185.png)
- 第五节 Pandas数据管理
- 1.1 文件读取
- 1.2 DataFrame 与 Series
- 1.3 常用操作
- 1.4 Missing value
- 1.5 文本数据
- 1.6 分类数据
- 第六节 pandas数据分析
- 2.1 索引选取
- 2.2. 分组计算
- 2.3. 表联结
- 2.4. 数据透视与重塑(pivot table and reshape)
- 2.5 官方小结图片
- 第七节 NUMPY科学计算
- 第八节 python可视化
- 第九节 统计学
- 01 单变量
- 02 双变量
- 03 数值方法
- 第十节 概率
- 01 概率
- 02 离散概率分布
- 03 连续概率分布
- 第一节 抽样与抽样分布
- 01抽样
- 02 点估计
- 03 抽样分布
- 04 抽样分布的性质
- 第十三节 区间估计
- 01总体均值的区间估计:𝝈已知
- 02总体均值的区间估计:𝝈未知
- 03总体容量的确定
- 04 总体比率