Excel中有多个区间的序列需要填充?

    Pandas 有很多高级的功能,但是想要掌握高级功能前,需要先掌握它的基础知识,Pandas 中的数据结构算是非常基础的知识之一了。Pandas 常用的数据结构有两种:Series 和 DataFrame。这些数据结构构建在 Numpy 数组之上,这意味着它们效率很高。



8、获得表中数值类型指端的分布值(和、平均值、方差等)

2、判断哪个值是缺失值

3、默认删除含缺失值的行

4、删除全为空值的行,不全为空值的行不会删除

6、对性别列中空值填充男,年龄填充30

7、默认对所有值进行重复值检查,保留第一行的值

8、对性别列中重复值查询保留第一行

9、对性别和公司两列查重

10、查看ID列的数据类型

11、将ID列的数据类型转换为float类型

12、ID列的第二个数据

13、为无索引表添加列索引

15、指明要用的列作为行索列

16、对行索引进行重新命名

17、对列索引进行重新命名



2、用行列编号选择数据

3、选取表中的第3行2列数据,第一行默认为列索引

4、获取第1列到第4列的值

5、loc用行名选取的行数据,格式是Series,但可以用列表形式访问

6、iloc用行编号选取行数据

7、多行编号选取行数据,要用list封装,不然变成行列选取

8、选择第二行和第四行

9、加判断条件返回符合条件的全部数据,不局限年龄列

10、判断多条件选择数据

12、先通过年龄条件选择行,再通过不同索引指定列



1、对年龄列中的100替换成33

3、多对一替换,A、B替换成C

5、申请单编号列降序排列,Ture升序排列(默认)

6、申请单编号列升序排列,缺失值排在第一位

9、删除列,直接是列名

11、此种方式删除列,可以不写axis=1

12、删除行,直接是列名

14、此种方式删除行,可以不写axis=0

15、对ID列中数据出现的次数进行统计

16、对ID列中数据出现的次数占比进行统计,并降序排序

18、查看这列中是否包含a或11

19、用bins指明切分区间

20、ID列切分成3个部分,每部分数据个数尽量一致

22、插新列,在表的最后面

24、把表格型数据转化成树形数据

25、宽表转换成长表,先将共同列设置成行索引,再对其他列

28、对表中的所有数据执行相同函数运算



3、统计每列的非空值的个数

4、统计每行的非空值的个数

5、统计指定列的非空值的个数

10、每列/行求中间值

11、每列/行中出现最多的值

13、每列/行求标准差

14、求1/4分位数,可以0.5、0.75等分位数



2、返回现在的时间年月日时分秒

3、返回年,可以.month或.day返回月或日

8、将字符串的时间转化成为时间格式

10、获取2018年的数据

11、获取2018年1月的数据

12、获取这个时段的数据



1、客户分类后求数运算

2、客户分类后求和运算

3、多列分类后求和运算

4、多列分类后ID求和运算

8、aggregate可针对不同列做不同的汇总运算

9、分组汇总后再重置索引,变为标准DataFrame



1、默认自动寻找两个表中的公共列进行拼接

2、on来指定连接列,连接列要是公共列

3、由公共列,但类名不同时用左右键指定

4、公共列一个时索引列一个时普通列

5、返回公共列中对应的公共值拼接(内连接)

6、返回公共列中对应的左表值(左连接)

7、返回公共列中对应的右表值(右连接)

8、返回公共列中对应的所有值(外连接)

9、两个结构相同的表纵向连接,保留原索引值

10、两个结构相同的表纵向连接,重新设置索引值

11、拼接后去掉重复值



5、导出多个文件至一个文件的多个sheet

  • Python数据可视化的完整版操作指南

  • 基于Python实现相关分析案例

  • Pandas教程:初学者入门必备,很全面,很详解!

在表格或数值数组的首列查找指定的数值,并由此返回表格或数组中该数值所在行中

,可以理解为表格中的一个区域。数组的列序号:数组的

是这个区域的第一纵列,此列右边依次为第

(查找值,区域,列序号,逻辑值)

:为需要在数组第一列中查找的数值,它可以是数值、引用或文字符串。

,也可以使用对区域或区域名称的引用,例如数

:即希望区域(数组)中待返回的匹配值的列序号,为

时,返回第二列中的数值,以此类推;若列序号小于

;如果大于区域的列数,函数

返回时是精确匹配还是近似

或省略,则返回近似匹配值,也就是说,如果找不到精确匹配值,则

第一列中的最小数值,函数

中存放小麦、水稻、玉米、花生等若干农产品的销售单价:

1.“大数据”是指规模超过1000TB的数据集。

2.概率为0的事件是不可能事件,概率为1的事件是必然事件。

3.将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为等距抽

4.统计图中的散点图主要用来观察变量之间的相关关系。

5.抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。

6.Datahoop1.2版中 K-means聚类分析要求输入的数据必须是数值型数据。

9.聚类分析中,各变量的取值在数量级上不能有过大的差异。

10.如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。

下载文档原格式(Word原格式,共11页)

我要回帖

更多关于 多行序列填充 的文章

 

随机推荐