你的位置:Medieval Empires中文网 > BRZ中文网 >
python常见统计分析处理函数解读
发布日期:2025-01-03 17:25 点击次数:199
一、分组统计
1、分组后对不同指标统计分析
2、数据框中多列同时乘以同一列值计算
二、重要函数(apply、map、filter、query、replace、reduce)
1、对数据框下的列进行统计分析:apply+lambda函数
2、数据类型转换(float—int):map()函数
map 函数,它接收两个参数,第一个参数是一个函数对象 (当然也可以是一个lambda表达式),第二个参数是一个序列。
2.1、删除数据间空格 map+strip
3、数据筛选filter()函数
flter 函数,和map 函数相似。同样也是接收两个参数,一个lambda 表达式,一个序列。
它会遍历后面序列中每一个元素,并将其做为参数传入lambda表达式中,当表达式返回 True,则元素会被保留下来,当表达式返回 False,则元素会被丢弃。
4、np.where和query
5、replace替换(两种:对每个记录修改,记录中数据修改)
6、reduce函数
reduce 函数,也是类似的。它的作用是先对序列中的第 1、2 个元素进行操作,得到的结果再与第三个数据用 lambda 函数运算,将其得到的结果再与第四个元素进行运算,以此类推下去直到后面没有元素了。
三、行/列相关操作
1、删除列/行操作
2、 查找某列特征数据(字符型)
筛选某列数据不为空的数据集:notnull()
3、列重命名
4、包含某个特殊字符的列:contains()
5、筛选需要的行业数据:存在isin()/不存在
6、根据某几列数据排序sort_values()
7、统计gram列每种语言出现的次数
8、将空值用上下值的平均值进行填充
9、交换两列的位置
10、新增一列根据salary将数据分为三组
11、将两列合成一列
12、拆分某列,生成新的Dataframe
13、多列减去一列
四、数据框
1、对数据框按照分组进行标准化
2、数据透视表
3、统计指标0和空值数据
4、检查数据中是否含有任何缺失值
5、数据向前/后移动5天
6、按周采样,取一周最大值
7、计算前一天与后一天变化率
8、将小数转化为百分数
9、列表生成式:新增数据列
10、新建excel写入数据
五、时间数据
1、时间范围区间选择:date_range
2、将time列时间转换为月-日(月、年月日)
忽略警告
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。
上一篇:没有了
下一篇:Tu 212 Cells|人喉癌克隆细胞价格 厂家:上海冠导生物工程有限公司