Medieval Empires中文网
领取MOLI红包
python常见统计分析处理函数解读
发布日期:2025-01-03 17:25    点击次数:199
一、分组统计 1、分组后对不同指标统计分析 2、数据框中多列同时乘以同一列值计算 二、重要函数(apply、map、filter、query、replace、reduce) 1、对数据框下的列进行统计分析:apply+lambda函数 2、数据类型转换(float—int):map()函数 map 函数,它接收两个参数,第一个参数是一个函数对象 (当然也可以是一个lambda表达式),第二个参数是一个序列。 2.1、删除数据间空格 map+strip 3、数据筛选filter()函数 flter 函数,和map 函数相似。同样也是接收两个参数,一个lambda 表达式,一个序列。 它会遍历后面序列中每一个元素,并将其做为参数传入lambda表达式中,当表达式返回 True,则元素会被保留下来,当表达式返回 False,则元素会被丢弃。 4、np.where和query 5、replace替换(两种:对每个记录修改,记录中数据修改) 6、reduce函数 reduce 函数,也是类似的。它的作用是先对序列中的第 1、2 个元素进行操作,得到的结果再与第三个数据用 lambda 函数运算,将其得到的结果再与第四个元素进行运算,以此类推下去直到后面没有元素了。 三、行/列相关操作 1、删除列/行操作 2、 查找某列特征数据(字符型) 筛选某列数据不为空的数据集:notnull() 3、列重命名 4、包含某个特殊字符的列:contains() 5、筛选需要的行业数据:存在isin()/不存在 6、根据某几列数据排序sort_values() 7、统计gram列每种语言出现的次数 8、将空值用上下值的平均值进行填充 9、交换两列的位置 10、新增一列根据salary将数据分为三组 11、将两列合成一列 12、拆分某列,生成新的Dataframe 13、多列减去一列 四、数据框 1、对数据框按照分组进行标准化 2、数据透视表 3、统计指标0和空值数据 4、检查数据中是否含有任何缺失值 5、数据向前/后移动5天 6、按周采样,取一周最大值 7、计算前一天与后一天变化率 8、将小数转化为百分数 9、列表生成式:新增数据列 10、新建excel写入数据 五、时间数据 1、时间范围区间选择:date_range 2、将time列时间转换为月-日(月、年月日) 忽略警告 总结 以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

上一篇:没有了
下一篇:Tu 212 Cells|人喉癌克隆细胞价格 厂家:上海冠导生物工程有限公司