只用一个公式完成EXCEL数据表有空值列的按条件筛选并去重计数的方法

AutoCAD | 朝鲜战争（1950-1953） | 炒股 | 扫地机器人 | 室内设计 | 美国留学 | 丹东市 | 方言 | matlab | 摩纳哥 | PHP | 机器学习 | 山阳县 | centos | 新西兰 | 细胞生物学 | 少数民族 | 工业机器人 | 直升机 | 大学专业 | 东海县 | 张宏伟 | 智利 | 视频会议 | 种植 | 在线教育 | 保险业 | 化学实验 | 首次公开募股（IPO） | C4D | 黄金投资 | 铅山县 | 女性主义 | 文案 | 莎车县 | 东京 | 电厂 | 情商 | iPad | 郭嘉 | 桌面游戏 | 按键精灵 | OneNote | 给排水 | 骑马与砍杀 | 媒体 | 阳信县 | 金融数学 | 小店区 | 航母 | 高中物理 | 插件 | 广告文案 | HTML | 植保无人机 | 外汇投资 | 德邦物流 | 创业团队 | 爬虫（计算机网络） | Spss数据分析 | 电脑硬件 | CSS | 易纲 | 房屋 | 电学 | 遗传学 | 航拍 | pdf | 白兰地 | 互联网创业 | 运载火箭 | 秦岭 | 徐州市 | 绿茶 | 风水堪舆学 | 整容 | Adobe After Effects | 3D Max | 传媒 | 文化差异 | CAD制图 | 民间借贷 | 计算机专业 | 老挝 | 江苏银行 | 韭菜 | 背景音乐（bgm） | 网盘 | 马克思主义 | 私募证券投资基金 | 亲子鉴定 | 外汇 | 虚拟机 | 摄影技巧 | 初中数学 | PMP | Microsoft SQL Server | 五行 | 央视 | 信托 | 公司法 | 软件开发 | 赎回 | 用户界面设计 | 退伍 | 美容整形 | 长城 | 3D打印机 | 塞浦路斯 | 景观设计 | 充电器 | 函数 | 分子生物学 | 名言 | 活动策划 | C#编程 | SEO | 创意 | 王兴 | Apple WATCH | 搜索引擎优化（seo） | 因果 | 宁晋县 | 火灾 | 动物保护 | 董卓 | 文身 | 产品 | 物联网 | 咖啡馆 | 幼儿园教师 | 电气工程及其自动化专业 | 人生规划 | 鱿鱼 | 基金定投 | Apple ID | 日本文化 | 后宫·甄嬛传（书籍） | 火影忍者 | 图形处理器（GPU） | 投资银行 | 建筑设计 | 大脑 | 生命 | 购机咨询 | 传统文化 | 希腊 | 3D | 组装机 | 摄影师 | 企业邮箱 | 语言学 | Microsoft Visual Studio | unity（游戏引擎） | 祛痘 | 国家开发银行 | 大城市 | 中药 | 佛法 | 创业想法 | 淘宝美工 | 气候 | 电风扇 | 黑洞 | .Net开发 | 广告人 | 嵌入式系统 | 图像处理 | 户外广告 | 益生菌 | 人性 | 理科 | 饮料 | 手工艺 | 几何学 | 港股 | 会计学习 | 进化 | 笔记本电脑 | 山地车 | 房地产开发商 | 电路设计 | 中国文化 | 五台山 | 快捷键 | 土地政策 | 汉服 | 显示器 | 茅台酒 | vmware虚拟机 | 重大疾病保险 | DJI大疆创新 | 核电站 | 养老 | 广州市 | Stm32 | 延安 | 嘉兴市 | 显卡 | 债券 |

你的位置：网站首页 >> 频道首页 >>microsoft excel >>只用一个公式完成EXCEL数据表有空值列的按条件筛选并去重计数的方法

只用一个公式完成EXCEL数据表有空值列的按条件筛选并去重计数的方法

来源：蜘蛛抓取(WebSpider) 时间：2022-05-15 13:24 标签：如何筛选出重复项只保留一项

有人说做数据无非几点：逻辑思路，技术工具和业务需求，1)逻辑思路中涵盖的大多是一些算法、规则；

3)业务逻辑里面则多为一些指标、客群等。

看着很多的内容，等处理过了才发现，无他，唯手熟尔~

做数据以来，难免会遇到各种处理方法上的问题，每次遇到问题点就整理一下关键的语句，逐渐的，才发现原来整理了一整套，今天抽取一些比较常用的语句，分成了几篇：

一篇是python的常用语句，

一篇是SQL的常规用法，

整理出来，也希望能给大家一些启发，后有Excel的内容，估计需要过段时间才能出场了。

这三篇文章不是告诉你一些系统的工具使用方法，而是针对那些经常使用python，但是又记不住数据处理的方法函数的人，做一个小技巧的总结。

下面先来说一下python的内容：

1、数据读取和筛选的方法

11、数据读写乱码和格式修改

1)数据的读写乱码主要有以下两种方案：

2)读取csv文件时转化成字符串的问题：

就是对表df中的a列各个值出现的次数进行统计。

Pandas中的数据透视表各功能

用过Excel透视表功能的话我们知道，出了统计出现次数之外，还可以选择计算某行的求和、最大最小值、平均值等(数据透视表对于数值类型的列默认选求和，文本类型默认选计数)，还是拿表df来说，excel的数据透视表可以计算a列的A、B、C三个元素对应的c列的求和（sum），但是pandas库并没有value_sum()这样的函数，pandas的sum函数是对整列求和的，例如df['b'].sum()是对b列求和，结果是21，和a列无关；所以我们可以自己按照根据a列分表再求和的思路去实现。自己造轮子的做法可以是：def

另外还有一个很重要的需求是统计某列不重复元素的计数，这个用数据透视表是不能直接算出来的，例如有一个用户订单表，一个用户可能下了多个订单，用户有渠道属性，需要统计一段时间内各渠道的付费用户数，直接在透视表的行选渠道，值选uid计数，得到的是没去重的结果，拿df表来说，假设c列是用户id，a列是渠道，想统计a列的A、B、C各渠道各有多少付费用户数，透视表的结果和期望的结果如下图：

常规透视表与期望的去重效果对比

可以看到直接对c列计数是不去重的，和我们想要的不一样。pandas库的.value_counts()库也是不去重的统计，查阅value_counts的官方文档可以发现，这个函数通过改变参数可以实现基础的分组计数、频率统计和分箱计数，normalize参数设置为True则将计数变成频率，例如df的a列中共有6行，而C出现了3次，于是C对应的值就是0.5；bin参数可以设置分箱；dropna可以设置是否考虑缺失值，默认是不考虑（可以结合normalize影响频率）；sort可以设置是否根据统计值进行排序(关于value_counts函数的更多内容可以再看下官方文档)。复用之前df_value_sum(df)的思路和代码，可以这么实现去重的计数需求：def

Python的去重计数实现

数据处理就是把，杂乱无章的数据，经过科学的系统的整理之后，变成我们所需要的数据的一个过程叫数据处理。

在数据清洗里主要是干这么三件事

被噩梦惊醒，头脑中一片空白。最恐怖的噩梦不是从头到尾的灾难，而是到手的幸福转瞬失去，窒息，悔恨，害怕种种感觉交织...

夫花秉孤芳，岂移冰雪之心？木标傲骨，不回金石之志。含气一如，体乾坤之清，摽实三下，应节序之变；报春温于凌寒，挺皎洁...

#V课会·第3季·小学30天思维导图实战营# 打卡天数：3/30 打卡时间：打卡主题:思维导图...

只用一个公式完成EXCEL数据表有空值列的按条件筛选并去重计数的方法

我要回帖

更多关于如何筛选出重复项只保留一项的文章

随机推荐

只用一个公式完成EXCEL数据表有空值列的按条件筛选并去重计数的方法

我要回帖

更多关于 如何筛选出重复项只保留一项 的文章

随机推荐

更多关于如何筛选出重复项只保留一项的文章