Oracle数据库查询重复数据及删除重复数据方法

271次阅读

没有评论

共计 1513 个字符，预计需要花费 4 分钟才能阅读完成。

工作中，发现 Oracle 数据库表中有许多重复的数据，而这个时候老板需要统计表中有多少条数据时（不包含重复数据），只想说一句 MMP，库中好几十万数据，肿么办，无奈只能自己在网上找语句，最终成功解救，下面是我一个实验，很好理解。

假设有一张人员信息表 cs（姓名，证件号，地址），将表中三个字段数据都重复的数据筛选出来：

Oracle 数据库查询重复数据及删除重复数据方法

distinct: 这个关键字来过滤掉多余的重复数据只保留一条数据

select * from from cs —— 所有字段

select distinct xm,zjh,dz from cs; —– 指定字段

Oracle 数据库查询重复数据及删除重复数据方法

在实践中往往只用它来返回不重复数据的条数，因为 distinct 对于一个数据量非常大的库来说，无疑是会直接影响到效率的。

———————————————————————————————————————–

查询重复数据、删除重复数据的方法如下：↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓

①rowid 用法：oracle 带的 rowid 属性, 进行判断是否存在重复数据。

查询重复数据：

select a.* from cs a where rowid !=(select max(rowid) from cs b where a.xm=b.xm and a.zjh=b.zjh and a.dz=b.dz)

Oracle 数据库查询重复数据及删除重复数据方法

删除重复数据：

delete from cs a where rowid !=(select max(rowid) from cs b where a.xm=b.xm and a.zjh=b.zjh and a.dz=b.dz)

Oracle 数据库查询重复数据及删除重复数据方法

②group by：一般用于将查询结果分组，多配合聚合函数，sum，count，min，max,having 等一起使用。

查询重复数据：

select max(xm),max(zjh),max(dz),count(xm) as 记录数 from cs group by xm having count(xm)>1 ——— 适用于字段少的

Oracle 数据库查询重复数据及删除重复数据方法

select * from cs a where (a.xm,a.zjh,a.dz) in (select xm,zjh,dz from cs group by xm,zjh,dz having count(*)>1)

and rowid not in (select min(rowid) from cs group by xm,zjh,dz having count(*)>1) ——- 适用于多字段

Oracle 数据库查询重复数据及删除重复数据方法

去重重复数据：多个字段，只留有 rowid 最小的记录。

delete from cs a where (a.xm,a.zjh,a.dz) in (select xm,zjh,dz from cs group by xm,zjh,dz having count(*)>1) and rowid not in (select min(rowid) from cs group by xm,zjh,dz having count(*)>1)

Oracle 数据库查询重复数据及删除重复数据方法

③row_number()over(partition by 列)

select xm,zjh,dz,row_number()over(partition by zjh order by xm) 记录号 from cs

Oracle 数据库查询重复数据及删除重复数据方法

去重重复数据：

with cs1 as (select xm,zjh,dz,row_number()over(partition by zjh order by zjh) 记录号 from cs)select * from cs1 where 记录号 =1

Oracle 数据库查询重复数据及删除重复数据方法

更多 Oracle 相关信息见 Oracle 专题页面 https://www.linuxidc.com/topicnews.aspx?tid=12

：

正文完

星哥玩云-微信公众号

发表至：数据库技术

2022-01-22

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

MongoDB的集群模式–Sharding(分片)

SSDB 安装部署及注意事项总结

Oracle 11g RAC删除节点相关事项

Oracle重建控制文件 – Rebuild controlfile

关于 Oracle 实例管理

为什么MySQL默认事务隔离级别是RR

虚拟机Ubuntu 16.04安装 MySQL 主机配置访问

MySQL5.6.18解压包版在RHEL6.7上安装

Oracle 11g安装时报启动服务出现错误，找不到OracleMTSRecoveryService的解决方法

Oracle数据库查询重复数据及删除重复数据方法

开源堡垒机JumpServer配置教程：使用步骤与配置

申请腾讯混元的API Key并且使用LobeChat调用混元AI

系统加固-Linux不允许用户使用密码登录，只能使用密钥登录

【开源安全保护】如何安装JumpServer堡垒机

基于Docker快速搭建一个开源的IT人员在线工具箱-it-tools

聊聊：Linux的内存管理机制

第四节：Bash编程易犯的错误

Handbrake：开源的视频格式转换软件

Mariadb学习总结（八）：聚合函数及分组查询

8张Linux思维导图，加速你的IT成长之路！