How can I remove duplicate rows?(如何删除重复的行?)
问题描述
从相当大的 SQL Server 表(即 300,000+ 行)中删除重复行的最佳方法是什么?
What is the best way to remove duplicate rows from a fairly large SQL Server table (i.e. 300,000+ rows)?
当然,由于 RowID 标识字段的存在,这些行不会完全重复.
The rows, of course, will not be perfect duplicates because of the existence of the RowID identity field.
MyTable
RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null
推荐答案
假设没有空值,你 GROUP BY 唯一列,SELECT MIN (或 MAX) RowId 作为要保留的行.然后,删除所有没有行 ID 的内容:
Assuming no nulls, you GROUP BY the unique columns, and SELECT the MIN (or MAX) RowId as the row to keep. Then, just delete everything that didn't have a row id:
DELETE FROM MyTable
LEFT OUTER JOIN (
SELECT MIN(RowId) as RowId, Col1, Col2, Col3
FROM MyTable
GROUP BY Col1, Col2, Col3
) as KeepRows ON
MyTable.RowId = KeepRows.RowId
WHERE
KeepRows.RowId IS NULL
如果你有一个 GUID 而不是整数,你可以替换
In case you have a GUID instead of an integer, you can replace
MIN(RowId)
与
CONVERT(uniqueidentifier, MIN(CONVERT(char(36), MyGuidColumn)))
这篇关于如何删除重复的行?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:如何删除重复的行?
基础教程推荐
- 是否可以执行按位分组功能? 2021-01-01
- 如何使用 mysql.connector 禁用查询缓存 2022-01-01
- SQL Server 实例在登录协商期间返回无效或不受支持的协议版本 2021-01-01
- 无法解决整理冲突 2021-01-01
- 将 SQL Server DateTime 列迁移到 DateTimeOffset 2021-01-01
- 需要 MySQL 5.1 中的抽象触发器来更新审计日志 2021-01-01
- SSMS 中的权限问题:“对象 'extended_properties'、数据库 'mssqlsystem_resource'、... 错误 229)上的 SELECT 权限被拒绝" 2022-01-01
- SQL:使用来自具有相同列名的两个表中的数据... 2021-01-01
- SQL 效率:WHERE IN 子查询 vs. JOIN 然后 GROUP 2021-01-01
- 在 SQL 中连接多个表 2021-01-01
