Mysql

关注公众号 jb51net

关闭
首页 > 数据库 > Mysql > MySQL 查找重复值

MySQL中查找重复值的实现

作者:1010n111

查找重复值是一项常见需求,比如在数据清理、数据分析、数据质量检查等场景下,我们常常需要找出表中某列或多列的重复值,具有一定的参考价值,感兴趣的可以了解一下

技术背景

在数据库管理中,查找重复值是一项常见需求。比如在数据清理、数据分析、数据质量检查等场景下,我们常常需要找出表中某列或多列的重复值。在MySQL里,有多种方法可以实现这一目的。

实现步骤

方法一:使用GROUP BY和HAVING子句

此方法可找出指定列中的重复值,并统计其出现次数。

SELECT name, COUNT(*) c FROM table GROUP BY name HAVING c > 1;

步骤:

方法二:仅返回重复值

SELECT varchar_col
FROM table
GROUP BY varchar_col
HAVING COUNT(*) > 1;

步骤:

方法三:返回完整记录

SELECT  *
FROM    mytable mto
WHERE   EXISTS
        (
        SELECT  1
        FROM    mytable mti
        WHERE   mti.varchar_column = mto.varchar_column
        LIMIT 1, 1
        )
ORDER BY varchar_column;

步骤:

方法四:获取重复行的ID

SELECT GROUP_CONCAT(id), name, COUNT(*) c
FROM documents
GROUP BY name
HAVING c > 1;

步骤:

方法五:使用子查询和IN关键字

SELECT * FROM table
   WHERE field IN (
     SELECT field FROM table GROUP BY field HAVING count(*) > 1
   ) ORDER BY field;

步骤:

方法六:多列组合查找重复值

SELECT COUNT(CONCAT(name,email)) AS tot,
       name,
       email
FROM users
GROUP BY CONCAT(name,email)
HAVING tot>1;

步骤:

方法七:使用窗口函数(MySQL 8.0+)

WITH cte AS (
  SELECT *
    ,COUNT(*) OVER(PARTITION BY col_name) AS num_of_duplicates_group
    ,ROW_NUMBER() OVER(PARTITION BY col_name ORDER BY col_name2) AS pos_in_group
  FROM table
)
SELECT *
FROM cte
WHERE num_of_duplicates_group > 1;

步骤:

核心代码

以下是上述部分方法的核心代码示例:

-- 方法一
SELECT name, COUNT(*) c FROM table GROUP BY name HAVING c > 1;

-- 方法二
SELECT varchar_col
FROM table
GROUP BY varchar_col
HAVING COUNT(*) > 1;

-- 方法三
SELECT  *
FROM    mytable mto
WHERE   EXISTS
        (
        SELECT  1
        FROM    mytable mti
        WHERE   mti.varchar_column = mto.varchar_column
        LIMIT 1, 1
        )
ORDER BY varchar_column;

-- 方法四
SELECT GROUP_CONCAT(id), name, COUNT(*) c
FROM documents
GROUP BY name
HAVING c > 1;

最佳实践

CREATE INDEX idx_varchar_column ON mytable (varchar_column);

常见问题

SELECT t1.id, t2.name
FROM table1 t1
JOIN table2 t2 ON t1.id = t2.id;

到此这篇关于MySQL中查找重复值的实现的文章就介绍到这了,更多相关MySQL 查找重复值内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家! 

您可能感兴趣的文章:
阅读全文