Mysql

关注公众号 jb51net

关闭
首页 > 数据库 > Mysql > MySQL统计工作日数据

MySQL实现优雅统计工作日(周一至周五)数据

作者:身如柳絮随风扬

在实际业务中,我们常常需要统计工作日(周一至周五) 的访问量、订单量或用户活跃度,而剔除周末数据,本文将从基础方法到高级优化,系统讲解如何高效统计工作日数据,并提供生产级建议,有需要的可以了解下

在实际业务中,我们常常需要统计工作日(周一至周五) 的访问量、订单量或用户活跃度,而剔除周末数据。MySQL 提供了多种日期函数来实现这一需求,但不同方案在可读性、性能、索引利用上差异显著。本文将从基础方法到高级优化,系统讲解如何高效统计工作日数据,并提供生产级建议。

一、业务场景与挑战

假设有一张访问记录表 visits

CREATE TABLE visits (
    id INT PRIMARY KEY AUTO_INCREMENT,
    visit_date DATETIME NOT NULL,   -- 访问时间
    user_id INT,
    page VARCHAR(100)
);

需求:统计每天(或某时间段内)工作日的人次,且要求查询高效、支持大数据量。

挑战:

二、基础查询方法对比

MySQL 提供多个函数用于判断星期几,各有特点:

函数返回值范围周一对应值周日对应值特点
WEEKDAY(date)0 ~ 606以周一为起点,适合“周一到周五”判断(<=4)
DAYOFWEEK(date)1 ~ 721以周日为起点,判断工作日需 BETWEEN 2 AND 6
DAYNAME(date)字符串 (‘Monday’…)‘Monday’‘Sunday’可读性好,但分组/过滤时需字符串比较
DATE_FORMAT(date, '%w')0 ~ 6(周日=0)10兼容性一般,周日为0需注意

推荐使用 WEEKDAY(),因为其返回值直接对应“周一=0,周五=4”,条件 <=4 语义清晰。

方法1:使用 WEEKDAY() 函数

SELECT 
    DATE(visit_date) AS visit_day,
    COUNT(*) AS visit_count
FROM visits
WHERE WEEKDAY(visit_date) <= 4   -- 0~4 周一到周五
GROUP BY DATE(visit_date)
ORDER BY visit_day;

优点:简单直观。

缺点WEEKDAY(visit_date) 无法使用 visit_date 上的普通索引。

方法2:使用 DAYOFWEEK() 函数

SELECT 
    DATE(visit_date) AS visit_day,
    COUNT(*) AS visit_count
FROM visits
WHERE DAYOFWEEK(visit_date) BETWEEN 2 AND 6   -- 2=周一,6=周五
GROUP BY DATE(visit_date);

两者性能相近,但 WEEKDAY 更贴近中国人“周一为一周第一天”的习惯。

方法3:增加星期名称列(可读性优先)

SELECT 
    DATE(visit_date) AS visit_day,
    CASE WEEKDAY(visit_date)
        WHEN 0 THEN '周一'
        WHEN 1 THEN '周二'
        WHEN 2 THEN '周三'
        WHEN 3 THEN '周四'
        WHEN 4 THEN '周五'
        ELSE '周末'
    END AS weekday_cn,
    COUNT(*) AS visit_count
FROM visits
WHERE WEEKDAY(visit_date) <= 4
GROUP BY DATE(visit_date);

三、性能优化方案

当数据量达到百万级且查询频繁时,必须解决 函数导致索引失效 的问题。以下按优化程度递增给出三种方案。

3.1 方案一:范围过滤 + 函数计算(小数据量可用)

如果查询时间范围较小(如一周),MySQL 会先根据 visit_date 的索引过滤出该周数据,再计算 WEEKDAY。此时性能尚可。

-- 假设查询2025-05-12到2025-05-18这一周的数据
SELECT DATE(visit_date), COUNT(*)
FROM visits
WHERE visit_date BETWEEN '2025-05-12 00:00:00' AND '2025-05-18 23:59:59'
  AND WEEKDAY(visit_date) <= 4
GROUP BY DATE(visit_date);

3.2 方案二:虚拟列 + 函数索引(MySQL 8.0+)

MySQL 8.0 支持函数索引,可以直接在表达式上创建索引,无需修改表结构。

-- 创建函数索引(直接对 WEEKDAY(visit_date) 建立索引)
CREATE INDEX idx_visit_weekday ON visits ((WEEKDAY(visit_date)));

查询时索引会自动生效:

SELECT DATE(visit_date), COUNT(*)
FROM visits
WHERE WEEKDAY(visit_date) <= 4
GROUP BY DATE(visit_date);

注意:函数索引要求 MySQL 8.0.13+,并且函数必须标记为 DETERMINISTIC(如 WEEKDAY 本身是确定性的)。

3.3 方案三:存储生成列(虚拟列) + 普通索引(兼容更广)

对于 MySQL 5.7 或需要兼容更广泛版本的场景,可以增加一个虚拟列存储星期几,并对该列建立索引。

-- 添加虚拟列(不占用额外存储,实时计算)
ALTER TABLE visits 
ADD COLUMN weekday_val TINYINT 
GENERATED ALWAYS AS (WEEKDAY(visit_date)) STORED;  -- 或 VIRTUAL

-- 为虚拟列创建索引
CREATE INDEX idx_weekday ON visits(weekday_val);

-- 查询时使用虚拟列
SELECT DATE(visit_date), COUNT(*)
FROM visits
WHERE weekday_val <= 4
GROUP BY DATE(visit_date);

3.4 方案四:预聚合汇总表(终极性能)

如果统计需求固定为“按日统计工作日数据”,可以维护一张日汇总表,通过定时任务或触发器增量更新。

CREATE TABLE visits_daily_summary (
    visit_date DATE PRIMARY KEY,
    total_count INT DEFAULT 0,
    weekday_count INT DEFAULT 0,
    weekend_count INT DEFAULT 0,
    updated_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
);

增量更新逻辑(每日凌晨执行或每笔写入时更新):

INSERT INTO visits_daily_summary (visit_date, total_count, weekday_count)
SELECT 
    DATE(visit_date),
    COUNT(*),
    SUM(WEEKDAY(visit_date) <= 4)
FROM visits
WHERE visit_date >= CURDATE() - INTERVAL 1 DAY
  AND visit_date < CURDATE()
GROUP BY DATE(visit_date)
ON DUPLICATE KEY UPDATE
    total_count = total_count + VALUES(total_count),
    weekday_count = weekday_count + VALUES(weekday_count);

查询时直接读汇总表,毫秒级响应,且完全避免函数计算。

四、方法选择流程图

五、常见陷阱与注意事项

时区问题WEEKDAY() 基于会话时区,如果数据时间是 UTC,查询时需转换 CONVERT_TZ

跨年周WEEKDAY 只判断星期几,不关心周数。若需按自然周统计(周一到周日),需结合 YEARWEEK()

NULL 值visit_date 应为 NOT NULL,否则 WEEKDAY(NULL) 返回 NULL,条件不成立。

性能误区:即使使用函数索引,WHERE WEEKDAY(date) <= 4 AND date BETWEEN ... 仍可能部分走索引。应分析 EXPLAIN 确认。

六、综合示例:统计某月的工作日日均访问量

-- 查询 2025年5月 工作日的日均访问量(使用虚拟列方案)
SELECT 
    COUNT(*) / COUNT(DISTINCT DATE(visit_date)) AS avg_weekday_visits
FROM visits
WHERE visit_date >= '2025-05-01' 
  AND visit_date < '2025-06-01'
  AND weekday_val <= 4;   -- 假设已添加虚拟列并建立索引

七、总结

方法适用场景索引利用开发成本维护成本
WEEKDAY() 直接过滤临时查询、小表❌ 全表扫描
函数索引 (8.0+)中等表,不想改结构✅ 高效
虚拟列 + 索引5.7 环境,中等表✅ 高效
预聚合表大表、高频统计✅ 极快中(需 ETL)

推荐策略

到此这篇关于MySQL实现优雅统计工作日(周一至周五)数据的文章就介绍到这了,更多相关MySQL统计工作日数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文