博客
关于我
数据分析面试题二:用户留存
阅读量:728 次
发布时间:2019-03-21

本文共 1541 字,大约阅读时间需要 5 分钟。

数据库优化方案

  • 创建数据库并指定字符集确保数据库在处理中文数据时避免乱码,在创建数据库时就指定存储格式和字符集。
  • CREATE DATABASE camera DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

    1. 创建用户信息表在使用数据库前,需要创建存储用户信息的表,并指定字段的存储类型和字符集。
    2. USE camera; CREATE TABLE act_use_userinfo ( uid VARCHAR(10) NOT NULL, app_name VARCHAR(20) NOT NULL, duration INT(10) NOT NULL, times INT(10) NOT NULL, dayno DATE NOT NULL );

      1. 插入用户数据将用户相关数据插入数据库表中。
      2. INSERT INTO act_use_userinfo (uid, app_name, duration, times, dayno) VALUES ('12345', '相机', 2, 3, '2021-05-18');

        1. 数据分析与报表功能开发
        2. 4.1 某日活跃用户数:某日的去重用户数

          SELECT dayno, COUNT(DISTINCT uid) AS active_users FROM act_use_userinfo WHERE app_name = '相机' GROUP BY dayno;

          4.2 次日留存:使用两表自交,利用case when找到符合相差日期为1天的id,计数,得出次日留存人数,最后用distinct去重

          实现方式一:通过增加临时字段

          可以通过在表中增加一个临时字段 is_next_day,表示是否为次日用户,用于统计留存率。以下是实现方式:

          ALTER TABLE act_use_userinfo ADD COLUMN is_next_day BOOLEAN After duration;

          UPDATE act_use_userinfo SET is_next_day = 1 WHERE dayno = DATE('2021-05-18') + interval '1 day' AND uid IN (SELECT uid FROM act_use_userinfo WHERE app_name = '相机' AND dayno = DATE('2021-05-18'));

          SELECT dayno, COUNT(DISTINCT uid) AS next_day_users FROM act_use_userinfo WHERE app_name = '相机' AND is_next_day = 1 GROUP BY dayno;

          实现方式二:不增加临时字段

          这种方法使用CTE(通用子查询)和ROW_NUMBER函数来计算次日留存人数。

          WITH cte AS ( SELECT ROWNUMBER() OVER (ORDER BY dayno, times DESC) AS row_num, uid, dayno, app_name FROM act_use_userinfo WHERE app_name = '相机' ORDER BY dayno, times )SELECT dayno, COUNT(DISTINCT uid) AS next_day_users FROM cte WHERE row_num > 1 GROUP BY dayno;

          4.3 其他需求(未详细说明)

          根据实际需求继续扩展表结构和查询逻辑,确保所有分析指标能够准确反映业务需求。

    转载地址:http://zhdgz.baihongyu.com/

    你可能感兴趣的文章
    SpringBoot之AOP详解
    查看>>
    PLC结构体(西门子)
    查看>>
    PLC编程语言ST文本语法的常用数据类型及变量
    查看>>
    PLC通讯方式
    查看>>
    Please install 'webpack-cli' in addition to webpack itself to use the CLI
    查看>>
    Ploly Dash,更新一个Dash应用程序JJJA上的实时人物
    查看>>
    Ploly烛台的定制颜色
    查看>>
    Ploly:如何在Excel中嵌入完全交互的Ploly图形?
    查看>>
    plotloss记录
    查看>>
    Plotly (Python) 子图:填充构面和共享图例
    查看>>
    Plotly 中的行悬停文本
    查看>>
    Plotly 停用 x 轴排序
    查看>>
    Plotly 域变量解释(多图)
    查看>>
    Plotly 绘制表面 3D 未显示
    查看>>
    Plotly-Dash 存在未知问题并创建“加载依赖项时出错“;通过使用 Python-pandas.date_range
    查看>>
    Plotly-Dash:如何过滤具有多个数据框列的仪表板?
    查看>>
    Plotly:如何为 x 轴上的时间序列设置主要刻度线/网格线的值?
    查看>>
    Plotly:如何从 x 轴删除空日期?
    查看>>
    Plotly:如何从单条迹线制作堆积条形图?
    查看>>
    Plotly:如何以 Root 样式绘制直方图,仅显示直方图的轮廓?
    查看>>