码迷,mamicode.com
首页 > 其他好文 > 详细

用户画像

时间:2019-06-18 23:03:41      阅读:264      评论:0      收藏:0      [点我收藏+]

标签:需要   落地   amp   封装   标签   rom   目标   ted   图片   

用户画像
营销推荐 邮件-短信-push信息(任务栏推荐)
有用的规律以支持决策
喜欢什么的东西的人往往喜欢什么
做了这个事的人一般接下来会做什么  啤酒与尿布

技术图片

 

技术图片

 


建模

客户消费订单
客户消费的情况来提取的客户标签
用于了解用户的消费总体情况,以根据用户消费习惯与消费能力做营销
订单表/退货表/退货表/购物车表
第一次消费时间/最近一次消费时间/首单距今时间
最小金额/累计消费次数/最大金额/累计使用代金券
客单价/近90天客单价
常用收货地区/常用支付方式
次数/商品件数/放弃件数
退货数量/金额/据收
反馈购物时间与地点习惯(上下班/早中晚)

客户购买类目表
根据客户购买类目的情况提取的客户标签
用于了解类目的购买人群情况和针对某一类目的营销等
类目维表/订单表
三级类目/购买次数/金额/累计金额
类目购物车次数/金额/累计金额/累计次数/最后一次购买时间/最后一次购买距今时间

客户购买商店表
根据客户购买商店的情况提取的客户标签
用于了解商店及品牌的购买人群情况
常用于针对某一品牌的营销,某店铺活动的营销
订单表/购物车表/商店表/退货表
商店id/名称/品牌名称/品牌id   一个商店包含多个品牌

客户基本属性表
根据客户所填的属性标签与推算出来的标签
用于了解用户的人口属性的基本情况和按属性统计
按人口属性营销,比如营销80后,对金牛的优惠,生日营销
用户表/用户调查表/孕妇模型表/马甲模型表/用户价值模型表
客户id/生日/省份/加密手机/登录来源/已使用积分
客户登录名/年龄/城市/注册时间/邀请人/会员等级名称
性别/大区域/邮箱/登录ip地址/会员积分/客户黑名单
根据多填信息得到
星座/箱运营商/城市等级/手机前几位/手机运营商

婚姻状况/月收入/是否有小孩/学历/职业/是否有车/使用手机品牌
得到数据:
性别模型/孩子性别/潜在汽车用户概率/使用多少种不同的手机/用户忠诚度/是否孕妇/孩子年龄概率
更换手机频率/用户购物类型/是否有小孩/是否有车/使用手机品牌档次/疑似马甲标志/身高/身材

性别模型
用户自己也填了性别,但仍然要使用算法算一次
用户性别 1男,0女,-1未识别  商品性别得分/用户购买上述商品计算用户性别得分/最优算法训练阈值
孩子性别 0仅有男孩 1仅有女孩 2男女均有 3无法识别 -1未识别  选择男童女童商品/购买商品的男女性别比例/训练阈值
性别验证方法
随机抽样几千条让客服电话确认/与用户自己填的性别做对比,确认百分比

用户汽车模型
用户是否有车 1有 -1未识别 根据用户购买车相关产品
潜在汽车用户 1有 -1未识别 用户浏览或搜索汽车/用户数据判断

用户忠诚度
忠诚度越高的用户越多,对网站的发展有利
1忠诚型用户 2偶尔型用户 3投资型用户 4浏览型用户 -1未识别
总体规则是判断+聚类算法
1浏览型 只浏览没购买
2购买天数大于一定天数的直接判断为忠诚型
3购买天数小于一定天数,大部分都是有优惠才购买的
4其他类型根据购买天数,购买最后一次距今时间,购买金额进行聚类

用户购物类型
归类方法很多,参考如下两种,对于营销参考意义比较大
1购物冲动型 2海涛犹豫型 3理性比较型 4目标明确型  -1未识别
计算用户在对三级品类购物前浏览时间和浏览SKU数量

1乐于尝试型 2价格敏感型 3消费冲动型 4昙花一现型 5重度消费型 -1未识别
计算用户对不同类型的商品的购买 频次与购买数量

用户身高尺码模型
方便根据身高与尺码控制进货与营销
男/女身高尺码  1身高断 -1未识别
男/女身材   1偏瘦 2标准 3偏胖 4肥胖 -1未识别

疑似马甲标志模型
马甲:一个用户注册多个账号
多次访问ip地址相同的相同账号是同一个所有
同一台手机登录多次的用户账号是同一个人所有
收货手机号相同的账号是同一个人所有

手机相关标签模型
对于手机营销参考意义比较大
使用手机品牌:最常用手机直接得到
使用手机品牌档次
使用多少种不同的手机
更换手机频率 :按时间看手机登录情况

客户营销信息表
将用户营销相关的常用标签放到一张表中,方便使用
用户表/订单表/活动表/购物车表/客户品类/用户价值

分群模型:品类分群,计算用户在各一级品类的购买金额
客户活跃状态模型:客户一般的活跃度 (注册未购买/活跃 高频/低频/中频) 沉默
用户价值模型:
体现用户对于网站的价值,用于提高用户留存率
使用RFM实现及用户价值模型参考指标
最近一次消费时间或者最后一次消费至今时间
消费频率
消费金额
计算方法:
使用指标:最近一次购买时间,近180天购买订单量,近180天购买金额,分5段(自定义)做分数计算
没有分数就是最近半年没有消费的用户,属于流失用户,即无价值用户,基本不会回来
区分 重要价值客户/重要保持客户/重要发展客户/重要挽留客户/一般.../无价值
购买频次高,金额大/很久没买/最近来购买,且金额大/金额大,频次低/.....
采用聚类算法,高/中/低/无价值

客户活动信息表
根据客户参与活动的情况提取的客户标签
用于了解用户对活动的参与情况,以进行活动策划或者根据对活动不同敏感的人群做营销
订单表/活动表/用户表/活动订单表

促销敏感度模型
根据用户购买的活动类型订单数与金额数以判断其属于哪类人群
单品促销高度/中/低/未识别   计算各类促销优惠的订单和金额占比
套装/团购/满返

用户购买力
购物车金额/客单价
败家指数/冲动指数

客户访问信息表
根据客户访问的情况提取客户标签
用于了解用户的访问总体情况,以根据用户浏览习惯做营销活动
PC端/APP端
访问日期/ip/城市/操作系统

注意:经常使用的聚类算法是 kmeans

数据仓库已经做好的工作
数据已经从源数据库抽取装载到BDM层
FDM层根据BDM层已经填入按天分区的数据
没有每天的调度,也没有辅助的系统,都是手动生成
数据是造的测试数据,只有DT=2015-01-01的
BDM层数据表 贴源的缓冲表
FDM层数据表 拉链表,或者按天区的表  根据BDM表处理转换而来
GDM层数据表 通用数据模型层  我们需要使用的数据

数据开发的前置依赖
需求确定
建模确定表结构
实现方案确定

数据开发的过程
表落地
按表写sql代码生成数据
部署代码   xxx.sh
数据测试
试运行与上线

date_sub
concat
coalesce  空转 0等
datediff  时间差距
to_date
row_number over   distributed by  sort by
FROM_UNIXTIME(unix_timestamp,format)
UNIX_TIMESTAMP()

用户画像基础知识
用户标签指标体系
搭建开发环境
标签数据存储
标签数据开发
开发性能调优
作业流程调度
用户画像产品化
用户画像应用

开发流程
目标解读 任务分解与需求调研  需求场景讨论与明确  应用场景与数据口径确认
特征选取与模型数据落表  线下模型数据验收与测试  线上模型发布与效果追踪

需要掌握的模块
数据开发 spark
数据存储和查询  hbase hive mysql
作业调度(ETL) crontab  airflow
流式计算  kafka  spark steaming
开发语言  hiveSql shell

需要知道开发哪些标签   
这些标签的调度流是如何构成的
如何对每天的调度作业进行监控
哪些数据库可用于存储标签,为何用这些数据库进行存储
开发的标签服务于业务上的哪些应用

需要开发的表
用户属性维度  用户行为维度  用户消费维度  用户风控维度
用户人群表  业务系统表 监控系统表  用户行为明细表  用户偏好  群体偏好

用户画像及其应用项目规划说明书
项目名称  项目背景及概要  项目目标  项目适用范围

系统功能及模型架构  
系统功能 底层数据源采集和存储 画像标签模型构建  数据模型应用
模型架构 原始数据统计分析 统计标签建模分析 模型标签预测分析

需求设计
用户画像模型 人口属性  行为属性  疾病问诊 订单消费  用户偏好 客户满意度

接口封装 push推送
UI设计
场景应用及流程
运行环境
网络与硬件设备
软件平台

用户标签应用实施方案说明书
标签开发内容
疾病标签 科室标签 医生标签 医院标签
应用实施流程
逻辑模型
数据字典
权重配置
时间衰减系数
执行结果

用户画像

标签:需要   落地   amp   封装   标签   rom   目标   ted   图片   

原文地址:https://www.cnblogs.com/fengyouheng/p/11048386.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!