码迷,mamicode.com
首页 > 其他好文 > 详细

电商数据分析-婴儿用品数据分析

时间:2020-06-26 18:14:53      阅读:129      评论:0      收藏:0      [点我收藏+]

标签:com   data-   渠道   status   ima   淘宝   男女比例   htbox   err   

导读

随着国家开放二胎政策,婴儿市场规模也在不断的扩大,根据淘宝天猫的婴儿用品购买情况,对产品进行多维度分析,分析市场需求,定位产品方向,从而在满足市场需求的同时,提高销量。

数据

数据源来自阿里天池:

包含两张表,购买商品表和婴儿信息表

购买商品表字段信息:用户ID 商品ID 商品二级分类 商品一级分类 商品属性 购买数量 购买日期

婴儿信息表字段信息:用户ID 出生日期 性别

提出问题

2.提出问题

相关指标

技术图片

提出问题

1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?

2.哪类商品最热销,可主推?

3.用户年龄段、性别对于销量的影响?如何做到精准营销?

分析思路

技术图片

 

3.数据清洗

1、选择子集

考虑到属性字段,都是一些编号,没办法具体分析,因此去除该字段

2、列名重命名

这里把英文名改成中文名称

3、一致化处理

两张表都需要对日期进行处理,转换成标准的日期格式,text函数进行格式化统一

技术图片

 

 

 技术图片

4、数据整合

使用vlookup,根据用户id,匹配婴儿相关信息,但是整合后发现有很多数据无法匹配到婴儿信息,因此在后续关于婴儿相关分析的时候只会提取能匹配上的部分数据

技术图片

异常值处理

关于婴儿性别,0代表女,1代表男,2代表未知,要对2的异常数据进行处理,这里按照男女比例进行大概处理,

男女比例为:438:489 ,总共26个异常值,因此把12个替换成1,14个替换成0

利用if函数替换成男和女

技术图片

 

 

 

 

4.数据分析

1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?

1.首先,对销量进行多维度拆解,分成【新用户购买量】 和 【老用户购买量】,分别进行分析,但是经过计算,该测试数据,老用户的复购率特别低,因此可以忽略,直接从新用户购买数量,在时间维度上进行分析。

技术图片

下图是商品的总体走势

 

 

 技术图片

接下来我们看看每年的每个月的走势对比

技术图片

 

 通过走势分析发现,在每年的5月,9月,11月都有不同程度的高峰凸起,整体呈现上涨趋势,接下来分析,为什么销量上涨,

 

 

 2.这里可以采用4P营销理论,利用假设检验法,分别从产品、价格、渠道、宣传,四个方面进行分析。

产品维度

假设:新增产品类带来销量的上升

收集证据:下面是每年各月的二级分类商品数目对比

 

电商数据分析-婴儿用品数据分析

标签:com   data-   渠道   status   ima   淘宝   男女比例   htbox   err   

原文地址:https://www.cnblogs.com/wgwg/p/13195665.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!