码迷,mamicode.com
首页 > 移动开发 > 详细

google play store的app数据分析

时间:2020-04-11 23:46:38      阅读:170      评论:0      收藏:0      [点我收藏+]

标签:nts   其他   浮点型   install   code   tor   mic   没有   均值   

1.分析目的:通过google play store的app数据分析进行业务方向指导

 

2.数据

导入框架

技术图片

导入数据

这次只分析‘App‘ ,‘Category‘ ,‘Rating‘ ,‘Reviews‘ ,‘Size‘ ,‘Installs‘ ,‘Type‘

技术图片

简单浏览下数据

技术图片

技术图片

查看行列数量

技术图片

查看各个列的非空数据量技术图片

有很多缺失值,需要清洗

 

3.数据清洗

App处理

查看有没有重复值

技术图片

有重复值,先不着急删除重复值,为了不把其他列的异常值留下,先处理数值异常的列

Category处理

技术图片

有一条异常值

技术图片

删除

技术图片

Rating处理

技术图片

用平均值填充

技术图片

技术图片

有一条值是19的异常记录,和Category的异常是同一条记录

Reviews清洗

技术图片

用value_counts看数据分布挺广,看起来都是数据

技术图片

技术图片

Size清洗

技术图片转换成浮点型

技术图片

技术图片

将Size为0的填充为平均数技术图片

Installs清洗

技术图片

分布比较少,直接替换

技术图片

转换

技术图片

Type处理

df.info() 查看到有na值,这里需要dropna参数

技术图片

技术图片

 删除这条数据

技术图片

数据清洗完毕,开始分析数据

 

4.数据处理和分析

分Category的数据

分类的个数

技术图片

每个分类的App数量,排序,可以得出哪些分类的app最受开发者欢迎

技术图片

分类的安装量排序:娱乐社交类最被用户需要

分类的评论数据:社交游戏评论多

技术图片

分类的打分数据,和其他数据不太一致,需要进一步分析

技术图片

分Type数据

技术图片

免费占比大,付费占比小,免费仍然是主流

Category和Type一起分析

技术图片

评论安装比

相关性:评论数和安装数强相关,其他的连0.1都不到,可以认为是不相关的(0.5以上可以认为是相关的,0.3以上可以认为是弱相关)

技术图片

 

google play store的app数据分析

标签:nts   其他   浮点型   install   code   tor   mic   没有   均值   

原文地址:https://www.cnblogs.com/daisyxxx/p/12682827.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!