原文:《BI那点儿事》运用标准计分和离差——分析三国超一流统帅综合实力排名 绝对客观,数据说话数据分析基础概念:标准计分: 1、无论作为变量的满分为几分,其标准计分的平均数势必为0,而其标准差势必为1。2、无论作为变量的单位是什么,其标准计分的平均数势必为0,而其标准差势必为1。公式为:
离差:离差...
分类:
其他好文 时间:
2014-12-11 10:04:05
阅读次数:
198
数据分析基础概念:标准计分: 1、无论作为变量的满分为几分,其标准计分的平均数势必为0,而其标准差势必为1。2、无论作为变量的单位是什么,其标准计分的平均数势必为0,而其标准差势必为1。公式为:离差:离差就是应用标准计分所得的数值。1、无论作为变量的满分为几分,其离差的平均数势必为50,而其标准差势...
分类:
其他好文 时间:
2014-12-10 21:07:18
阅读次数:
268
原文:《BI那点儿事》三国人物智力分布状态分析献给广大的三国爱好者们,希望喜欢三国的朋友一起讨论,加深对传奇三国时代的了解数据分析基础概念:数据分为“不可测量”的数据和“可测量”的数据。不可测量的数据称为“分类数据”(Category Data或Categorical Data。),而可测量的数据称...
分类:
其他好文 时间:
2014-12-10 14:00:57
阅读次数:
190
原文:《BI那点儿事》数据挖掘各类算法——准确性验证准确性验证示例1:——基于三国志11数据库
数据准备:
挖掘模型:依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法提升图:
依次排名为: 1. 神经网络算法(92.69% 0.99)2. 逻辑回归...
分类:
编程语言 时间:
2014-12-02 10:32:29
阅读次数:
222
原文:《BI那点儿事》三国数据分析系列——蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析献给广大的三国爱好者们,希望喜欢三国的朋友一起讨论,加深对传奇三国时代的了解
数据分析基础概念:集中趋势分析是指在大量测评数据分布中,测评数据向某点集中的情况。总体(population)是指客观存在的,并在同...
分类:
其他好文 时间:
2014-12-02 10:26:25
阅读次数:
193
原文:《BI那点儿事》Microsoft 决策树算法——找出三国武将特性分布,献给广大的三国爱好者们根据游戏《三国志11》武将数据,利用决策树分析,找出三国武将特性分布。其中变量包括统率、武力、智力、政治、魅力、身分。变量说明:统率:武将带兵出征时的部队防御力。统帅越高受到普通攻击与兵法攻击越少。武...
分类:
编程语言 时间:
2014-12-02 10:22:10
阅读次数:
225
原文:《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分什么是聚类分析?聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象相似性较低。在三国数据分析中,很多问题可以借助聚类...
分类:
编程语言 时间:
2014-12-02 10:12:47
阅读次数:
115
原文:Microsoft Naive Bayes 算法——三国人物身份划分 Microsoft朴素贝叶斯是SSAS中最简单的算法,通常用作理解数据基本分组的起点。这类处理的一般特征就是分类。这个算法之所以称为“朴素”,是因为所有属性的重要性是一样的,没有谁比谁更高。贝叶斯之名则源于Thomas Ba...
分类:
编程语言 时间:
2014-12-02 10:11:16
阅读次数:
176
准确性验证示例1:——基于三国志11数据库数据准备:挖掘模型:依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法提升图:依次排名为: 1. 神经网络算法(92.69% 0.99)2. 逻辑回归算法(92.39% 0.99)3. 决策树算法(91.19...
分类:
编程语言 时间:
2014-12-01 20:43:18
阅读次数:
196