原文:《BI那点儿事》Microsoft 顺序分析和聚类分析算法Microsoft 顺序分析和聚类分析算法是由 Microsoft SQL Server Analysis Services 提供的一种顺序分析算法。您可以使用该算法来研究包含可通过下面的路径或“顺序”链接到的事件的数据。该算法通过对相...
分类:
编程语言 时间:
2014-12-02 10:13:58
阅读次数:
201
原文:《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分什么是聚类分析?聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象相似性较低。在三国数据分析中,很多问题可以借助聚类...
分类:
编程语言 时间:
2014-12-02 10:12:47
阅读次数:
115
准确性验证示例1:——基于三国志11数据库数据准备:挖掘模型:依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法提升图:依次排名为: 1. 神经网络算法(92.69% 0.99)2. 逻辑回归算法(92.39% 0.99)3. 决策树算法(91.19...
分类:
编程语言 时间:
2014-12-01 20:43:18
阅读次数:
196
因系统版本和语言环境不同,安装包的名字会有所差别安装方式可以选择直接联网安装,也可以加载dvd镜像源安装,这里针对配置redhat/centos本地dvd的yum源做个记录:1.复制 redhat ISO 系统dvd镜像到当前系统任一目录下,这里记作:/tmp/redhat.iso2.挂载镜像到/m...
分类:
其他好文 时间:
2014-12-01 19:07:20
阅读次数:
217
打包安装版本更新源地址:http://www.insanelymac.com/forum/files/file/59-chameleon-22-svn/一、使用方法:1.安装Windows版变色龙RC5 Rev 875 for Windows2.自行决定是否替换C:\wowpc.iso为附件2.1s...
今天下载了ubuntu 14.10,想尝试一下最新的桌面版是个什么情况,下载了ISO文件, 之前使用都是解压缩后进行安装即可,于是我就这么干了!附上图: 看到.torrent这个东西瞬间让我很蛋疼了!NND,我已经下了ISO文件...
分类:
Web程序 时间:
2014-11-30 20:14:49
阅读次数:
832
MinHash是用于快速检测两个集合的相似性的方法。改方法由Andrei Broder(1997)发明,并最初用于搜索引擎AltaVista中来检测重复的网页的算法。它同样可以用于推荐系统和大规模文档聚类中。我们先介绍Jaccard相似度量。对于两个集合A与B,Jaccard相似性系数可以定义为:容...
分类:
编程语言 时间:
2014-11-29 22:50:10
阅读次数:
513
由于最近做的项目需要从英文文本中提取出字符串进行话题的聚类,于是就花了一天的时间来学习Java正则表达式,一下几个小例子是我的一些小练笔,如有不合理之处,还望各位指教!! 1.此例是用来过滤掉英文文本中的网址,并将过滤后的字符串输出 首先需要先贴出来我需要过滤的英文文本,我将这些文本存在一...
分类:
编程语言 时间:
2014-11-29 17:13:00
阅读次数:
199
其实两个系统是一样的,linux mint就是基于ubuntu的,不过桌面不一样,多媒体的集成对用户更友好,虽然说ubuntu现在推出面向中国用户的麒麟版,不过感觉好山寨,很多细节都是乱七八糟的,特别是那个日历。两者的安装方式完全一样。这里只是列出一些注意事项,备忘!下载iso安装包,注意cpu架构...