码迷,mamicode.com
首页 >  
搜索关键字:数据挖掘 weka 人工智能    ( 6385个结果
【机器学习实战】回归常用技巧之虚拟变量
虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。...
分类:其他好文   时间:2014-09-04 01:43:57    阅读次数:547
人有疑问可以google、百度,那机器人有问题是否也可以呢?—云机器人是一堆机器人嘛?
云机器人并不是指某一个或者某一类机器人,指代的是机器人存储和获取信息的一种方式,借助于网络和云计算,帮助机器 人相互学习、共享知识,解决单个机器自我学习的局限性,当然还会减少开发人员的开发投入。...
分类:其他好文   时间:2014-09-03 18:15:27    阅读次数:172
大数据的核心价值是什么?
下面是一些长篇的讨论,这里我把大数据的核心价值理解为核心商业价值。 “很多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联的时候,大数据时代又来了。”——马云卸任演讲 本文尝试从三大产业的角度将大数据的核心商业价值分类讨论。 首先例举一些大数据的典型应用,然后解释大数据的定义,最后总结大数据的价值。...
分类:其他好文   时间:2014-09-03 16:58:57    阅读次数:416
数据挖掘项目之---通过对web日志的挖掘来实现内容推荐系统
先说一说问题,不知道大家有没有这样的经验,反正我是经常碰到。 举例1,某些网站每隔几天就发邮件给我,每次发的邮件内容都是一些我根本不感兴趣的东西,我不甚其扰,对其深恶痛绝。 举例2,添加具有某功能的一个msn机器人,每天都有几次突然蹦出一个窗口,推荐一堆我根本不想知道的内容,烦不烦啊, 我只好将你阻...
分类:Web程序   时间:2014-09-03 00:16:15    阅读次数:477
【机器学习实战】多元线性回归模型
当影响Y值的因素不唯一时,我们可以使用多元线性回归模型:...
分类:其他好文   时间:2014-09-02 01:35:34    阅读次数:189
Weka算法Classifier-tree-J48源码分析(一)算法和基本数据结构
Weka分类树J48源码解析...
分类:其他好文   时间:2014-09-02 00:25:23    阅读次数:256
【转】R中有关数据挖掘的包
下面列出了可用于数据挖掘的R包和函数的集合。其中一些不是专门为了数据挖掘而开发,但数据挖掘过程中这些包能帮我们不少忙,所以也包含进来。1、聚类常用的包: fpc,cluster,pvclust,mclust基于划分的方法: kmeans, pam, pamk, clara基于层次的方法: hclus...
分类:其他好文   时间:2014-09-02 00:10:23    阅读次数:314
数据挖掘工具分析北京房价 (一) 数据爬取采集
一. 前言 房价永远是最让人头疼且激动的话题,尤其是在帝都,多少人一辈子都为了一套房子打拼。正好我也想用一个大家比较关心的话题作为案例,把目前我开发的这套软件进行一次完整的演练。从数据采集,到清洗,分析,和最终可视化和报告的呈现,实现一次完整的流程。一方面可以给大家切实的分享一些有用的信息,再者可....
分类:其他好文   时间:2014-09-01 22:36:13    阅读次数:834
自制数据挖掘工具分析北京房价 (二) 数据清洗
上一节我们通过爬虫工具爬取了近七万条二手房数据,那么这一节就对这些数据进行预处理,也就是所谓的ETL(Extract-Transform-Load) 一.ETL工具的必要性 数据分析的前提是数据清洗。不论如何高大上的算法,遇到错误数据,一个异常抛出来,绝对尸横遍野。而你不能指望核心算法为你处理错.....
分类:其他好文   时间:2014-09-01 22:32:33    阅读次数:347
加州理工学院公开课:机器学习与数据挖掘_训练与测试(第五课)
课程简介: 本视频为机器学习系列课程第5章。主要定量研究训练与测试之间的关系,并引入学习模型中的一个重要概念--断点。课程深入浅出,从正射线、正区间和凸集三个具体例子入手,寻找突破点,从而得出训练集与测试集的关系。...
分类:其他好文   时间:2014-09-01 19:38:03    阅读次数:158
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!