Mahout小案例学习,实现k-means算法。环境:OS:Centos 6.5 x64 &
Soft:Hadoop 1.2.1 & Mahout 0.91、下载测试数据[huser@master hadoop]$ wget
http://archive.ics.uci.edu/ml/databas...
分类:
其他好文 时间:
2014-05-04 12:34:58
阅读次数:
340
如标题,第一章会分为两个部分。内容包括java语法和在NetBeans下引用jar。
分类:
其他好文 时间:
2014-05-04 12:19:50
阅读次数:
223
讲解了JavaScript的函数、匿名函数、函数表达式、函数的递归调用、闭包等知识点,讲解了如何使用闭包来避免命名空间污染的问题,探讨了两个专题单例和回调...
分类:
编程语言 时间:
2014-05-03 21:50:51
阅读次数:
297
【分析】
【伪代码】
【运行过程】
【代码】
/*********************************
* 日期:2014-04-01
* 作者:SJF0115
* 题目:快速排序
**********************************/
#include
#include
using namespace...
分类:
其他好文 时间:
2014-05-03 21:17:50
阅读次数:
476
上个月,参加了百度技术沙龙, 夏粉的《广告数据上的大规模机器学习》讲座介绍了大规模机器学习中的若干重要问题。遗憾的是,百度的相关算法没有公开的论文。
1. 数据处理
目标: 获取信息, 去除噪音
机器学习技术点: 选择对点击概率分布 预估足够多样本
解决方法: a. 不可见和不完整样本过滤; b. 样本采样; c. 异常样本检测
算法:a. 百度...
分类:
其他好文 时间:
2014-05-03 21:12:36
阅读次数:
378
挖个坑,埋点土,数个一二三四五。今天我们从它说起建造模式。
概述
其核心思想是将一个“复杂对象的构建算法”与它的“部件及组装方式”分离,使得构件算法和组装方式可以独立应对变化;复用同样的构建算法可以创建不同的表示,不同的构建过程可以复用相同的部件组装方式。因此,如果我们用了建造者模式,那么用户就只需指定需要建造的类型就可以得到他们,而具体的建造过程的细节就不需知道了。
优点
使得建造代码与表示代码分离,由于建造者隐藏...
分类:
其他好文 时间:
2014-05-03 21:12:03
阅读次数:
274
一、概述:
Yarn调度器有许多实现,如Fifo, Capacity和Fair schedulers等。与其同时,正在进行一些优化措施来提高调度器在不同负载和工作场景下的性能。每个调度器都有自己的特性,调度决策受许多因素影响,如公平行、计算能力保证和资源的可靠性等。在部署一个调度算法到生产集群之前,评估一个调度算法是非常重要的,不幸的是,评估一个调度算法是不那么容易的,评估一个真正的集群是非常耗...
分类:
其他好文 时间:
2014-05-03 21:00:00
阅读次数:
443
//非递归遍历一棵树 需要借助栈
#include
#include
struct Tree
{
int nValue;
Tree *pLeft;
Tree *pRight;
};
struct Stack
{
Tree *root;
Stack *pNext;
};
Stack *pStack = NULL;
void push(Tree *root)
{
St...
分类:
其他好文 时间:
2014-05-03 20:55:41
阅读次数:
325
前面讲述了活动图,那就从活动图的基础上来分析状态图。我们知道活动图侧重从行为的动作来描述活动,而与之相对状态图侧重从行为的结果来描述状态。在实际项目中,活动图并不是必须的。一般在以下情况需要使用活动图:
a、描述一个并行的过程或者行为
b、描述一个算法
c、描述一个跨越多个用例的活动
而状态图描述了一个具体对象的可能状态以及它们之间的转换。联系了这么多以前的内容,那么到底什么是状态图...
分类:
其他好文 时间:
2014-05-03 20:49:41
阅读次数:
296
1.在之前的笔记中已经写过了,所以这里快速过一次。GLOBALS:发现一个有趣的事:$GLOBALS里有一个GLOBALS元素,是一种递归数组,实现的办法是设定一个相同名的元素,值为本身的引用。$php_errormsg:终于发现如果服务器把错误提示关了杂办,判断它是否为NULL就行了。$HTTP_RAW_..
分类:
Web程序 时间:
2014-05-03 20:34:41
阅读次数:
329