Apache Mahout项目主要包括以下五个部分:
频繁模式挖掘:挖掘数据中频繁出现的项集。
聚类:将诸如文本、文档之类的数据分成局部相关的组。
分类:利用已经存在的分类文档训练分类器,对未分类的文档进行分类。
推荐引擎(协同过滤):获得用户的行为并从中发现用户可能喜欢的事务。
频繁子项挖掘:利用一个项集(查询记录或购物目录)去识别经常一起出现的项目。
在Maho...
分类:
其他好文 时间:
2014-10-06 00:55:49
阅读次数:
346
产品背景: 随着智能终端(智能手机及平板电脑)及移动通信(3G)的发展,原来运行在PC上的信息系统(如邮件系统、即时通信、网页浏览、协同办公、网络购物、社交网站等)逐渐转移到智能终端设备上。可以预见未来几年60%以上的业务将会逐渐转移到智能终端系统上来。在这种背景下,北京文通推出基于Android平...
分类:
移动开发 时间:
2014-10-05 19:55:28
阅读次数:
264
AlienTech for better life!~...
分类:
其他好文 时间:
2014-10-05 19:15:28
阅读次数:
249
好早的时候就打算写这篇文章,但是还是参加阿里大数据竞赛的第一季三月份的时候实验就完成了,硬生生是拖到了十一假期,自己也是醉了。。。找工作不是很顺利,希望写点东西回顾一下知识,然后再攒点人品吧,只能如此了。
一、问题背景
二、基于用户的协同过滤算法介绍
三、数据结构和实验过程设计
四、代码...
分类:
编程语言 时间:
2014-10-03 21:50:45
阅读次数:
281
ngx_lua出来很长时间了,但一直没有关注过,最近有一个I/O密集型的项目,用PHP性能严重不足,但是通过C开发扩展成本很大,对需求也不能及时响应,结果尝试了一下lua,结果非常喜人,他的同步非阻塞I/O,协同程序等等,让他的性能无与伦比!在项目的开发中需要用到consistenthas..
分类:
其他好文 时间:
2014-09-30 13:56:50
阅读次数:
294
复杂软件驱动系统的UCM与UML 复杂软件驱动系统有许多类型,包括面向对象、基于代理、实时和分布式系统。它们具有许多属性,例如大规模、协同性、分散控制、及时性、可靠性、变化多端及特色丰富的功能、运行时组织...
分类:
其他好文 时间:
2014-09-30 11:49:59
阅读次数:
597
Visual Studio Online(原来的 Team Foundation Service),是项目数据在云中的主页。在我们的云基础架构中只需数分钟便可启动并运行,无需安装或配置任何服务器。设置一个包含一切的环境,从托管 Git 存储库和项目跟踪工具到持续集成和 IDE,全都封装在一个月度每用...
分类:
其他好文 时间:
2014-09-29 03:00:17
阅读次数:
290
流程大纲
一、代码编写
1.从主分支(master)上创建开发分支(dev)。
2.切换到dev。
3.在dev上进行代码编写,并提交本地版本库。
注:一定不能直接在marster分支上修改代码
二、合并代码
1.切换到master。
2.从remote master拉取最新代码到local master。
3.切换到dev。
4.rebase master 到 d...
分类:
其他好文 时间:
2014-09-28 12:15:01
阅读次数:
191
文件锁是一种文件读写机制,在任何特定的时间只允许一个进程访问一个文件。利用这种机制能够使读写单个文件的过程变得更安全。
在这篇文章中,我们将探讨Linux中不同类型的文件锁,并通过示例程序来理解它们之间的不同之处。
我们将采取以下的例子来解释为什么需要使用文件锁。
1、进程“A”打开和读取一个文件,此文件包含账户相关的一些信息。
2、进程“B”也打开了这个文...
分类:
其他好文 时间:
2014-09-27 18:00:10
阅读次数:
246
在文已经共享的情况下如何操作,也就是当多个进程同时操作同一个文件时,我们怎么保证文件数据的正确性。linux通常采用的方法是文件上锁,来避免共享资源的产生竞争状态。
文件锁包括建议性锁和强制性的锁。建议性的,顾名思义,相对温柔一些,在对文件进行锁操作时,会检测是否已经有锁存在,并且尊重已有的锁。在一般的情况下,内核和系统都不使用建议锁。强制性的锁是由内...
分类:
其他好文 时间:
2014-09-27 17:10:00
阅读次数:
177