USB设备分为5大类,即显示器、通信设备、音频设备、人机输入和海量存储。通常所用的U盘、移动硬盘均属于海量存储类。海量存储类的规范中包括4个独立的子规范,即CBI传输、Bulk-Only传输、ATA命令块、UFI命令规范。前两个协议定义了数据/命令/状态在USB总线上的传输方法,Bulk-Only传...
分类:
其他好文 时间:
2015-04-07 19:36:17
阅读次数:
159
USB Mass Storage类规范概述 USB Mass storage Device协议即海量存储设备协议适用于硬盘,U盘等大容量存储设备。协议使用的接口端点有BulkIn、BulkOut和Interrupt端点。该设备类又包含6个独立的子类以及3种传输协议。 Bulk- Only 传输规范仅...
分类:
其他好文 时间:
2015-04-07 19:23:52
阅读次数:
475
经典论文翻译导读之《Finding a needle in Haystack: Facebook’s photo storage》 【译者预读】面对海量小文件的存储和检索,Google发表了GFS,淘宝开源了TFS,而Facebook又是如何应对千亿级别的图片存储、每秒百...
分类:
Web程序 时间:
2015-04-07 17:54:33
阅读次数:
308
算法介绍
Bloom Filter的中文名称叫做布隆过滤器,因为他最早的提出者叫做布隆(Bloom),因而而得此名。布隆过滤器简单的说就是为了检索一个元素是否存在于某个集合当中,以此实现数据的过滤。也许你会想,这还不简单,判断元素是否存在某集合中,遍历集合,一个个去比较不就能得出结果,当然这没有任何的问题,但是当你面对的是海量数据的时候,在空间和时间上的代价是非常恐怖的,显然需要更好的办法来...
分类:
编程语言 时间:
2015-04-07 09:58:58
阅读次数:
281
程序员应知 -- 如何分析海量数据http://www.cnblogs.com/MicroTeam/archive/2010/12/03/1895071.html在这个云计算热炒的时代,如果你没有处理过海量数据的话,你将不再是个合格的Coder。现在赶紧补补吧~前一阵子分析了一个将近1TB的数据群(...
分类:
其他好文 时间:
2015-04-06 17:14:25
阅读次数:
107
1.redis特点:非关系型的,分布式的,开源的,水平可扩展的,主从复制2.处理超大量数据;运行在便宜的PC集群上,高并发读写,海量数据的高效存储和访问对数据的高可扩展性和高可用性3.键值式存储【Strings,hashes,lists,sets,sortedsets】4.支持push/pop;add/remove以及排序,..
分类:
其他好文 时间:
2015-04-06 06:32:12
阅读次数:
180
Netflix的推荐和个性化功能向来精准,前不久,他们公布了自己在这方面的系统架构。3月27日,Netflix的工程师Xavier Amatrain和Justin Basilico在官方博客发布文章,介绍了自己的个性化和推荐系统架构。文章开头,他们指出:要开发出这样的一个软件架构,能够处理海量现有数...
分类:
Web程序 时间:
2015-04-06 00:46:06
阅读次数:
241
这篇可参考http://www.cnblogs.com/weidagang2046/archive/2012/03/01/massive-user-ranking.html#!comments问题某海量用户网站,用户拥有积分,积分可能会在使用过程中随时更新。现在要为该网站设计一种算法,在每次用户登录...
分类:
编程语言 时间:
2015-04-05 23:11:01
阅读次数:
195
问题一:怎么在海量数据中找出重复次数最多的一个算法思想:方案1:先做hash,然后求模映射为小文件,求出每个小文件中重复次数最多的一个,并记录重复次数。 然后找出上一步求出的数据中重复次数最多的一个就是所求(如下)。问题二: 网站日志中记录了用户的IP,找出访问次数最多的IP。算法思想: ...
分类:
其他好文 时间:
2015-04-04 12:04:09
阅读次数:
199
第 3 部分: 深入推荐引擎相关算法 - 聚类智能推荐大都基于海量数据的计算和处理,然而我们发现在海量数据上高效的运行协同过滤算法以及其他推荐策略这样高复杂的算法是有很大的挑战的,在面对解决这个问题的过程中,大家提出了很多减少计算量的方法,而聚类无疑是其中最优的选择之一。 聚类 (Clusterin...
分类:
编程语言 时间:
2015-04-04 12:03:06
阅读次数:
145