搜索关键字：大数，搜索到17816个结果！码迷,mamicode.com！

NBUT 2014 F Team of Slime

题目链接：http://acm.nbut.edu.cn/Problem/view.xhtml?id=1557题意：给出n个不相同且分布在1-n之间的正整数组成的队列，每次可以将任一个数放到队首，问最少需要多少次可以将队列变为升序？分析：（1）一种方法是对于每个有较大数在前面的数放到队首，然后将后面比...

分类：其他好文时间：2014-05-09 11:50:08 阅读次数：262

dataguru（炼数成金）大数据培训基地印象

dataguru访问地址：http://f.dataguru.cn/?fromuid=99611课程优惠码：C4B6这段时间一直在dataguru（炼数成金）上学习《hadoop数据分析平台（第十四期）》，说说我对炼数成金的印象。最开始听说dataguru是通过它的广告邮件中的链接，发送的对象是it...

分类：其他好文时间：2014-05-08 21:19:30 阅读次数：727

读<<大数据时代>>的一些感想

记住，大数据的本质在于数据，大只是它在整个宏观社会整体上的一个体现

分类：其他好文时间：2014-05-05 09:31:32 阅读次数：517

SQL Server 大数据搬迁之文件组备份还原实战

原文:SQL Server 大数据搬迁之文件组备份还原实战一.本文所涉及的内容（Contents）本文所涉及的内容（Contents）背景（Contexts）解决方案（Solution）搬迁步骤（Procedure）搬迁脚本（SQL Codes）注意事项（Attention）疑问（Questions...

分类：数据库时间：2014-05-04 19:06:55 阅读次数：751

大数据时代与个人隐私的矛盾

从父子骑驴的故事随想到大数据时代与个人隐私的矛盾。对于大数据时代和隐私的矛盾，厂商对于大数据无疑是收集用户信息（例如使用习惯、搜索过的信息等等），然后推广给用户更实际的东西和更精准的广告。百度搜索、腾讯QQ、搜狗输入法、奇虎360这些常用工具一直都在收集用户所谓的隐私信息人言可畏，该说哪个厂家在.....

分类：其他好文时间：2014-05-04 10:34:18 阅读次数：375

codechef - Discrepancies in the Voters List 题解

codechef的本题算法也不难，但是codechef喜欢大数据，动不动就过万过十万，输入输出处理不好就会超时。就像本题最大数据可能达到15万个整数。普通输入输出铁定超时了。这里使用fread和fwrite这两个函数，设置好buffer，速度还是相当快的，而且相对很多程序都比较简单的了。主要注意：每个buffer数据块和下一个buffer数据块之间的衔接，不能破坏了最终需要...

分类：其他好文时间：2014-05-04 08:54:04 阅读次数：268

基于Hadoop的数据分析综合管理平台之Hadoop、HBase完全分布式集群搭建

能够将热爱的技术应用于实际生活生产中，是做技术人员向往和乐之不疲的事。现将前期手里面的一个项目做一个大致的总结，与大家一起分享、交流、进步。项目现在正在线上运行，项目名——基于Hadoop的数据分析综合管理平台。项目流程整体比较清晰，爬取数据（txt文本）-->数据清洗-->文本模型训练-->文本分类-...

分类：其他好文时间：2014-05-04 00:22:05 阅读次数：476

UVA 1372 - Log Jumping（推理）

题目链接：1372 - Log Jumping 题意：给定一些n个木板的起始位置和长度k，相重叠的木板可以互相跳跃，求能构成环的最大数量。思路：先按起始位置排序，然后每次多一个木板就去判断他和前一个和前前一个能不能互相跳跃，如果可以的话就可以多加上这个木板。代码： #include #include #include using namespace std; #define ma...

分类：其他好文时间：2014-05-03 21:44:03 阅读次数：247

百度技术沙龙 - 大数据场景下主题检索应用

第48期百度技术沙龙上的《大数据场景下主题检索应用》讲座介绍了很多训练大规模主题模型的技术细节。讲座回来后，我粗略整理了下讲座上涉及的主题模型和训练大规模模型相关的资料和文献。 1. 主题模型的发展历史 a. 布尔模型 Boolean model b. 向量空间模型 VSM (Vector space model) c. 潜在语义索引 LSI (Latent...

分类：其他好文时间：2014-05-03 21:40:07 阅读次数：371