原文:http://www.sohu.com/a/287135829_818692 小史是一个非科班的程序员,虽然学的是电子专业,但是通过自己的努力成功通过了面试,现在要开始迎接新生活了。 对小史面试情况感兴趣的同学可以观看面试现场系列。 找到工作后的一小段时间是清闲的,小史把新租房收拾利索后,就开 ...
分类:
其他好文 时间:
2019-08-01 09:42:04
阅读次数:
120
从一个例子说起:用户画像系统 用户画像就是根据用户的各种行为抽象出的一个标签化的用户模型,简而言之,就是给用户贴标签; 作用: 优化用户体验:不仅对用户的浏览体验优化,还包括产品消费过程的优化; 实现精准化营销:显示用户的喜好跟需求属性,在跟用户点对点交互中,精准的匹配个性化的业务内容; 管理数据挖 ...
分类:
其他好文 时间:
2019-07-25 15:00:39
阅读次数:
100
如今,人们寻求获得更多的数据有着充分的理由,因为数据分析推动了数字创新。然而,将这些庞大的数据集转化为可操作的洞察力仍然是一个难题。而那些获得应对强大数据挑战的解决方案的组织将能够更好地从数字创新的成果中获得经济利益。考虑到这个基本前提,以下是组织在2019年应该关注的大数据的10个发展趋势:1.数据管理仍然很难 大数据分析有着相当明确的重要思想:找到隐藏在大量数据中的信息模式,训练机器学习模型
分类:
其他好文 时间:
2019-07-19 13:55:34
阅读次数:
157
http://blog.itpub.net/31545816/viewspace-2215281/ https://www.cnblogs.com/liuling/p/2013-6-19-01.html https://blog.csdn.net/jiachengwin/article/detail ...
分类:
Web程序 时间:
2019-07-16 18:40:20
阅读次数:
162
在 cifar-10 上训练 AlexNet。将 32×32 的图片 resize 到 224×224 之后,数据将无法完全加载到 32G 内存中,会产生 OOM。那么此时的做法有: 1)将 resize 作为模型的一部分,如设置一个 layer 来对一个 batch 的图像进行 resize,这样... ...
分类:
Web程序 时间:
2019-07-15 22:38:06
阅读次数:
189
概念 海量数据的数据统计平台,将hql翻译为mapreduce程序。 优点 简单;适用于对实时性要求不严的场合;适合处理大数据 缺点 无法表达迭代式计算; 不擅长数据挖掘; 效率比较低。 本质(相当于hadoop的一个客户端) hive的数据存储在hdfs; hive的数据处理在mapreduce; ...
分类:
其他好文 时间:
2019-07-13 21:29:55
阅读次数:
138
hadoop 之hdfs数据块修复方法: 1、手动修复 hdfs fsck / #检查集群的健康状态 hdfs debug recoverLease -path 文件位置 -retries 重试次数 #修复指定的hdfs数据块。也就是关闭打开的文件。 检查坏块: hadoop fsck /user ... ...
分类:
其他好文 时间:
2019-07-10 18:23:22
阅读次数:
467
一、HDFS是一个分布式文件系统 体系架构: hdfs主要包含了3部分,namenode、datanode和secondaryNameNode namenode主要作用和运行方式: 1)管理hdfs的元数据信息,文件名字,大小,切成几块,有几个副本,切成块和副本分别存储在datanode的位置,块i ...
分类:
其他好文 时间:
2019-07-10 12:20:30
阅读次数:
130