Lists.partition public class testList { @Test public void test(){ List<Integer> numList = Lists.newArrayList(1, 2, 3, 4, 5, 6, 7, 8); List<List<Intege ...
分类:
其他好文 时间:
2020-03-02 20:46:46
阅读次数:
107
HBase是Hadoop的一个子项目,用JAVA语言实现,是建立在HDFS的基础上的非关系型分布式数据库,目标是通过水平扩展的方式处理非常庞大的表。值得注意的是,HBase并非结构化数据库,而是介于非关系型数据库(nosql)与关系型数据库(RDBMS)之间,仅能存储非结构化数据和半结构化数据。 为 ...
分类:
其他好文 时间:
2020-03-01 00:09:42
阅读次数:
63
DStream 中 window 函数有两种,一种是普通 WindowedDStream,另外一种是针对 window聚合 优化的 ReducedWindowedDStream。 Demo 源码 DStream 前提知识 在每个DStream 中会把每个batch 产生的 Rdd 放入Map中,也就 ...
应老师的要求将王概凯老师的架构漫谈总体读了一遍,接下来谈一谈我读了之后的感想,大致上就是用自己的语言谈一谈短浅的理解。 首先我们要了解一下什么是架构? 根据要解决的问题,对目标系统的边界进行界定。 并对目标系统按某个原则的进行切分。切分的原则,要便于不同的角色,对切分出来的部分,并行或串行开展工作, ...
分类:
其他好文 时间:
2020-02-26 01:16:38
阅读次数:
75
问题描述: 1:我们使用PageHelper插件的时候,PageHelper.startPage(pageNow,pageSize)要放在查询语句的前面 2:当startPage的后面有多次查询的话,它只对第一条查询语句有效果 3:假如要进行多次查询,然后对结果进行分页,关注点是:对最后的结果进行分 ...
分类:
其他好文 时间:
2020-02-25 00:29:28
阅读次数:
79
简单聊一聊我对架构的理解吧: 首先从源头上讲,架构源于建筑,源于人们的大规模集群式的劳动 架构的定义中说,把一个整体(完成人类生存的所有工作)切分成不同的部分(分工),由不同角色来完成这些分工,并通过建立不同部分相互沟通的机制,使得这些部分能够有机的结合为一个整体,并完成这个整体所需要的所有活动,这 ...
分类:
其他好文 时间:
2020-02-24 20:59:59
阅读次数:
70
文本情感分类 文本分类是自然语言处理的一个常见任务,它把一段不定长的文本序列变换为文本的类别。本节关注它的一个子问题:使用文本情感分类来分析文本作者的情绪。这个问题也叫情感分析,并有着广泛的应用。 同搜索近义词和类比词一样,文本分类也属于词嵌入的下游应用。在本节中,我们将应用预训练的词向量和含多个隐 ...
分类:
其他好文 时间:
2020-02-24 00:27:32
阅读次数:
81
简介:Fork/Join是由Java 7提供的并行执行任务框架,思路就是任务切分,结果合并,同时利用工作窃取机制,目的是提高效率。 1. 概念 A. 分而治之:即将任务划分为多个子任务,然后并行的执行这些子任务,等所有子任务都结束的时候,再合并成最终结果; B. 工作窃取:当一个工作线程的本地没有任 ...
分类:
编程语言 时间:
2020-02-23 11:41:18
阅读次数:
84
用正则切分字符串输出 ['info','xiaoZhang','33','shandong']、s="info:xiaoZhang33shandong", import re s="info:xiaoZhang 33 shandong" res = re.split(r":| ", s) # |表示 ...
分类:
编程语言 时间:
2020-02-22 13:47:05
阅读次数:
409
from sklearn.model_selection import train_test_split Xtrain,Xtest,Ytrain,Ytest = train_test_split(X,Y,test_size=0.3,random_state=420) #切分前数据标签的分布情况 tr ...
分类:
其他好文 时间:
2020-02-20 23:56:20
阅读次数:
117