yarn-client提交任务方式 yarn-client提交任务方式 客户端提交一个Application,在客户端启动一个Driver进程 Driver进程会向RS(ResourceManager)发送请求,启动AM(ApplicationMaster)的资源 RS收到请求,随机选择一台NM(N ...
分类:
其他好文 时间:
2019-07-21 18:20:35
阅读次数:
120
''' 集合算法: 1.正向激励 2.自助聚合:每次从总样本矩阵中以有放回抽样的方式随机抽取部分样本构建决策树,这样形成多棵包含不同训练样本的决策树, 以削弱某些强势样本对模型预测结果的影响,提高模型的泛化特性。 3.随机森林:在自助聚合的基础上,每次构建决策树模型时,不仅随机选择部分样本,而且还随... ...
分类:
其他好文 时间:
2019-07-14 17:49:54
阅读次数:
100
一、引言 在平时做题目或者进行运算的时候,素数的出现次数总是十分频繁。这里总结了一些常见的判定素数和计算某个范围内素数个数的一些算法。部分代码来源于 kuangbin 的模板,嗯毕竟都是跟着这个学的... 二、朴素判断素数算法 就判断素数而言,事实上是非常简单的了。根据定义,判断一个整数n是否是素数 ...
分类:
编程语言 时间:
2019-07-13 09:21:32
阅读次数:
124
前提 神经网络中有合适的权重和偏置,调整权重和偏置以便拟合训练数据的过程称为学习。神经网络的学习分为下面4 个步骤。 步骤1(mini-batch) 从训练数据中随机选择一部分数据。步骤2(计算梯度) 计算损失函数关于各个权重参数的梯度。步骤3(更新参数) 将权重参数沿梯度方向进行微小的更新。步骤4 ...
分类:
其他好文 时间:
2019-06-24 21:14:50
阅读次数:
115
Miller_Rabin 用途 快速($O(slogn)$,s为尝试次数)地判断一个数是否是质数 原理 首先有费马小定理$a^{p-1}=1 (mod\ p)$当p为质数时成立,所以可以随机选择a来以这个式子作为一定的判断依据,但并不是所有合数都不满足这个式子,甚至存在合数对所有的a都不满足这个式子 ...
分类:
其他好文 时间:
2019-06-24 13:55:14
阅读次数:
95
1.K-Means聚类算法属于无监督学习算法。 2.原理:先随机选择K个质心,根据样本到质心的距离将样本分配到最近的簇中,然后根据簇中的样本更新质心,再次计算距离重新分配簇,直到质心不再发生变化,迭代结束。 3.簇内平方和Inertia:采用欧几里得距离,则一个簇中所有样本点到质心的距离的平方和。追 ...
分类:
其他好文 时间:
2019-06-21 21:07:03
阅读次数:
239
前言这次我们来说说,有关于etcd原理的一些事情。之前我们已经了解到了etcd是一个分布式的k-v存储,那么它究竟是如何保证数据是如何复制到每个节点上面去的呢?又是如何保证在网络分区的情况下能正常工作下去?raft协议到底是什么?带着这些问题我们继续往下看。raft选举策略我们知道etcd使用raf... ...
分类:
其他好文 时间:
2019-06-14 12:49:43
阅读次数:
138
题意 给定一棵 $n$ 个结点的树,你从点 $x$ 出发,每次等概率随机选择一条与所在点相邻的边走过去。 有 $Q$ 次询问,每次询问给定一个集合 $S$,求如果从 $x$ 出发一直随机游走,直到点集 $S$ 中所有点都至少经过一次的话,期望游走几步。 $1\leq n\leq 18$,$1\leq ...
分类:
其他好文 时间:
2019-06-13 14:09:17
阅读次数:
81
● 什么是DBSCAN 参考回答: DBSCAN是一种基于密度的空间聚类算法,它不需要定义簇的个数,而是将具有足够高密度的区域划分为簇,并在有噪声的数据中发现任意形状的簇,在此算法中将簇定义为密度相连的点的最大集合。 ● k-means算法流程 参考回答: 从数据集中随机选择k个聚类样本作为初始的聚 ...
分类:
编程语言 时间:
2019-06-03 21:40:20
阅读次数:
173
以下内容是个人通过查阅网上相关资料总结出的内容 具体说明数据不均衡会带来的问题: 1)在一个二分类问题中,训练集中class 1的样本数比class 2的样本数是60:1。使用逻辑回归进行分类,最后训练出的模型可能会忽略了class 2,即模型可能会将所有的训练样本都分类为class 1。 2)在分 ...
分类:
其他好文 时间:
2019-05-26 11:13:10
阅读次数:
336