1.概述 回归树就是用树模型做回归问题,每一片叶子都输出一个预测值。预测值一般是该片叶子所含训练集元素输出的均值, 即 𝑐𝑚=𝑎𝑣𝑒(𝑦𝑖|𝑥𝑖∈𝑙𝑒𝑎𝑓𝑚)cm=ave(yi|xi∈leafm)。 2.构建过程 回归树采用平方和损失函数 每次选择一个切分变量j和切分点s ...
分类:
其他好文 时间:
2020-02-19 23:46:37
阅读次数:
75
架构漫谈是由资深架构师王概凯撰写的系列专栏,逐步讨论什么是架构、怎样做好架构、软件架构如何落地、如何写好程序等问题。 架构漫谈分为九篇: 什么是架构? 认识概念是理解架构的基础 如何做好架构之识别问题 如何做好架构之架构切分 什么是软件 软件架构到底是要解决什么问题? 不要空设架构师这个职位,给他实 ...
分类:
其他好文 时间:
2020-02-19 19:15:16
阅读次数:
76
通过阅读王概凯的架构漫谈和查阅一些其他资料,我大致了解了一下软件架构师的一些相关知识。 什么是架构呢?在架构漫谈中这样说道:把一个整体(完成人类生存的所有工作)切分成不同的部分(分工),由不同角色来完成这些分工,并通过建立不同部分相互沟通的机制,使得这些部分能够有机的结合为一个整体,并完成这个整体所 ...
分类:
其他好文 时间:
2020-02-19 18:54:44
阅读次数:
62
模拟这样一个场景: 1、将数据库按业务“垂直”拆分成用户库和订单库; 2、用户库做主从,读写分离; 3、订单库做“水平”切分,并且每个分片表做主从,读写分离; 一、垂直切分 1、准备两个MySQL数据库 2、MyCat的配置文件 schema.xml server.xml (主要是修改schemas ...
分类:
其他好文 时间:
2020-02-19 00:37:46
阅读次数:
70
1、region拆分机制region中存储的是大量的rowkey数据,当region中的数据条数过多的时候,直接影响查询效率.当region过大的时候.hbase会拆分region,这也是Hbase的一个优点.HBase的regionsplit策略一共有以下几种:1、ConstantSizeRegionSplitPolicy0.94版本前默认切分策略当region大小大于某个阈值(hbase.hr
分类:
其他好文 时间:
2020-02-17 17:35:33
阅读次数:
102
RFM,是一种经典的用户分类、价值分析模型: R,Rencency,即每个客户有多少天没回购了,可以理解为最近一次购买到现在隔了多少天。 F,Frequency,是每个客户购买了多少次。 M,Monetary,代表每个客户平均购买金额,也可以是累计购买金额。 这三个维度,是RFM模型的精髓所在,帮助 ...
分类:
其他好文 时间:
2020-02-15 15:43:11
阅读次数:
84
0x03 Custom RBIX Shellcode 来看看第二个编码案例: 随机字节插入异或编码(Random-Byte-Insertion-XOR Encoding,RBIX编码) 思想是将shellcode按3字节长度切分成多个数据块,然后在每个数据块的头部添加一个随机字节(0x01-0xFF ...
分类:
系统相关 时间:
2020-02-13 22:41:50
阅读次数:
102
简介:这是一个包含了 "函数计算" 每种 Runtime 结合 HTTP Trigger 实现文件上传和文件下载的示例集。我们知道不同语言在处理 HTTP 协议上传下载时都有很多中方法和社区库,特别是结合函数计算的场景,开发人员往往需要耗费不少精力去学习和尝试。本示例集编撰的目的就是节省开发者甄别的 ...
分类:
Web程序 时间:
2020-02-11 11:35:43
阅读次数:
137
sqoop在导入数据时,可以使用--query搭配sql来指定查询条件,并且还需在sql中添加\$CONDITIONS,来实现并行运行mr的功能。 运行测试 测试均基于sqoop1,mysql数据准备如下。 (1)只要有--query+sql,就需要加\$CONDITIONS,哪怕只有一个mapta ...
分类:
其他好文 时间:
2020-02-07 15:06:18
阅读次数:
800
最小生成树(Minimum Span Tree):对于带权无向连通图。所有节点都连通且总权值最小。应用:电缆布线、网络、电路设计 找V-1条边,连接V个顶点,总权值最小 切分定理(Cut Property):给定任意切分,横切边中权值最小的边必属于最小生成树 切分:把图中节点分为两部分 横切边:边的 ...
分类:
编程语言 时间:
2020-02-05 16:12:21
阅读次数:
109