分析: 完成品牌复购率需要建立一个宽表,宽表里面包括用户信息,商品信息,以及此商品购买的个数,即一个订单,根据订单里面的商品id不同,可能有多条这样的宽表记录。 有了宽表后,再做相应的统计工作。 一 用户购买商品明细表(宽表) 建表语句: 订单详情表数据量较大,采用分区表。 drop table i ...
分类:
其他好文 时间:
2020-07-02 18:02:20
阅读次数:
78
集群搭建好之后网络,raid卡策略,磁盘都会影响集群的性能。为了避免因上述问题使得集群的性能受到影响,我们依次进行测试,最后得到基本的集群性能。 网络 首先是网络,ceph集群一大堆让人摸不着头脑的问题都出在网络上,所以我们在建立集群之前就可以测试网络,看其是否有问题,可以通过ping命令来测试网络 ...
分类:
其他好文 时间:
2020-07-02 13:43:09
阅读次数:
85
https://blog.csdn.net/qappleh/article/details/88708341?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-5 1 watch:{ 2 detailsList:function(){ ...
分类:
Web程序 时间:
2020-07-02 12:00:16
阅读次数:
477
Given a string s, partition s such that every substring of the partition is a palindrome. Return all possible palindrome partitioning of s. Example: I ...
分类:
其他好文 时间:
2020-07-02 00:08:21
阅读次数:
53
ODS层数据不做任何处理,完全仿照业务数据库中的表字段,一模一样的创建ODS层对应表。 8张表建表语句: ①用sqoop把导入到HDFS的时候,加了参数--fields-terminated-by "\t",因此这里ODS层建表的时候也注意相同的分隔符。 ②不管是全量导入还是其他形式,都使用分区表, ...
分类:
其他好文 时间:
2020-07-01 23:46:38
阅读次数:
91
经常会有这样的业务需求,需要对一个 stream 连续分区,比如: source .keyBy(0) .process(new TmpKeyedProcessFunction2) .keyBy(0) .process(new TmpKeyedProcessFunction2) .keyBy(0) . ...
分类:
其他好文 时间:
2020-07-01 22:13:41
阅读次数:
84
基础概念 正所谓工欲善其事,必先利其器。我们先来了解一下kafka的基础构成。 producer 消息生产者,发布消息到kafka集群的终端或服务。 broker kafaka集群中包含的服务器 topic 每条发布到kafka集群的消息属于的类别,即kafka是面向topic的。 partitio ...
分类:
其他好文 时间:
2020-07-01 14:24:04
阅读次数:
73
ISIS:主要用于运营商的内部网络ISIS特点:①IS指路由器②ISIS属于大型内部网关路由协议类似OSPF,多用于运营商,企业网很少使用③使用SPF算法,链路状态类路由协议④ISIS封装数据包是基于OSI模型,OSPF、RIP、以及常见的以太网数据包封装都是基于TCP/IP模型⑤ISIS划分区域是基于路由器。即一个路由器只能属于一个区域⑥ISIS也是两层架构(骨干区域、常规区域)ISIS路由器的
分类:
其他好文 时间:
2020-07-01 09:30:22
阅读次数:
59
传统RAID技术在面临大容量磁盘的时候显得有点力不从心,这主要由于大容量磁盘技术的引入使得RAID的数据重构时间急剧变长,并且整体IO性能也受到了严重影响。所以很多人预测,传统RAID技术作为存储核心的时代即将过去,大容量磁盘的数据管理需要其它的数据保护技术。我也曾经在一些文章中分析过,传统RAID ...
分类:
其他好文 时间:
2020-06-30 22:49:13
阅读次数:
63
RAID系统是用来对存储数据进行数据保护的有效手段。在RAID创建过程中往往会存在一个时间极长的系统初始化过程,为什么RAID初始化过程中会存在这样的一个操作呢?这个操作对SSD会导致什么方面的影响呢?存储老吴从技术研发的角度和大家一起对RAID初始化过程进行分析、研究。 传统RAID的基本组织结构 ...
分类:
其他好文 时间:
2020-06-30 22:30:50
阅读次数:
63