cat hadoop-env.sh export HADOOP_OPTS="$HADOOP_OPTS -Duser.timezone=GMT+08" cat yarn-env.sh YARN_OPTS="$YARN_OPTS -Duser.timezone=GMT+08" cat hbase-env ...
分类:
其他好文 时间:
2020-07-10 19:26:31
阅读次数:
86
hive mysql count distinct 多列 解释链接-mysql采坑之count distinct多列 不能使用算术比较运算符(如=,<或<>)来比较空值 COUNT(distinct expr)返回expr列中不同的且非空的行数 COUNT()有两个非常不同的作用:它可以统计某个列值 ...
分类:
数据库 时间:
2020-07-10 15:25:56
阅读次数:
116
前几天HBase出现了RIT告警,忽然发现发出告警的Region所属的表并不是我创建出来的,于是就想看看这些表是怎么来的。 一时也没什么头绪,就先看看这些表是什么时候创建出来的吧,然后再根据时间点看看有谁操作了数据库。 那么怎么看表的创建时间呢?desc看一下,也没有这个属性啊。再细想呢,hbase ...
分类:
其他好文 时间:
2020-07-10 15:14:17
阅读次数:
168
XML文档解析,使用Linq to Xml方式操作确实很方便,好东西值得推荐 Models.AjaxResult.BlastSearchResult blastSearchResult = new Models.AjaxResult.BlastSearchResult(); var rssXDoc ...
分类:
Web程序 时间:
2020-07-10 11:37:15
阅读次数:
61
package com.sjw.flink import org.apache.flink.configuration.Configurationimport org.apache.flink.streaming.api.functions.sink.{RichSinkFunction, SinkF ...
分类:
其他好文 时间:
2020-07-10 00:43:32
阅读次数:
74
集群启动顺序: NameNode启动 NameNode启动时,首先将镜像文件(Fsimage)载入内存,并执行编辑日志(Edits)中的各项操作。一旦在内存中成功建立文件系统元数据的映像,则创建一个新的Fsimage文件和一个空的编辑日志。此时,NameNode开始监听DataNode请求。这个过程 ...
分类:
其他好文 时间:
2020-07-10 00:43:16
阅读次数:
97
package com.baway.loginfaildetect import java.util import org.apache.flink.cep.PatternSelectFunctionimport org.apache.flink.cep.scala.{CEP, PatternStr ...
分类:
其他好文 时间:
2020-07-10 00:15:34
阅读次数:
92
package com.sjw.hbase; import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.*;import org.apache.hadoop.hbase.client.*;import org ...
SparkSQL在机器学习场景中应用第四范式已经在很多行业落地了上万个AI应用,比如在金融行业的反欺诈,媒体行业的新闻推荐,能源行业管道检测,而SparkSQL在这些AI应用中快速实现特征变换发挥着重要的作用SparkSQL在特征变换主要有一下几类1.多表场景,用于表之间拼接操作,比如交易信息表去拼接账户表2.使用udf进行简单的特征变换,比如对时间戳进行hour函数处理3.使用时间窗口和udaf
分类:
数据库 时间:
2020-07-09 17:54:20
阅读次数:
99
承接上一篇,NoSQL实验 MapReduce实验 如何在Eclipse中运行MapReduce程序,参考厦大数据库实验室博客 总体代码: package org.apache.hadoop.examples; import java.io.IOException; import java.util ...
分类:
其他好文 时间:
2020-07-09 15:08:03
阅读次数:
127