一、kettle是什么? Kettle,简称ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),是一款国外开源的ETL工具,纯Java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定,对于企业或行业应用来说,我们经常会遇到各 ...
分类:
其他好文 时间:
2020-01-11 11:48:10
阅读次数:
183
在做性能测试过程中,遇到一个棘手的问题,开发让我们复现几个请求时间较长的请求,他们看日志进行链路追踪,查找瓶颈所在。 这里说一下框架中的处理逻辑:每个请求有一个唯一的requestid,由几部分组成,还有一些算法保证其唯一性。然后这个requestID贯穿整个请求过程的日志,服务间的相互调用,与数据 ...
分类:
其他好文 时间:
2020-01-11 11:46:07
阅读次数:
108
SQL left join 例子 with a as( SELECT * from workspace_saiyisai.odps_base_sdkh_mid_roi WHERE pt = '${s1}' ), b as( select _id,device_id,pt FROM sync_mong ...
分类:
数据库 时间:
2020-01-11 11:38:43
阅读次数:
156
一、注册概念 我们通过创建ContainerBuilder来注册组件并告诉容器哪些组件暴露了哪些服务。 组件可以通过反射(注册指定的.net类或开发结构的泛型)创建;通过提供现成的实例(你已创建的一个对象实例)创建,或者通过lambda表达式(一个执行实例化对象的匿名方法)来创建ContainerB ...
分类:
其他好文 时间:
2020-01-11 11:23:36
阅读次数:
80
原文 Material Design Object Posted on October 29, 2018 Posted on October 29, 2018 Posted on October 29, 2018 Posted on October 29, 2018 Posted on Octobe ...
分类:
其他好文 时间:
2020-01-11 09:18:36
阅读次数:
74
爬虫学习 16.Python网络爬虫之Scrapy框架(CrawlSpider) 引入 提问:如果想要通过爬虫程序去爬取”糗百“全站数据新闻数据的话,有几种实现方法? 方法一:基于Scrapy框架中的Spider的递归爬取进行实现(Request模块递归回调parse方法)。 方法二:基于Crawl ...
分类:
编程语言 时间:
2020-01-10 22:07:37
阅读次数:
65
log4j.properties log4j.rootLogger=INFO,Console,File log4j.appender.Console=org.apache.log4j.ConsoleAppender log4j.appender.Console.Target=System.out l ...
分类:
编程语言 时间:
2020-01-10 22:03:48
阅读次数:
94
fastjson 调用JSONObject.toJSON(),如果是解析泛型对象会报OutOfMemoryError错误 2020-01-09 17:03:49.831 [http-nio-8062-exec-5] ERROR [org.apache.juli.logging.DirectJDKLo ...
分类:
Web程序 时间:
2020-01-09 18:50:59
阅读次数:
512
Java反射 在 Java 中,并不是所有的类型信息都能在编译阶段明确,有一些类型信息需要在运行时才能确定,这种机制被称为 RTTI,即运行时类型识别,运行时类型识别主要由Class类实现。 1、 Class类 在Java中,我们常用“class”(首字母为小写的c)关键字来定义一个类,说这个类是对 ...
分类:
编程语言 时间:
2020-01-09 17:14:37
阅读次数:
113
经过实践, yield dict和yield item一样有效果,不过为什么官方要用yield item ,以下是官方解释: The main goal in scraping is to extract structured data from unstructured sources, typi ...
分类:
其他好文 时间:
2020-01-08 21:13:44
阅读次数:
255