一、引擎(Scrapy) 用来处理整个系统的数据流处理, 触发事务(框架核心)二、调度器(Scheduler) 用来接受引擎发过来的请求, 压入队列中, 并在引擎再次请求的时候返回. 可以想像成一个URL(抓取网页的网址或者说是链接)的优先队列, 由它来决定下一个要抓取的网址是什么, 同时去除重复的 ...
分类:
其他好文 时间:
2020-05-29 13:44:14
阅读次数:
83
相关性过滤 方差挑选完毕之后,我们就要考虑下一个问题:相关性了。 我们希望选出与标签相关且有意义的特征,因为这样的特征能够为我们提供大量信息。如果特征与标签无关,那只会白白浪费我们的计算内存,可能还会给模型带来噪音。在sklearn当中,我们有三种常用的方法来评判特征与标签之间的相关性:卡方,F检验 ...
分类:
其他好文 时间:
2020-05-29 13:27:44
阅读次数:
149
给定一个二维数组,将数组中的元素按照螺旋顺序输出,顺时针螺旋。 Input:[ [ 1, 2, 3 ], [ 4, 5, 6 ], [ 7, 8, 9 ]]Output: [1,2,3,6,9,8,7,4,5] 思路:使用迷宫遍历,设定寻路的方向,当碰壁了,就换到下一个方向,但是要将已经走过的点标记 ...
分类:
其他好文 时间:
2020-05-28 23:26:48
阅读次数:
61
问题:跨线程传递参数,在本线程提取到了值,但跨线程后一直提取不到。解决:在Test Plan 页面勾选“独立运行每个线程组(例如在一个组运行结束后启动下一个)” 背景:我创建了2个线程组,在a线程组里面提取值传到b线程组使用,使用正则表达式提取的参数在本线程能使用,但是传到另一个线程组一直获取不到值 ...
分类:
编程语言 时间:
2020-05-28 21:22:33
阅读次数:
83
接口:http://v.juhe.cn/laohuangli/d?key=c3caf502c10862dda503ca84bcbfcd62&date=2020-05-28 //获取响应报文中的json var jsonData = JSON.parse(responseBody); // var d ...
分类:
其他好文 时间:
2020-05-28 20:05:49
阅读次数:
208
创建序列代码如下: --创建序列 create sequence s_person--指定序列名 start with 1;--指定开始大小 查询序列代码如下: --查询序列 select s_person.nextval from dual;--查询下一个值 select s_person.cur ...
分类:
数据库 时间:
2020-05-27 22:03:03
阅读次数:
104
一、链表的概念: 链表将每个对象存放在独立的节点中,每个节点还存放着序列中下一个节点的引用。在Java中,所有链表实际上都是双向链接的——即每个节点还存放着指向前驱节点的引用。 双向链表结构如下所示: 二、链表的特点: 获取数据慢,需要遍历查找;插入和删除快,只需要修改前后的链接。 三、单链表的实现 ...
分类:
编程语言 时间:
2020-05-26 19:52:53
阅读次数:
52
输入一个复杂链表(每个节点中有节点值,以及两个指针,一个指向下一个节点,另一个特殊指针random指向一个随机节点),请对此链表进行深拷贝,并返回拷贝后的头结点。(注意,输出结果中请不要返回参数中的节点引用,否则判题程序会直接返回空) 思路:浅拷贝:资源不重新分配,在复制过程,两个对象指向同一个内存 ...
分类:
其他好文 时间:
2020-05-26 18:08:38
阅读次数:
60
工作汇报 编辑器 xwl: 今天: lpx报问题:file_update过于频繁 \ 解决方案:延迟更新, \ 如果200ms没有下一个更改就提交此更改; \ 新更改时reset timer 多文件debug: pdb和gdb都支持带文件名(break xxx.py:123) 获取断点:by edi ...
分类:
其他好文 时间:
2020-05-24 21:11:04
阅读次数:
74
函数 参考书籍:《代码整洁之道》,语言:Python 1.函数要短小 1)每个函数只做一件事,并且每个函数都依次把你带到下一个函数,这就是函数应该达到的短小程度。 2)if, else, while等语句的代码块应该只有一行,该行大概是一个函数的调用(具有说明性的函数名称会增加代码的可读性) 3)编 ...
分类:
其他好文 时间:
2020-05-24 16:59:59
阅读次数:
51