一、主题式网络爬虫设计方案(15分)1.主题式网络爬虫名称 51Job一线城市程序员岗位爬虫2.主题式网络爬虫爬取的内容与数据特征分析 2.1爬取内容: 岗位、公司、薪酬范围、工作经验要求、学历、地区、公司规模、公司类型 2.2数据特征分析: 针对就职城市做一个柱状图分析3.主题式网络爬虫设计方案概 ...
分类:
编程语言 时间:
2019-12-19 09:26:30
阅读次数:
98
后缀自动机 (suffix automaton, SAM) 是一个能解决许多字符串相关问题的有力的数据结构。(否则我们也不会用它) 举几个例子,以下的字符串问题都可以在线性时间内通过 SAM 解决 1.在另一个字符串中搜索一个字符串的所有出现位置。(诶?KMP好像能做) 2.计算给定的字符串中有多少 ...
分类:
其他好文 时间:
2019-12-17 20:35:36
阅读次数:
102
"题意" 显然是贪心。 先建出SAM,之后能走相同的字符就走相同的字符,实在不行再走一个比它大的。 考虑怎么处理$[l,r]$的限制,我们只要用线段树合并维护出每个点的endpos集合,到时候判断下走这一步是否合法即可。 code: ...
分类:
其他好文 时间:
2019-12-17 20:23:15
阅读次数:
100
YinYang GAN: Phase Lock + Constructionism + GAN + Cross Modality + Iterative Inference structure illustration: $$x_i \in P_i, i=0,1,...,M;$$ $x_i$:sam ...
分类:
其他好文 时间:
2019-12-17 15:06:53
阅读次数:
116
MyISAM特点 1)不支持行锁(MyISAM只有表锁),读取时对需要读到的所有表加锁,写入时则对表加排他锁; 2)不支持事务 3)不支持外键 4)不支持崩溃后的安全恢复 5)在表有读取查询的同时,支持往表中插入新纪录 6)支持BLOB和TEXT的前500个字符索引,支持全文索引 7)支持延迟更新索 ...
分类:
数据库 时间:
2019-12-16 20:55:37
阅读次数:
97
题真好。 也帮我回忆起了快两个月没动的$SAM$。 我只能想到$68$分的数据。 题目要求给出一个串$S$。 然后每次询问给出一个串$T$和两个变量$l,r$ 要求出有多少个本质不同串是$T$的子串而不是$S[l,r]$的子串。 前面$68$分是$l=1,r=n$的。 直接做。 首先我们对$S$建出 ...
分类:
其他好文 时间:
2019-12-16 17:43:40
阅读次数:
128
Oracle中创建触发器示例及注意事项 1、oracle 中创建触发器示例 CREATE TABLE "CONCEPT"."FREQUENCYMODIFYLOG" ( "FREQUENCYID" NUMBER(10,0), "NAME" NVARCHAR2(30), "CODE" VARCHAR2( ...
分类:
数据库 时间:
2019-12-16 11:44:57
阅读次数:
101
Description 给定一个由0和1组成的数组A,将数组分成3个非空的部分,使得所有这些部分表示相同的二进制值。 如果可以做到,请返回任何[i, j],其中i+1 < j,这样一来: A[0], A[1], ..., A[i]组成第一部分; A[i+1], A[i+2], ..., A[j-1] ...
分类:
其他好文 时间:
2019-12-15 23:38:33
阅读次数:
93
字节三面的一道面试题,判断是否是相同二叉树 1 var isSameTree = function (p, q) { 2 if (p null && q null) return true; 3 if (p null && q !== null) return false; 4 if (p !== ...
分类:
编程语言 时间:
2019-12-15 10:49:41
阅读次数:
89
awesome-vmp 关于软件虚拟化保护(如VMProtect)的资料。 工具篇介绍了VM保护的现有分析工具,并进行了简单的试用分析。 文章篇介绍了VM保护相关的分析文章,包括对虚拟机的分析,及一些反混淆方法。 本项目发在了github上, https://github.com/lmy375/aw ...
分类:
其他好文 时间:
2019-12-14 21:05:18
阅读次数:
117