网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 Scrapy Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 其可以应用 ...
分类:
编程语言 时间:
2016-09-01 01:59:36
阅读次数:
303
虽然针对Linux的恶意软件并不像针对Windows乃至OS X那样普遍,但是近些年来,Linux面临的安全威胁却变得越来越多、越来越严重。个中原因包括,手机爆炸性的普及意味着基于Linux的安卓成为恶意黑 客最具吸引力的目标之一,以及使用Linix系统作为数据中心服务器系统的机器也在一直稳步增长。... ...
分类:
系统相关 时间:
2016-08-18 08:38:56
阅读次数:
221
回顾 列属性: 主键, 自增长, 唯一键 关系: 一对一,一对多和多对多 范式: 三层范式 1NF: 字段设计必须符合原子性 2NF: 不存在部分依赖(没有复合主键) 3NF: 不存在传递依赖(实体单独建表) 逆规范化: 效率与磁盘空间的博弈 高级数据操作 新增操作: 主键冲突(更新和替换), 蠕虫... ...
分类:
数据库 时间:
2016-08-12 09:03:53
阅读次数:
270
一、 简介 最近,我了解到一个叫做Sanctuary的相当有趣的安全产品。它能够阻止任何程序的运行-这些程序没有显示在软件列表中-该表中的程序被允许在一个特定的机器上运行。结果,PC用户得到保护而免于各种插件间谍软件、蠕虫和特洛伊木马的侵袭-就算能够进入他/她的计算机,它们也没有机会执行,并因此没有 ...
分类:
系统相关 时间:
2016-07-07 17:24:58
阅读次数:
338
题意:n个数,求最短的子序列和>=s 分析:尺取法,也叫蠕虫法,每次枚举起点,然后往右移动,找到右边界 #include<iostream> #include<cstdio> #include<algorithm> #include<cmath> using namespace std; const ...
分类:
其他好文 时间:
2016-06-08 23:03:53
阅读次数:
188
5.网络安全 被动攻击(UDP报文被截获 被 进行流量分析) 主动攻击 1.篡改(更改报文流 伪报文) 2.恶意程序(病毒、木马、蠕虫、炸弹) 3.拒绝服务Dos 密码体制 1.对称密钥密码体制(DES IDEA) 即加密和解密的密钥K相同 2.公钥密码体制(RSA) A加密使用PKB公钥 B解密使 ...
分类:
其他好文 时间:
2016-06-05 15:17:05
阅读次数:
102
系统 : Windows xp 程序 : 某游戏客户端 程序下载地址 :不提供 要求 : 脱去压缩壳 使用工具 : OD & PEID & LordPE & Import REC 被感染客户端中的是Ramint蠕虫病毒,感染速度非常快,危害相当大。建议在虚拟机环境下进行逆向分析。 相关资料: 本文参 ...
分类:
其他好文 时间:
2016-05-08 16:34:34
阅读次数:
171
爬取京东本周热卖商品基本信息存入MySQL
网络爬虫介绍
概述
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
产生背景
随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息...
分类:
数据库 时间:
2016-05-02 02:26:02
阅读次数:
423
高级操作 复制表结构 语法: create table 表B like 表A; 示例: 复制表中的数据 语法: create table 表B select *或字段列表 from 表A; 蠕虫复制 语法: insert into 表名【(字段列表)】 select *或字段列表 from 表名; ... ...
分类:
数据库 时间:
2016-04-05 23:03:56
阅读次数:
221