升为大三已经一个月了,一个月的时间我感觉我什么都没有学会。 我们这个专业叫做信息安全与管理,我至今接触到的东西全是概念性的,什么工具,什么手段只了解一两个,爬虫和肉鸡的概念也一知半解,老师上课也侃侃而谈他自己上学时候的光辉岁月,有什么用呢? 总想着自学,学出点东西,然后我就查,想学好计算机安全需要干 ...
分类:
其他好文 时间:
2019-10-01 16:33:08
阅读次数:
106
实例需求:运用python语言爬取http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html这个开奖网站所有的信息,并且保存为txt文件。 实例环境:python3.7 BeautifulSoup库、XPath(需手动安装) urllib库(内置的pytho ...
分类:
编程语言 时间:
2019-01-02 23:33:13
阅读次数:
308
一般我们写好scrapy爬虫,如果需要启动的话,需要进入scrapy项目的根目录,然后运行以下命令: 这样我们就可以在终端查看到爬虫信息了。但爬虫运行状态还需要给上级领导看,或者自己有空的时候就看看,总不可能想看的时候就登录服务器。 下面就给大家介绍scrapy官方推荐的部署爬虫项目的方法。 需要安 ...
分类:
其他好文 时间:
2018-05-03 16:44:55
阅读次数:
211
NOJ的一道题 求助大神 Java爬虫,信息抓取的实现 C++实现给多个变量传值 指针定义成全局和定义在main中为什么不一样?定义在main中执行中止 cqj慰膛哦http://p.baidu.com/itopic/main/center?uid=b2fe61626334633530376481a ...
分类:
其他好文 时间:
2017-12-03 11:23:15
阅读次数:
186
一、什么是网络爬虫? 信息时代,每天我们都在上网,每天我们都在浏览器上访问网站,我们打开一个网页,接着又跳转到另一个网页,看到喜欢的内容,或者是一段幽默的句子,或者是一张美女的图片,我们会选择将其保存下来,当数量很多的时候,我们就会选择用程序来实现这样一个过程,实现自动浏览网页,自动根据我们的要求, ...
分类:
其他好文 时间:
2016-10-09 13:01:02
阅读次数:
106
转载请注明出处:http://blog.csdn.net/lmj623565791/article/details/23272657今天公司有个需求,需要做一些指定网站查询后的数据的抓取,于是花了点时间写了个demo供演示使用。思想很简单:就是通过Java访问的链接,然后拿到html字符串,然后就是...
分类:
编程语言 时间:
2015-07-29 22:36:17
阅读次数:
261
转载请注明出处:http://blog.csdn.net/lmj623565791/article/details/23272657今天公司有个需求,需要做一些指定网站查询后的数据的抓取,于是花了点时间写了个demo供演示使用。思想很简单:就是通过Java访问的链接,然后拿到html字符串,然后就是...
分类:
编程语言 时间:
2015-07-08 09:28:37
阅读次数:
211
转载请注明出处:http://blog.csdn.net/lmj623565791/article/details/23272657今天公司有个需求,需要做一些指定网站查询后的数据的抓取,于是花了点时间写了个demo供演示使用。思想很简单:就是通过Java访问的链接,然后拿到html字符串,然后就是...
分类:
编程语言 时间:
2015-06-18 21:40:14
阅读次数:
270
java思想很简单:就是通过Java访问的链接,然后拿到html字符串,然后就是解析链接等需要的数据。技术上使用Jsoup方便页面的解析,当然Jsoup很方便,也很简单,一行代码就能知道怎么用了:1 Document doc = Jsoup.connect("http://www.oschina.....
分类:
编程语言 时间:
2015-04-02 13:12:26
阅读次数:
262