做爬虫的人,一定离不开的一个框架就是scrapy框架,写小项目的时候可以用requests模块就能得到结果,但是当爬取的数据量大的时候,就一定要用到框架. 下面先练练手,用scrapy写一个爬取猫眼电影的程序,环境配置和scrapy安装略过 第一步肯定是终端运行创建爬虫项目和文件 然后在产生的ite ...
分类:
其他好文 时间:
2019-10-29 10:01:18
阅读次数:
122
Given an array of strings, group anagrams together. Example: Note: All inputs will be in lowercase. The order of your output does not matter. 基本的遍历练手题 ...
分类:
其他好文 时间:
2019-10-27 23:15:32
阅读次数:
163
最近在学习xpath,在网上找资料的时候,发现一个新手经常拿来练手的项目,爬取猫眼电影前一百名排行的信息,很多都是跟崔庆才的很雷同,基本照抄.这里就用xpath自己写了一个程序,同样也是爬取猫眼电影,获取的信息是一样的,这里提供一个另外的解法. 说实话,对于网页信息的匹配,还是推荐用xpath,虽然 ...
分类:
其他好文 时间:
2019-10-27 10:42:35
阅读次数:
130
这个可以作为xpath的练手项目,爬取股吧2016年6月份到2016年12月份的文章标题和发帖时间 代码如下: ...
分类:
其他好文 时间:
2019-10-27 10:39:32
阅读次数:
87
这是爬虫的第一部分,对于python基础与网络编程部分重点突出,主要以每次小项目为主;更新时间不定,随缘之人,缘分到了,文章就出来了。 简单说下这次练手的小东西想法:在暑假的时候,看见自己的电脑壁纸有点。。。。,LOW,所以想着做一个WIN下的壁纸切换小程序。这次只是图片提取部分,话不多说来看看代码 ...
分类:
其他好文 时间:
2019-10-26 22:29:58
阅读次数:
68
Given a m x n grid filled with non-negative numbers, find a path from top left to bottom right which minimizes the sum of all numbers along its path. ...
分类:
其他好文 时间:
2019-10-26 14:57:10
阅读次数:
55
每个月要打印本月考勤记录,加上想学习下selenium用于以后的测试,就先练练手。主要思路是:自动登录erp,自动点击到相关页面,修改部分元素属性方便查询,(顺便通过这种形式绕过我们erp在火狐上的一些无法点击的BUG),然后点击下载,修改firefox默认下载路径,捕获弹出的下载窗口(挣扎了一下并 ...
分类:
其他好文 时间:
2019-10-24 15:09:36
阅读次数:
102
更多精彩博文,欢迎访问 " 我的个人博客 " 前言 本人Java程序员一枚,眼看着这几年Go的势头不错,本着技多不压身的原则,也随大流慢慢学习。不得不说Go其实跟Java差别还是挺大的,毕竟习惯了面向对象的思想,一时间也有点接受不过来。俗话说实践才能出真知,本想着拿刚学的点皮毛练练手,结果就遇到了一 ...
分类:
其他好文 时间:
2019-10-17 21:41:53
阅读次数:
71
ps:有源码 但是都是一团糟js js 写不到点子上 html html 跳转异常 前天<10.14>经历了半天 修改好了登录注册,实在是无力在继续改下去 . 拿着静态资源 去Flask 进行二次开发 截止目前为止,除去登录验证码,和redis 缓存手机验证码,基本功能已实现 beginGitHub ...
分类:
其他好文 时间:
2019-10-16 19:26:23
阅读次数:
381
小白一个,刚刚费了老大的劲完成一个练手项目——image caption,虽然跑通了,但是评估结果却惨不忍睹。于是贴上大神的作品,留待日后慢慢消化。顺便记录下自己踩坑的一些问题。 " 先膜拜下大神的作品。 " 本次项目采用的模型结构如下。一路输入信息是利用VGG16提取的图像特征,另一路输入信息是利 ...
分类:
其他好文 时间:
2019-10-13 18:58:56
阅读次数:
117