简单使用Scala和Jsoup对豆瓣电影进行爬虫,技术比較简单易学。 <!--more--> 写文章不易,欢迎大家採我的文章,以及给出实用的评论,当然大家也能够关注一下我的github;多谢。 1、爬虫前期准备 找好须要抓取的链接:https://movie.douban.com/tag/%E7%B ...
分类:
其他好文 时间:
2018-02-01 13:04:26
阅读次数:
170
Python在导入第三方模块的时候用设置豆瓣源的方法提高效率,每次设置很麻烦,所以通过下面方法设置默认源,这样就可以直接pip install package,而不用指定源了。 ...
分类:
其他好文 时间:
2018-01-30 23:05:13
阅读次数:
435
简介 参考 " “做教练”之硬笔书法" , 掌握了基本笔画、偏旁部首后,可以较全面的临写一些古碑帖了。 由南朝梁周兴嗣撰写的《千字文》,是一篇使用时间最长、影响最大、流传最广的儿童启蒙读物。它行文流畅、辞藻华丽、内容丰富、气势磅礴。 在《千字文》的流传过程中,历代著名书法名家家如智永、怀素、褚遂良、 ...
分类:
其他好文 时间:
2018-01-30 23:01:40
阅读次数:
266
Python pip安装的原理就是从Python的官方源https://pypi.python.org/pypi下载到本地安装,但是访问官方源网络不稳定,速度较慢,我经常会遇到一个问题,pip安装包由于速度较慢,过了一段时间,安装超时,安装失败了!后来我使用了豆瓣源安装Python包,速度超快!&nbs
分类:
编程语言 时间:
2018-01-30 12:52:04
阅读次数:
1114
自己基于豆瓣FM的ui仿写qq音乐时,基于Jquery手写的进度条插件,效果图如下: 主要特色: ① 可自适应挂载元素的宽度,也可以自己设置进度条宽度; ② 支持部分默认参数修改(具体见使用说明); ③ 允许最大时间为23:59:59,高于此值将默认修改为此值; ④ 可以自己控制进度条动画的开关及重 ...
分类:
Web程序 时间:
2018-01-30 12:25:46
阅读次数:
312
目标:使用Python爬取豆瓣电影并保存MongoDB数据库中 我们先来看一下通过浏览器的方式来筛选某些特定的电影: 我们把URL来复制出来分析分析: https://movie.douban.com/tag/#/?sort=T&range=0,10&tags=%E7%94%B5%E5%BD%B1, ...
分类:
编程语言 时间:
2018-01-27 18:53:34
阅读次数:
1675
[TOC] 知乎: "C 语言学习的经典书籍有哪些?" 《The C Programming Language》( "豆瓣" ) quora: "Which are the best books to learn C?" quora: "Which book is best for learning ...
分类:
编程语言 时间:
2018-01-27 15:26:21
阅读次数:
291
Scrapy爬取豆瓣电影top250的电影数据、海报,并保存在MySQL中。动态切换User-Agent,动态切换代理IP(ip池需要自己填充),下载延迟2.5秒 ...
分类:
数据库 时间:
2018-01-21 23:54:36
阅读次数:
2040
一、权限:Linux下root,Windows下管理员。 二、Python相关 1、pip更新 2、更换pip源 国内镜像 豆瓣 临时更换: 可以在使用pip的时候在后面加上-i参数,指定pip源 eg: pip install scrapy -i https://pypi.tuna.tsinghu ...
分类:
其他好文 时间:
2018-01-19 19:59:31
阅读次数:
193
云计算:云计算最火的语言,典型应用OpenStack WEB开发:众多优秀的WEB框架,众多大型网站均为Python开发,Youtube,Dropbox,豆瓣... 科学运算、人工智能:典型库NumPy,SciPy,Matplotlib,Enthought librarys,pandas 系统运维: ...
分类:
编程语言 时间:
2018-01-18 23:12:44
阅读次数:
325