python爬虫常用库 请求库: 1. requests 这个库是爬虫最常用的一个库 2. Selenium Selenium 是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击、下拉等操作 对于一些用JS做谊染的页面来说,这种抓取方式是非常有效的。 3.ChomeDrive 安装 ...
分类:
编程语言 时间:
2019-12-29 16:35:55
阅读次数:
68
一下为安装Mongdb的流程 A:选择合适自己电脑的MongoDB 下载,并按操作提示安装即可。 注意:下一步安装 "install mongoDB compass" 不勾选 B:在根目录下创建data\db文件目录来存储数据 C:mongodb环境变量配置 1:找到刚刚安装的mongodb文件下的 ...
分类:
数据库 时间:
2019-12-28 20:46:20
阅读次数:
83
本人免费整理了Java高级资料,涵盖了Java、Redis、MongoDB、MySQL、Zookeeper、Spring Cloud、Dubbo高并发分布式等教程,一共30G,需要自己领取。传送门:https://mp.weixin.qq.com/s/igMojff-bbmQ6irCGO3mqA 包 ...
分类:
编程语言 时间:
2019-12-28 16:30:38
阅读次数:
127
用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情。 ? 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存中,这个时候它的内容其实是一堆HTML,然后再对这些HTML内容进行解析,按照自己的想法提取出想要的 ...
分类:
编程语言 时间:
2019-12-28 16:12:50
阅读次数:
56
1.增 db.表名.insert({键:值}) 传单个对象,也可以用于传集合使用 []符号,进行包裹即可(代码仅做格式参考) db.user.insert([{ "_id" : NumberInt(16), "study" : true, "type" : "site", "username" : ...
分类:
数据库 时间:
2019-12-27 15:30:53
阅读次数:
78
模拟浏览器访问-User-Agent: import urllib2 #User-Agent 模拟浏览器访问 headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, l ...
分类:
编程语言 时间:
2019-12-27 09:33:42
阅读次数:
277
人生苦短,我用 Python 前文传送门: "小白学 Python 爬虫(1):开篇" "小白学 Python 爬虫(2):前置准备(一)基本类库的安装" "小白学 Python 爬虫(3):前置准备(二)Linux基础入门" "小白学 Python 爬虫(4):前置准备(三)Docker基础入门" ...
分类:
编程语言 时间:
2019-12-27 09:23:31
阅读次数:
85
一、redis概述 微信红包、淘宝、天猫、京东都使用redis redis是一种nosql 现在比较流行的nosql redis、memcached、mongodb、guava(loadingCache) redis支持多种数据类型:字符串(strings)、散列(hashes)、 列表(lists ...
分类:
编程语言 时间:
2019-12-26 19:07:02
阅读次数:
171
人生苦短,我用 Python 前文传送门: "小白学 Python 爬虫(1):开篇" "小白学 Python 爬虫(2):前置准备(一)基本类库的安装" "小白学 Python 爬虫(3):前置准备(二)Linux基础入门" "小白学 Python 爬虫(4):前置准备(三)Docker基础入门" ...
分类:
编程语言 时间:
2019-12-26 09:44:49
阅读次数:
102
原文链接:https://www.cnblogs.com/lemon-flm/p/11052449.html 由于自己的博客上线部署时需要用到mongodb来存储图片文件,所以先在本地电脑上安装了mongodb做测试,由于之前没接触过mongodb,所以安装过程中遇到了各种小问题,折腾了好久终于安装 ...
分类:
数据库 时间:
2019-12-25 20:15:17
阅读次数:
96