? python手把手叫你分析CSDN个人博客数据 获取个人的全部博客标题及链接,发布时间、浏览量、以及收藏量等数据信息,按访问量排序,整理成一份Excel表存储。使用时,输入个人博客ID即可,从数据获取到解析存储,用到requests、BeautifulSoup、pandas等三方库,一个完整的P ...
分类:
其他好文 时间:
2020-10-12 20:06:17
阅读次数:
23
其实这次的内容我是想放在上一篇的博文中的,但是上次犯懒了,就放在这里了奥。 基于mysql持久化操作: 将爬取数据写入文件这种情况还是少见的,因为文件无论是内存占用还是读写速度都存在一定的瑕疵,所以我们更多的是操作数据库。因为items对象已经准备好了所以我们只需要进行pipeline管道更改就可以 ...
分类:
编程语言 时间:
2020-10-10 17:35:46
阅读次数:
25
1. 问题背景 某核心JAVA长连接服务使用mongodb作为主要存储,客户端数百台机器连接同一mongodb集群,短期内出现多次性能抖动问题,此外,还出现一次“雪崩”故障,同时流量瞬间跌零,无法自动恢复。本文分析这两次故障的根本原因,包括客户端配置使用不合理、mongodb内核链接认证不合理、代理 ...
分类:
数据库 时间:
2020-10-09 20:24:10
阅读次数:
21
Mongodb数据库的安装第一步:下载mongodb安装包:MongoDB官方下载地址:http://www.mongodb.org/downloads第二步:解压压缩包将安装包在/usr/local目录下解压缩:tar-zxvfmongodb-linux-x86_64-rhel62-3.4.2.tgz第三步:安装准备将mongodb解压后的文件夹重命名:[root@192local]#mvmon
分类:
数据库 时间:
2020-10-08 18:53:53
阅读次数:
26
MongoDB增删改查操作 MongoDB数据库服务启动和关闭 net start mongodb net stop mongodb 数据库连接 先使用npm install mongoose安装mongoose依赖,之后使用mongoose提供的connect方法即可连接数据库。 const mo ...
分类:
数据库 时间:
2020-10-08 18:21:12
阅读次数:
25
线上某集群峰值TPS超过100万/秒左右(主要为写流量,读流量很低),峰值tps几乎已经到达集群上限,同时平均时延也超过100ms,随着读写流量的进一步增加,时延抖动严重影响业务可用性。经过一些列性能优化,该集群性能得到了数十倍的性能提升,效果明显,本文是上篇,下篇更精彩。
分类:
数据库 时间:
2020-10-07 20:59:31
阅读次数:
46
本文主要介绍了下我MongoDB的安装、配置过程,算是开启对MongoDB的学习,文中如有专业知识表述不当之处,还请不吝赐教。 ...
分类:
数据库 时间:
2020-10-07 20:39:55
阅读次数:
27
1.分析美团美食网页的url参数构成 1)搜索要点 美团美食,地址:北京,搜索关键词:火锅 2)爬取的url https://bj.meituan.com/s/%E7%81%AB%E9%94%85/ 3)说明 url会有自动编码中文功能。所以火锅二字指的就是这一串我们不认识的代码%E7%81%AB% ...
分类:
编程语言 时间:
2020-10-05 22:19:59
阅读次数:
57
QQ空间自动点赞 前景提要 目标确定 分析介绍 登陆获取cookie 寻找XML 寻找可变参数 获取第一个空间动态 寻找点赞所需的URL 寻找可变参数 功能提升到秒赞 全部代码 最后还是希望你们能给我点一波小小的关注。 奉上自己诚挚的爱心💖 很多人学习python,不知道从何学起。很多人学习pyt ...
分类:
编程语言 时间:
2020-10-05 22:14:18
阅读次数:
40
服务端通常需要支持高并发业务访问,如何设计优秀的服务端网络IO工作线程/进程模型对业务的高并发访问需求起着至关重要的核心作用。本文总结了了不同场景下的多种网络IO线程/进程模型,并给出了各种模型的优缺点及其性能优化方法,非常适合服务端开发、中间件开发、数据库开发等开发人员借鉴。
分类:
数据库 时间:
2020-10-05 22:04:05
阅读次数:
39