为了通过爬虫快速获取网站中的信息,我们通常将第一次爬取的网页中的url形成一个待爬取的列表 为了访问网站以及对网站源代码进行分析,这里使用urllib的request库获取网页源代码,使用lxml库对网页进行结构分析。 首先引用需要的库 import urllib.request import lx ...
分类:
编程语言 时间:
2021-02-26 13:00:47
阅读次数:
0
流行的开放数据存储库: UC http://archive.ics.uci.edu/ml/ Kaggle https://www.kaggle.com/datasets Amazon's aws http://aws.amazon.com/fr/datasets/ 元门户站点: http://dat ...
分类:
Web程序 时间:
2021-02-26 12:55:40
阅读次数:
0
linux7.4源码编译安装nginx 介绍 Web工作者构建网站就需要用到Nginx Web服务器,可是还有小伙伴不会在Linux上安装Nginx,毕竟我们开发的项目都是要在服务器上运行的,今天就来讲讲如何在CentOS7环境使用源码进行安装Nginx。 Nginx官网下载链接:https://n ...
分类:
系统相关 时间:
2021-02-24 12:50:50
阅读次数:
0
zookeeper zookeeper安装配置 从官网下载zookeeper的安装包:官网推荐的zookeeper镜像下载网站 将zookeeper的压缩包解压到指定安装目录 在zookeeper安装目录新建 data 和 log 文件夹,将conf目录下的 zoo_sample.cfg 文件,复制 ...
分类:
其他好文 时间:
2021-02-23 14:36:36
阅读次数:
0
目录 概述 测试环境 安装过程 配置启动 客户端介绍 多级DC的ldif文件的配置 [一]、概述 什么叫LDAP呢,概念的东西这里就不多讲了,网上搜索下有很多,本文的重点是介绍如何在windows平台上安装和配置openLDAP软件。 openLDAP官方网站:http://www.openldap ...
无法连接raw.githubusercontent.com curl: (7) Failed to connect to raw.githubusercontent.com port 443: Connection refused 打开网站 https://www.ipaddress.com/ 查询 ...
分类:
其他好文 时间:
2021-02-23 14:23:50
阅读次数:
0
1.XSS原理 跨站脚本攻击是一种针对网站应用程序的安全漏洞攻击技术,是代码注入的一种。它允许恶意用户将代码注入网页,其他用户在浏览网页时会受到影响。恶意用户利用xss代码攻击成功后,可能得到很高的权限、私密网页内容、会话和cookie等各种内容。 2.XSS分类反射型xss 反射型xss又称非持久 ...
分类:
其他好文 时间:
2021-02-20 12:02:08
阅读次数:
0
开发类: goadmin一个快速开发GO后台框架: https://www.go-admin.cn go zero 开发微服务框架: https://www.yuque.com/tal-tech/go-zero GORM GoLand开发ORM框架: https://gorm.io/zh_CN/do ...
分类:
Web程序 时间:
2021-02-20 11:53:53
阅读次数:
0
目录 1.桶排序思想 2.算法过程 3.算法实现代码 在开头安利一个可视化网站: https://www.cs.usfca.edu/~galles/visualization/Algorithms.html 这上面有排序算法的可视化实现,可结合下文算法过程对照着图学习。 思想:将待排序集合中处于同一 ...
分类:
编程语言 时间:
2021-02-20 11:44:16
阅读次数:
0
Vicdas实时历史数据库版本更新到:v2.4.1.210214 升级内容: 1、增加采集器状态点、实时服务时间点; 2、优化组态工具使用体验; 3、更换My sql访问方式,使用v5.7及以上,推荐8.0,Ms sql无变化; vicdas网站地址:http://www.vicdas.com ...
分类:
数据库 时间:
2021-02-19 13:34:23
阅读次数:
0