今天根据昨天爬取到的网址进行了二次爬取,爬取内容为每个信件的内容,然而本应该是一项很简单的任务,但是奈何数据是真的‘脏’,所以今天知识对所有的三万个网址进行了信件内容的爬取。 使用的时beautifulsoup进行爬取,在爬取的同时对数据进行了简单的处理,完善了一些bug。之后将按照下一步对怕爬取到 ...
分类:
其他好文 时间:
2020-02-02 19:45:52
阅读次数:
67
一,优化举例 二,浅谈StringComparison 三,C# CultureInfo 类 各国语言对应的区域性名称 一,优化举例 我们在写程序的时候,经常会用到字符串对比。例如:if(IsCheck == "true") 当大小写敏感的时候一般都用: string.ToLower()或者stri ...
命令汇总 ping 检查当前主机是否和目标主机是否畅通 traceroute -w 1 主机超时只等待1次 mtr nslookup 域名解析成ip地址 telnet 检查端口是否畅通 tcpdump 抓包信息保存到文件: netstat ss命令 ...
分类:
系统相关 时间:
2020-01-29 17:46:16
阅读次数:
94
已剪辑自: https://www.cnblogs.com/chenyangchun/p/6795923.html 1. c强制转换与c++强制转换 c语言强制类型转换主要用于基础的数据类型间的转换,语法为: (type-id)expression//转换格式1 type-id(expression ...
分类:
其他好文 时间:
2020-01-27 22:12:59
阅读次数:
80
1. 下载安装 1.1 这里选择安装的是3.1.2,使用下面命令进行下载: 1 # cd ~/software 2 wget http://mirror.bit.edu.cn/apache/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz 1.2 解压重命名 ...
分类:
其他好文 时间:
2020-01-27 10:54:20
阅读次数:
97
1) No implementation for org.apache.maven.model.path.PathTranslator was bound. while locating org.apache.maven.model.path.PathTranslator for field at ...
分类:
编程语言 时间:
2020-01-26 00:57:00
阅读次数:
164
Object类是Java中所有类的根父类, Java中的类要么直接继承Object, 要么间接继承Object类 Java中类的继承是可传递的, Object类中定义的方法,所有的类都能继承到 | Modifier and Type | Method and Description | | | | ...
分类:
其他好文 时间:
2020-01-20 21:18:14
阅读次数:
99
使用 helm 部署 Metrics Server helm repo add bitnami https://charts.bitnami.com/bitnami helm install bitnami/metrics-server 会有报错,执行以下命令 helm upgrade loopy- ...
分类:
其他好文 时间:
2020-01-20 12:48:19
阅读次数:
208
概述 在JDK1.7以后,新增了一个命令行工具 jcmd。他是一个多功能的工具,可以用它来导出堆、查看Java进程、导出线程信息、执行GC、还可以进行采样分析(jmc 工具的飞行记录器)。 命令格式 1 jcmd <pid | main class> <command ... | PerfCount ...
分类:
其他好文 时间:
2020-01-11 20:01:15
阅读次数:
124
单线程happen-before原则: 在同一个线程中,书写在前面的操作happen-before后面的操作。 锁的happen-before原则: 同一个锁的unlock操作happen-before此锁的lock操作。 volatile的happen-before原则: 对一个volatile变 ...
分类:
移动开发 时间:
2020-01-05 11:55:48
阅读次数:
85