页面解析和数据提取 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值。内容一般分为两部分,非结构化的数据 和 结构化的数据。 非结构化数据:先有数据,再有结构,(http://www.baidu.com) 结构化数据:先有结构、再有数据(https://www.qiushi ...
分类:
编程语言 时间:
2020-07-21 13:36:53
阅读次数:
73
python,编码格式,字符串类型,编码格式,编解码
分类:
编程语言 时间:
2020-07-20 11:06:02
阅读次数:
71
一、正常乱码过滤器 web.xml <filter> <filter-name>encoding</filter-name> <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class> <in ...
分类:
编程语言 时间:
2020-07-20 10:45:28
阅读次数:
79
python 线程与进程简介 进程与线程的历史 我们都知道计算机是由硬件和软件组成的。硬件中的CPU是计算机的核心,它承担计算机的所有任务。 操作系统是运行在硬件之上的软件,是计算机的管理者,它负责资源的管理和分配、任务的调度。 程序是运行在系统上的具有某种功能的软件,比如说浏览器,音乐播放器等。 ...
分类:
编程语言 时间:
2020-07-19 23:58:08
阅读次数:
99
最近在进行开发的时候,发现之前的sogou拼音会出现乱码;就像下面这样:(图片来源自网络) 为了解决,这个问题,网友找到很多方法;但都是临时解决。根本原因应该是软件的bug。安装google输入法,可以绕开上述问题,节约折腾时间; 安装方法: apt-get install fcitx sudo a ...
分类:
系统相关 时间:
2020-07-19 15:58:37
阅读次数:
92
问题重现 问题修复 出现这个问题,是因为,语言与外观不兼容导致,语言选“中文”,外观选“Metal” 细心的你,可能发现,为啥要重启2次呢???第一次设置完语言后,在设置外观,发现菜单不能选择,第二次重启后,才可以正常操作,估计是个bug 刚才那样只是暂时性中文显示,若想永久显示中文,请看下面 永久 ...
分类:
编程语言 时间:
2020-07-18 00:45:44
阅读次数:
373
request作用域:+response对象【1】由客户端向服务端发送请求【2】携带参数的请求【3】get&post区别:【4】获取请求的参数API:request.getParameter(name) \\ request.getParameterValues(name)【5】中文乱码处理 -对于... ...
分类:
Web程序 时间:
2020-07-17 22:26:42
阅读次数:
90
今天安装了一个Debian的虚拟机,安装的时候本来想选英语的,但是时区只能用美国的时区,于是就换上了中文的,没有提示选择时区。 发现在shell中文还是乱码,于是毅然的把语言更改成英语的。打开文件locale sudo vi /etc/default/locale 显示 LANG="zh_CN.UT ...
分类:
编程语言 时间:
2020-07-17 22:04:10
阅读次数:
89
开发工具:IntelliJ IDEA、Tomcat9.0、 jdk1.8 JS插件:juqery,bootstrap 解决办法: 第一步:修改 D:\Tomcat9.0.14\conf\server.xml,添加 URIEncoding="UTF-8" 第二步:修改D:\Tomcat9.0.14\b ...
分类:
Web程序 时间:
2020-07-17 19:18:32
阅读次数:
80
开发工具:IntelliJ IDEA、Tomcat9.0、 jdk1.8 JS插件:juqery,bootstrap 解决办法: 第一步:修改 D:\Tomcat9.0.14\conf\server.xml,添加 URIEncoding="UTF-8" 第二步:修改D:\Tomcat9.0.14\b ...
分类:
Web程序 时间:
2020-07-17 16:10:19
阅读次数:
202