页面解析和数据提取 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值。内容一般分为两部分,非结构化的数据 和 结构化的数据。 非结构化数据:先有数据,再有结构,(http://www.baidu.com) 结构化数据:先有结构、再有数据(https://www.qiushi ...
                            
                            
                                分类:
编程语言   时间:
2020-07-21 13:36:53   
                                阅读次数:
73
                             
                    
                        
                            
                            
                                python,编码格式,字符串类型,编码格式,编解码
                            
                            
                                分类:
编程语言   时间:
2020-07-20 11:06:02   
                                阅读次数:
71
                             
                    
                        
                            
                            
                                一、正常乱码过滤器 web.xml <filter> <filter-name>encoding</filter-name> <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class> <in ...
                            
                            
                                分类:
编程语言   时间:
2020-07-20 10:45:28   
                                阅读次数:
79
                             
                    
                        
                            
                            
                                    最近在进行开发的时候,发现之前的sogou拼音会出现乱码;就像下面这样:(图片来源自网络) 为了解决,这个问题,网友找到很多方法;但都是临时解决。根本原因应该是软件的bug。安装google输入法,可以绕开上述问题,节约折腾时间; 安装方法: apt-get install fcitx sudo a ...
                            
                            
                                分类:
系统相关   时间:
2020-07-19 15:58:37   
                                阅读次数:
92
                             
                    
                        
                            
                            
                                    问题重现 问题修复 出现这个问题,是因为,语言与外观不兼容导致,语言选“中文”,外观选“Metal” 细心的你,可能发现,为啥要重启2次呢???第一次设置完语言后,在设置外观,发现菜单不能选择,第二次重启后,才可以正常操作,估计是个bug 刚才那样只是暂时性中文显示,若想永久显示中文,请看下面 永久 ...
                            
                            
                                分类:
编程语言   时间:
2020-07-18 00:45:44   
                                阅读次数:
373
                             
                    
                        
                            
                            
                                    request作用域:+response对象【1】由客户端向服务端发送请求【2】携带参数的请求【3】get&post区别:【4】获取请求的参数API:request.getParameter(name) \\ request.getParameterValues(name)【5】中文乱码处理 -对于... ...
                            
                            
                                分类:
Web程序   时间:
2020-07-17 22:26:42   
                                阅读次数:
90
                             
                    
                        
                            
                            
                                今天安装了一个Debian的虚拟机,安装的时候本来想选英语的,但是时区只能用美国的时区,于是就换上了中文的,没有提示选择时区。 发现在shell中文还是乱码,于是毅然的把语言更改成英语的。打开文件locale sudo vi /etc/default/locale 显示 LANG="zh_CN.UT ...
                            
                            
                                分类:
编程语言   时间:
2020-07-17 22:04:10   
                                阅读次数:
89
                             
                    
                        
                            
                            
                                    开发工具:IntelliJ IDEA、Tomcat9.0、 jdk1.8 JS插件:juqery,bootstrap 解决办法: 第一步:修改 D:\Tomcat9.0.14\conf\server.xml,添加 URIEncoding="UTF-8" 第二步:修改D:\Tomcat9.0.14\b ...
                            
                            
                                分类:
Web程序   时间:
2020-07-17 19:18:32   
                                阅读次数:
80
                             
                    
                        
                            
                            
                                    开发工具:IntelliJ IDEA、Tomcat9.0、 jdk1.8 JS插件:juqery,bootstrap 解决办法: 第一步:修改 D:\Tomcat9.0.14\conf\server.xml,添加 URIEncoding="UTF-8" 第二步:修改D:\Tomcat9.0.14\b ...
                            
                            
                                分类:
Web程序   时间:
2020-07-17 16:10:19   
                                阅读次数:
202
                             
                    
                        
                            
                            
                                一、数据库的概念 数据库:DataBase 按照一定数据结构来组织、存储和管理数据的仓库。存储在一起的相关数据的集合。 数据库管理系统:DataBase Management System DBMS 为管理数据库而设计的一个电脑软件 关系数据库:建立在关系模型基础上的数据库 Sqlserver、My ...
                            
                            
                                分类:
数据库   时间:
2020-07-17 14:13:03   
                                阅读次数:
93