我们在抓网页的时候,希望获得的是网页中的有效信息。事实上,直接抓取下来的内容是网页全部的HTML代码,代码中有很多标签、格式控制等等无效的信息。这一节我们就来讲解对于任意一个网页,我们怎么提取出网页中的有效信息,并且结构化存储。 先亮代码:https://github.com/1049451037/ ...
分类:
Web程序 时间:
2017-05-09 18:19:26
阅读次数:
241
sysbench是一款简单易用的压力测试工具,可以测试cpu,memory,fileio,mysql数据库;sysbench安装方法:默认的epel源中的sysbench是0.4版本的,现在已经到1.x版本,本主采用1.x版本github-->https://github.com/akopytov/sysbenchcentos安装方法:#curl-shttps://packagecloud...
分类:
数据库 时间:
2017-05-09 17:49:54
阅读次数:
304
参考文档:https://go.libhunt.com/project/traefik/vs/caddy
分类:
其他好文 时间:
2017-05-09 17:49:40
阅读次数:
471
SQL是个ANSI标准。各数据库厂商根据该标准开发自己的数据库及语言。SQL Server 用的叫T-SQL。Oracle的叫PL/SQL。 稍微总结一下常用到的一些T-SQL的一些东西,想到哪写到哪,大神勿喷。 函数 1. 数学函数 MIN(COLUMN):最小值--聚合函数; MAX(COLUM ...
分类:
数据库 时间:
2017-05-09 16:56:50
阅读次数:
216
1.MongoDB下载地址:下载对应的版本 https://www.mongodb.org/ =>download=>window=>download 2.安装 按默认或选择安装位置一步步到头 3.创建数据库数据存放文件夹 比如D:/data/db 4. 启动mongodb (指定数据文件存储路径) ...
分类:
数据库 时间:
2017-05-09 16:52:42
阅读次数:
174
PHP解析MySQL Binlog,依赖于mysql-replication-listener库 详见:https://github.com/bullsoft/php-binlog Install MySQL Replication Listener https://github.com/bulls ...
分类:
数据库 时间:
2017-05-09 16:17:58
阅读次数:
319
题目链接:https://www.51nod.com/onlineJudge/questionCode.html#!problemId=1208 题意:也是矩形框点问题,不过每个点有权值,希望权值最大。 直接把出入的event中的sign变成对应权值,更新到线段树上就行了。 ...
我们知道混合开发,可以节省很多成本(时间成本,经济成本等等),所以有很多公司比较钟爱这种开发形式,今天所讲的优化方式,也是我在我们公司的应用中实际用了的,而且我写的这个优化的 SDK 已经开源到 github 上了,有兴趣的同学可以下载来看一下,有不足的地方欢迎指正。这里给出链接:https://. ...
分类:
移动开发 时间:
2017-05-09 15:42:02
阅读次数:
327
今天自己遇到了扩展C盘的情况,就在网上找到了这个方法,完美扩容,目前没发现任何问题,在此记录一下,方便以后查用。 摘录自百度经验:C盘如何扩容C盘太小怎么办无损分区 地址:https://jingyan.baidu.com/article/6dad5075d90b58a123e36ef6.html ...
分类:
其他好文 时间:
2017-05-09 14:56:54
阅读次数:
156
详情,请看虫师博客http://www.cnblogs.com/fnng/p/3737964.html 和https://my.oschina.net/matrixchan/blog/184445 http://blog.csdn.net/yjwx0018/article/details/52959 ...
分类:
其他好文 时间:
2017-05-09 14:54:19
阅读次数:
230