有的时候爬取网页,可以利用网站额结构特点爬取网页 在百度搜索框中输入搜索内容,单击搜索,浏览器会发送一个带有参数的url请求。尝试删除其中的一些参数,只剩下wd这个参数。发现wd是搜索内容。这样程序可以根据不同的wd值,请求不同的网页。 浏览器中发送请求的url中包含汉字是不能请求成功的,需要将汉字 ...
分类:
Web程序 时间:
2018-06-24 16:54:42
阅读次数:
178
public static void main(String [] args) throws UnsupportedEncodingException { int val = 5; System.out.println(Integer.toBinaryString(7)); System.out.p... ...
分类:
编程语言 时间:
2018-06-24 14:02:06
阅读次数:
377
js代码: 正则: 如果有汉字以上方法的返回结果会出现乱码,可以使用decodeURI和encodeURI解决 ...
分类:
Web程序 时间:
2018-06-24 13:06:07
阅读次数:
151
聚集索引和非聚集索引的区别: 汉语字典的正文本身就是一个聚集索引。比如,我们要查“安”字,就会很自然地翻开字典的前几页,因为“安”的拼音是“an”,而按照拼音排序汉字的字典是以英文字母“a”开头并以“z”结尾的,那么“安”字就自然地排在字典的前部。如果您翻完了所有以“a”开头的部分仍然找不到这个字, ...
分类:
其他好文 时间:
2018-06-23 22:57:22
阅读次数:
251
maven 代码 如果中文乱码,可以先把待处理的内容做一次URLEncoder,变成没有汉字的内容再去调用方法就可以了。 ...
分类:
编程语言 时间:
2018-06-23 22:37:32
阅读次数:
453
验证网址:^http:\/\/[A-Za-z0-9]+\.[A-Za-z0-9]+[\/=\?%\-&_~`@[\]\':+!]*([^<>\"\"])*$电子邮箱:^[0-9a-z][a-z0-9\._-]{1,}@[a-z0-9-]{1,}[a-z0-9]\.[a-z\.]{1,}[a-z]$手 ...
分类:
其他好文 时间:
2018-06-21 13:36:00
阅读次数:
145
public static String post(String url, String data) throws ClientProtocolException, IOException { HttpClient httpClient = new DefaultHttpClient(); Http... ...
分类:
Web程序 时间:
2018-06-21 11:49:57
阅读次数:
204
js中编码问题 https://www.haorooms.com/post/js_escape_encodeURIComponent 我在前端js添加时候创建dom时候,有汉字,发现是乱码就研究了下 针对字符编码 针对url汉字编码 js字符串格式化 我在前端js添加时候创建dom时候, 发现能不能 ...
分类:
编程语言 时间:
2018-06-21 00:06:48
阅读次数:
193
function convertCurrency(money) { //汉字的数字 var cnNums = new Array('零', '壹', '贰', '叁', '肆', '伍', '陆', '柒', '捌', '玖'); //基本单位 var cnIntRadice = new Array... ...
分类:
Web程序 时间:
2018-06-20 14:32:22
阅读次数:
380
最近需要造一部分数据,需要用到人名,与其用脚本生成一些随机组合的汉字,不如在网上爬一些看似真实的姓名,所以找来了姓氏大全的网站,网址:http://www.resgain.net/xsdq.html 上图可以看到有很多不同的姓氏,每个姓氏(又是一个网页)里边有很多名字,这样轻轻松松就可以搞定一些真实 ...
分类:
编程语言 时间:
2018-06-20 00:03:42
阅读次数:
1175