原文:使用HttpWebRequest和HtmlAgilityPack抓取网页(拒绝乱码,拒绝正则表达式)废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时...
分类:
Web程序 时间:
2014-06-27 20:32:13
阅读次数:
270
今天接到了个任务,要将字符串Test("\r\nABC")替换为Test("ABC\n"),其中使用到了分组替换的方法,使用vi执行如下命令进行替换:%s/"\(\\r\\n\)\([^\\]*\)"/"\2\\n"/g%s - vi的替换命令 尾部的/g意味全局替换"\(\\r\\n\)\([^\...
分类:
其他好文 时间:
2014-06-26 21:32:54
阅读次数:
266
折磨了几个小时,写出匹配SQL语句中的所有表名,备忘记录1 \*\s+from\s+[\w\[\]]*\.?[\w\[\]]*\.?\[?(\b\w+)\]?[\r\n\s]*支持各种表达式SELECT * FROM Config SELECT * FROM [dbo].IMEIUser SELEC...
分类:
数据库 时间:
2014-06-26 19:37:10
阅读次数:
548
正则表达式非常好,但在数据库中就是没有,但可以通过程序集方式扩展先编写一个dll,标量函数很好写,表值函数麻烦一点下面是C#代码using System;using System.Data;using System.Data.SqlClient;using System.Data.SqlTypes;...
分类:
数据库 时间:
2014-06-26 19:10:35
阅读次数:
297
其实以前我偷偷学习正则表达式的时候,写过一个getbyclass的方法,最近翻了翻到处都是错,或者好多重复的,没有用的 代码,于是显得没事我就把这个精简了一下,其实这个方法现在我觉得也是有问题的,问题在于我不知道原生的getElementsByClassName获取元素后生产的是不是数组,不管这个到...
分类:
其他好文 时间:
2014-06-26 18:13:42
阅读次数:
154
正则表达式语法一个正则表达式就是由普通字符(例如字符a到z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。如:JScriptVBScript匹配/^\[\t]*$/"^\[\t]*$"匹配...
分类:
其他好文 时间:
2014-06-26 17:56:14
阅读次数:
173
环境:ubuntu_server 1210目的:构建web版hello world程序参考链接:http://roberto-aloi.com/blog/2013/07/13/create-deploy-erlang-cowboy-application-heroku/1.使用rebar 构建一个项...
分类:
Web程序 时间:
2014-06-26 16:11:10
阅读次数:
339
废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时候,我崩溃了,http请求后,得到的是字符串竟然是乱码,然后就各种百度(谷歌一直崩溃中),最后找到了原因。...
分类:
Web程序 时间:
2014-06-26 12:57:58
阅读次数:
373
废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时候,我崩溃了,http请求后,得到的是字符串竟然是乱码,然后就各种百度(谷歌一直崩溃中),最后找到了原因。...
分类:
Web程序 时间:
2014-06-26 12:53:48
阅读次数:
232