最简单的爬虫,不需要设定代理服务器,不需要设定cookie,不需要http连接池,使用httpget方法,只是为了获取html代码...好吧,满足这个要求的爬虫应该是最基本的爬虫了。当然这也是做复杂的爬虫的基础。使用的是httpclient4的相关API。不要跟我讲网上好多都是httpclient3...
分类:
编程语言 时间:
2014-07-09 20:49:07
阅读次数:
299
第一步,大家都知道的,肯定下载安装包,下载地址:http://nodejs.org/下载完成后直接安装,安装成功后,打开cmd,输入:node -v这时候,表示我们已经安装成功了。第二步,理所当然的,"hello world" 程序新建一个hello.js文件,里边输入:console.log("h...
分类:
Web程序 时间:
2014-07-09 20:35:43
阅读次数:
243
长期东忙西忙,却不忙更新自己的博客,缺少输出,甚为惭愧
记得我当初刚接触GruntJS的时候对NodeJS一知半解,所以第一次使用花了些时间才熟悉起来。本文希望能帮助朋友们快速入门。
为什么要合并、压缩你的JS文件?
在开始之前,先重申一下这个问题。因为经常在帮忙改东西的时候看到HTML页面上引用了N个JS,而通常看到这个就知道这人JS写得有多糟糕了。HTML里穿插一堆JS代码的我就不吐槽了...
分类:
Web程序 时间:
2014-07-08 14:49:47
阅读次数:
270
如果你一直在关注互联网的相关技术,你应该会有这样一种感觉,web技术正在发生着变革,虽然我们不愿相信,但一个事实已经越来越清晰的摆在了眼前:LAMP组合的时代将要成为历史,在web诞生的二十年间,它影响了互联网上的内容、协议、服务器以及客户端,而在今天看来,它即将成为一个过去的时代了。##I. 19...
分类:
编程语言 时间:
2014-07-08 00:27:30
阅读次数:
271
知名 nodeJS 框架 Express 的作者TJ Holowaychuk在 Twitter 发推并链接了自己的一篇文章,宣布弃 nodeJS 投 Go。 他给出的理由是:Go 语言和 Rust、Julia 等都是众多的下一代语言之一,虽然不能说它是最好的语言,但已足够成熟和稳健,用 Go 语言....
分类:
Web程序 时间:
2014-07-06 20:29:08
阅读次数:
235
写过很多个爬虫小程序了,之前几次主要用C# + Html Agility Pack来完成工作。由于.NET BCL只提供了"底层"的HttpWebRequest和"中层"的WebClient,故对HTTP操作还是需要编写很多代码的。加上编写C#需要使用Visual Studio这个很"重"的工具,开...
分类:
Web程序 时间:
2014-07-06 20:03:05
阅读次数:
346
最近,为了微信公众号的图文,上网疯狂的收集和看了一些有深度的新闻和有趣的引人深思的文字评论,并选择了几篇极品发布出去。但感觉一篇一篇的看实在是麻烦死了。想找一个简单的解决办法,看能不能自动把网上的资料收集起来,然后自己用统一筛选。不巧,最近准备学习下网络爬虫相关知识,于是按照网上的教程自己学着试写了一个小小的爬虫,嘻嘻,是用来爬韩寒博客的。
先把完整的代码贴上来,如果朋友们需要试验下,请...
分类:
编程语言 时间:
2014-07-06 10:11:48
阅读次数:
325
使用node的定时器timer实现经典的生产者消费者模型。...
分类:
Web程序 时间:
2014-07-06 09:21:34
阅读次数:
317
这个函数是对 linux C函数 initgroups() 的包装 node.js 官方文档很含糊,还是看 linux C函数文档的解释!很清楚明白。
The initgroups() function uses the getgrouplist(3) function to calculate
the supplementary group IDs for the use...
分类:
其他好文 时间:
2014-07-05 22:52:21
阅读次数:
285
1、用express开发站点时,怎么定义通用的头部和尾部
方案1:用类似asp时代的include添加,如ejs模板:
这里是内容。
注:..表示header.ejs在上一级目录,ejs扩展名可以去掉,直接写:include ../header
方案2:用类似于MVC的layout模板,这个要安装一个模块: npm install express-partials
...
分类:
Web程序 时间:
2014-07-04 07:15:24
阅读次数:
419