码迷,mamicode.com
首页 >  
搜索关键字:nodejs express 爬虫 网络爬虫    ( 21321个结果
一个html5 + nodejs的游戏
可以阅读Mozilla开源的Browser Quest这个项目,一个html5 + nodejs的游戏,完整演示了客户端服务端怎么通讯的,逻辑怎么做的,通讯怎么做的,很值得参考。游戏demo: http://browserquest.mozilla.org项目代码: https://github.c...
分类:Web程序   时间:2014-07-28 13:47:50    阅读次数:232
js 中的正则表达式
一:正则表达式定义:记录文本规则的代码作用:表单验证,爬虫技术,可以对目标的内容进行替换。二:正则表达式的组成 1:普通字符组成正则浏览器的输出 2:定义字符集组成正则 3:特殊字符集组成正则 4:限制字符集组成正则 5:模式修正符
分类:Web程序   时间:2014-07-28 11:31:10    阅读次数:205
开源新闻采集器(一)内容简介
1.最近闲来无事,想把自己最近一段时间工作的东西整理下。目标:新闻采集器 1.只需要输入列表网址,采集器将自动采集所有的文章。 2.采集器最后无需写任何采集规则。 3.基于静态爬虫的HTML分页获取 策略(自己捉摸的,准确度不高) 4.基于开源项目的内容提取算法(Html2Arti...
分类:其他好文   时间:2014-07-28 11:22:50    阅读次数:197
使用grunt js进行js的链接和压缩
1,http://nodejs.org/download/安装nodejs2,配置环境变量,将nodejs的安装目录放置在Path环境变量中3,在cmd中npm install -g grunt-cli,如果已经安装的话npmuninstall-ggrunt 这句话可以删除4,grunt -vers...
分类:Web程序   时间:2014-07-28 03:02:49    阅读次数:301
深入浅出NodeJS——异步编程
深入浅出NodeJS之异步编程,发布/订阅模型,Promise/Deferred模型...
分类:Web程序   时间:2014-07-28 00:07:39    阅读次数:371
深入浅出NodeJS——内存控制
V8虚拟机的内存回收机制,和Java虚拟机类似采用分代回收机制,分为新生代和老生代,当满足一定条件新生代对象会晋级到老生代。利用Node在服务端编程要小心内存泄露问题,一个小的泄露由于大量并发访问可能会导致应用程序的崩溃。...
分类:Web程序   时间:2014-07-27 23:56:19    阅读次数:411
深入浅出NodeJS——Buffer
Node中为了应对文件读写,网络I/O处理,数据库访问等,需要高效操作二进制数据,Javascript中自带的字符串类型已远远不能满足要求,因此Buffer对象应运而生。Buffer对象内存分配并不在V8的堆内存而是C++外部内存申请,并在Javascript分配和使用。Buffer支持和String对象之间相互转换,但不是所有字符编码都支持,同时要注意转换过程中Buffer拼接造成的乱码问题。...
分类:Web程序   时间:2014-07-27 23:52:50    阅读次数:328
Livereload介绍
Livereload可理解为即时刷新,在前端开发中,开发者在编写或调试html/js/css代码后需要从编辑器切换到浏览器,再刷新浏览器才能看到页面变化,这种十分频繁的操作在一定程度上影响了工作效率,而Liverelod可以帮助我们ad解决了这个问题。 实现livereload有多种方式,可以借助Livereload软件加浏览器插件实现,也可以借助nodejs,通过gulp或者grunt这些...
分类:其他好文   时间:2014-07-27 23:44:50    阅读次数:374
用WebCollector制作一个爬取《知乎》并进行问题精准抽取的爬虫(JAVA)
WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。教程介绍了如何用WebCollector打造一个爬取《知乎》并进行问题精准抽取的爬虫(JAVA)...
分类:编程语言   时间:2014-07-27 11:50:23    阅读次数:424
使用“关键字+时间段+区域”搜集新浪微博数据的方法
作为国内社交媒体的领航者,很遗憾,新浪微博没有提供以“关键字+时间+区域”方式获取的官方API。当我们看到国外科研成果都是基于某关键字获得的微博,心中不免凉了一大截,或者转战推特。再次建议微博能更开放些!庆幸的是,新浪提供了高级搜索功能。找不到?这个功能需要用户登录才能使用……没关系,下面将详细讲述如何在无须登录的情况下,获取“关键字+时间+区域”的新浪微博。 首先...
分类:其他好文   时间:2014-07-27 11:38:44    阅读次数:386
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!