码迷,mamicode.com
首页 >  
搜索关键字:nodejs express 爬虫 网络爬虫    ( 21321个结果
python核心编程中网络爬虫的例子
1 #!/usr/bin/env python 2 3 import cStringIO # 4 import formatter # 5 from htmllib import HTMLParser ...
分类:编程语言   时间:2014-07-22 22:58:15    阅读次数:284
nodejs学习笔记_nodejs和PHP在基础架构上的差别--共享状态的并发
绝大多数对于Node.js的讨论都把关注点放在了处理高并发能力上,做开发的时候一定要明确node内部做出的权衡,以及node应用性能好的原因。node 为javascript引入了一个复杂的概念,:共享状态的并发。node採用一个长期执行的进程而php在apache中会产生多个进程例如以下图所看到的...
分类:Web程序   时间:2014-07-19 21:31:43    阅读次数:261
Node Node
http://www.nodejs.org/http://outofmemory.cn/code-snippet/1403/node-javascript-classic-introduction-HTTP-service-qi-codehttp://outofmemory.cn/code-snip...
分类:其他好文   时间:2014-07-19 20:39:22    阅读次数:217
Nodejs npm安装socket.io报错解决办法
安装socket.io时,报错,提示需要安装Microsoft visual studio 2005 或 Net framework 2.0 sdk,没有找到vcbuild.exe,解决办法是安装.NET Framework 2.0 Software Development Kit (SDK)htt...
分类:Web程序   时间:2014-07-19 20:26:01    阅读次数:285
html5 websocket + node.js 实现网页聊天室
1 client: socket.io server: node.js + express + socket.io 一个简单的聊天室 demo,没有注册,内置了一些测试用户2 client 关键代码var socket = io.connect('http://localhost:8080');.....
分类:Web程序   时间:2014-07-19 20:25:18    阅读次数:252
Hive架构层面优化之四 常用复杂/低效的统计从源上给出,以避免上层作业过多计算
案例一:trackinfo,基础表处理常用的低性能UDF背景描述:日志信息10分钟加载一次到实时日志表trackreal中(按小时分区),为了保证实时性,在加载的过程中并没有做任何的过滤处理,加载到trackreal表后再过滤非法数据、爬虫数据等,生成按天增量日志表trackinfo,然后根据不同的...
分类:其他好文   时间:2014-07-17 13:09:44    阅读次数:226
linux上安装nodejs(想在linux上学习nodejs的可以来看看)
说明: 使用CentOS系统,进行nodejs安装,nodejs版本-v0.8.7。   1,先下载nodejs: # wget http://nodejs.org/dist/v0.8.7/node-v0.8.7.tar.gz   2,解压文件 # tar xvf node-v0.8.7.tar.gz   3,进入解压目录 # c...
分类:Web程序   时间:2014-07-16 17:35:25    阅读次数:206
nodejs使用tcp协议编程(nodejs服务器端,java客户端)
var net = require ('net'); var HOST = '192.168.1.50'; var PORT = 8809; net.createServer(function(sock){ console.log('CONNECTED:'+sock.remoteAddress + ":"+ sock.remotePort); sock.on('d...
分类:编程语言   时间:2014-07-16 17:26:22    阅读次数:235
Windows 系统下设置Nodejs NPM全局路径
Windows下的Nodejs npm路径是appdata,很不爽,想改回来,但是在cmd下执行以下命令也无效npm config set cache "D:\nodejs\node_cache"npm config set prefix "D:\nodejs\node_global"最后在node...
分类:Windows程序   时间:2014-07-16 15:15:48    阅读次数:306
(插播)网络爬虫,抓取你想要得东西。
最近,有个朋友说,想在一些页面上获取一些关键性得信息。比如,电话,地址等等。一个个页面去找 又很麻烦。这时候,想起了 何不去用“爬虫”去抓取一些想要得东西。省事,省里。好,今天 我们就讲讲,关于爬虫得一些东西。 这里 自己也是,看了一些关于爬虫得知识,正好,这几日闲来没事。做了一个功能小得爬虫。 这里是使用 java来进行编写得  首先 我们来介绍下。使用得框架,jdk1.6,...
分类:其他好文   时间:2014-07-16 10:08:54    阅读次数:267
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!