码迷,mamicode.com
首页 >  
搜索关键字:python爬虫 mongodb ji    ( 12880个结果
使用python抓取CSDN关注人的所有发布的文章
使用python抓取CSDN关注人的所有发不过的文章...
分类:编程语言   时间:2014-06-19 09:35:54    阅读次数:273
php操作mongodb的常用函数
php操作mongodb的常用函数,连接,新增文档,删除文档,更新文档,给文档创建索引,查询一个文档,条件查询文档,条件统计文档数量
分类:数据库   时间:2014-06-16 00:16:19    阅读次数:347
[轉]redis;mongodb;memcache三者的性能比較
先说我自己用的情况:最先用的memcache ,用于键值对关系的服务器端缓存,用于存储一些常用的不是很大,但需要快速反应的数据 然后,在另一个地方,要用到redis,然后就去研究了下redis. 一看,显示自己安装了php扩展,因为有服务器上的redis服务端,自己本地就没有安装,其实用法和memc...
分类:数据库   时间:2014-06-15 18:28:38    阅读次数:315
Python爬虫之路——简单的网页抓图
用Python的urllib2库和HTMLParser库写了一个简单的抓图脚本,主要抓的是http://desk.zol.com.cn/meinv/这个链接下的图片,通过得到图集的起始URL地址,得到第一张图片,然后不断的去获取其下一个图片的URL,继而得到所有首页的图集的图片。 整个源码如下,比较简单,写这个只是简单的练手而已 #coding: utf-8 #############...
分类:编程语言   时间:2014-06-15 16:30:56    阅读次数:500
Python爬虫之路——简单网页抓图升级版(增加多线程支持)
转载自我的博客:http://www.mylonly.com/archives/1418.html 经过两个晚上的奋斗,将上一篇文章介绍的爬虫稍微改进了下(Python爬虫之路——简单网页抓图),主要是将获取图片链接任务和下载图片任务用线程分开来处理了,而且这次的爬虫不仅仅可以爬第一页的图片链接的,整个http://desk.zol.com.cn/meinv/下面的图片都会被爬到,而且提供了...
分类:编程语言   时间:2014-06-15 16:30:20    阅读次数:344
MongoDB -- mapReduce
================= Incremental mapReduce =================...
分类:数据库   时间:2014-06-15 10:27:58    阅读次数:209
使用python获取博客园作者的文章列表的超链接以及标题
使用python获取博客园作者的文章列表的超链接以及标题...
分类:编程语言   时间:2014-06-15 07:42:45    阅读次数:279
mongo修改表名
http://docs.mongodb.org/manual/reference/command/renameCollection/db.source-namespace.renameCollection( "target" )比如把users 替换成 all_usersdb.users.renam...
分类:其他好文   时间:2014-06-14 23:49:28    阅读次数:570
python爬虫之采集360搜索的联想词
有个视频专门讲过这个爬虫,但是太罗嗦了,顺便整理下,而且到现在,360也不傻,已经进化了,采用原来的方式,多少有点bug,这个后面会说。正题如下: 语言:python2.7.6 模块:urllib,urllib2,re,time 目标:输入任意词,抓到其联想词 版本:w1 原理:在360搜索主页:http://www.so.com/,当你输入”科技“时,搜索框会列出相应的联想词或者短...
分类:编程语言   时间:2014-06-14 09:11:06    阅读次数:1111
监控开发之用munin来自定义插件监控redis和mongodb
求监控组的大哥大妹子们干点事,真不容易!要问他们是谁?他们是神。轻易别找他们,因为找了也是白找。上次因为python和redis长时间brpop的时候,会有线程休眠挂起的情况,所有通知报警平台被下线了。这次算是完美解决了。再把他给上线。这两公司的告警已经开始往我这边的接口..
分类:数据库   时间:2014-06-13 21:08:17    阅读次数:414
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!