码迷,mamicode.com
首页 >  
搜索关键字:python爬虫 you-get    ( 2477个结果
[Python]爬取糗事百科
# coding=utf-8 import urllib2 import urllib import re class QiuShi: def _init_(self): self.page = 1 # 从网页获取糗事 def GetQiuShis(self,page): #网址 url = "http://www.qiushibaike.com/...
分类:编程语言   时间:2014-12-21 15:22:50    阅读次数:279
Android获取手机位置(LocationManager)
LocationManager lm = (LocationManager) getSystemService(Context.LOCATION_SERVICE); List providers = lm.getProviders(true); /* Loop over the array backwards, and if you get an accurate location, the...
分类:移动开发   时间:2014-12-20 19:42:35    阅读次数:234
【原创】编写多线程Python爬虫来过滤八戒网上的发布任务
目标:以特定语言技术为关键字,爬取八戒网中网站设计开发栏目下发布的任务相关信息需求:用户通过设置自己感兴趣的关键字或正则表达式,来过滤信息。我自己选择的是通过特定语言技术作为关键字,php、java和python。注意:如果不选用正则表达式,就会把javascript也爬进来,那前端的信息就比较多了...
分类:编程语言   时间:2014-12-17 22:12:52    阅读次数:304
Import SHA2 SSL cert to Windows IIS7
Import SHA2 SSL cert to Windows IIS71.You will get 3 piece of certs from GeoTrust, and save them to below1)=server.cert: Issue to "*.domain.cn", Issue...
分类:Windows程序   时间:2014-12-17 12:28:14    阅读次数:214
SmartGit STUDY
Git ConceptsThis section helps you to get started with Git and gives you an understanding of the fundamental Git concepts.Repository, Working Tree, Co...
分类:其他好文   时间:2014-12-15 23:28:55    阅读次数:401
python爬虫抓取色影无忌月赛获奖图片
因为平时爱好摄影,所以喜欢看看色影无忌论坛的获奖摄影作品,所以写了个小script用来抓取上面的获奖图片,亲自测试可以使用。# -*- coding: UTF-8 -*-#作者Rocky Chen import re, urllib, sys, os, time, urllib2, cookielib, string class Download: def __init__(self...
分类:编程语言   时间:2014-12-15 15:33:32    阅读次数:207
401 Not Authorized For MSDEPLOY? (msdeployAgentService)
When you get this error from msdeploy:“Error: The remote server returned an error: (401) Unauthorized.”you need to give the remote user elevated right...
分类:其他好文   时间:2014-12-11 17:10:22    阅读次数:231
Python爬虫预备知识
1.http编程知识http中client 和server的工作模式 client和server建立可靠的tcp链接(在HTTP1.1中这个链接是长时间的,超时断开策略) client通过socket与server通信,发送request并接受response http协议是无状态的,是指每一...
分类:编程语言   时间:2014-12-11 11:56:24    阅读次数:200
python爬虫,爬豆瓣top250电影
python爬虫,爬豆瓣top250电影...
分类:编程语言   时间:2014-12-10 19:52:46    阅读次数:167
Python 爬虫基础
下面是一个 Python 爬虫最简单的例子,使用网络库urllib2 和正则表达式库re,模拟浏览器的 User-Agent。#!/usr/bin/env python# -*- coding: utf-8 -*-#引入基础网络库import urllib2#引入正则表达式模块import re#模...
分类:编程语言   时间:2014-12-10 19:46:40    阅读次数:248
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!