坚持~坚持~坚持~! 视频地址:http://m.v.qq.com/page/x/h/y/x0188l7rfhy.html
分类:
其他好文 时间:
2016-03-18 08:22:18
阅读次数:
211
Python抓数据写到EXCEL中。以前都是写到txt中然后再导入到excel。现在直接写到excel中。#coding=utf-8
importxlwt
importrequests
frombs4importBeautifulSoup
importsys
reload(sys)
sys.setdefaultencoding(‘utf8‘)
#打开excel文件
data=xlwt.Workbook()
#获取其中的一个shee..
分类:
编程语言 时间:
2016-03-16 19:35:57
阅读次数:
442
今天晚上弄了一个简单的爬虫,可以爬取网页的图片,现在现在做一下准备工作。 需要的库:urllib 和 re urllib库可以理解为是一个url下载器,其中的有两个重要的方法 urllib.urlopen()和urllib.read()这两个方法,具体使用可以在网上查到;re这个库提供对正则表达式支
分类:
编程语言 时间:
2016-03-11 01:12:18
阅读次数:
792
原文http://www.xgezhang.com/python_crawler_jingdong.html先上我的代码。参考了上面链接的文章#-*-coding:utf-8-*-
#!/usr/bin/python
importos
importurllib2
importurllib
importcookielib
importre
importsys
frombs4importBeautifulSoup
‘‘‘
编码方式的设置,在中文使用时..
分类:
编程语言 时间:
2016-03-08 00:40:52
阅读次数:
4567
#coding=utf-8
importrequests
frombs4importBeautifulSoup
importsys
reload(sys)
sys.setdefaultencoding(‘utf8‘)
r=requests.get(‘http://html-color-codes.info/color-names/‘)
html=r.text
#printhtml
soup=BeautifulSoup(html,‘html.parser‘)
trs=soup.find_all(‘tr‘)
f=..
分类:
编程语言 时间:
2016-03-08 00:37:03
阅读次数:
200
Understanding the most common CSS display types of block, inline-block, and inline will allow you to get the most out of your HTML and use CSS Framewo
分类:
Web程序 时间:
2016-03-07 06:45:01
阅读次数:
264
python+mongodb 在爬虫的过程中,抓到一个中文字段,encode和decode都无法正确显示 注:以下print均是在mongodb中截图显示的,在pythonshell中可能会有所不同 比如中文 “余年”,假设其为变量a 1. print a 结果如下: 使用type查询之后,显示的确
分类:
编程语言 时间:
2016-03-06 17:23:46
阅读次数:
169
这是我最近学习用Python做爬虫时的一个小练习,这段程序可以可以统计拉勾网北京地区的数据挖掘类职位所需的各项技能。程序未完成,还需要加工,目前职位的网址为手动添加,作为程序演示,后续会改为自动读取网址。 代码如下: 1 #encoding: utf-8 2 ''' 3 本段代码可以统计拉勾网北京地
分类:
编程语言 时间:
2016-03-04 00:43:44
阅读次数:
226
不知不觉间,在这圈子里呆了这么多年了,可是没赚到钱,找工作也难找,感觉挺难的。 去年放弃了坚持了快4年的wp平台,转战android,自已弄了一个简单的python爬虫服务器,写好移动接口,花了二个月时间写完安卓应用,最近几天忙着上架的事情,今晚静下心来,想说说应用在市场中的定位。 在wp,由于生态
分类:
其他好文 时间:
2016-03-01 06:12:34
阅读次数:
133