2月有两场比赛,总分前八的有纪念品。第一场排第11,要拿到奖品毫无把握。。心血来潮写了个用来计算几场比赛总分排名的脚本,好让自己第一时间知道能不能得奖(囧),也稍微试下BeautifulSoup。# -*- coding: utf-8 -*-from bs4 import BeautifulSoup...
分类:
编程语言 时间:
2015-02-11 00:28:19
阅读次数:
211
爬虫:scrapy,beautifulsoup自然语言处理:nltk,Pattern(Google,Twitter,andWikipediaAPIs,awebcrawler,aHTMLDOMparser),结巴分词科学计算:NumPy,SciPy,matplotlib机器学习、数据挖掘:scikit-learn,pandas,MDP(neuralnetworks),PyBrain(neuralnetworks),Theano(GPU,deeplearn..
分类:
编程语言 时间:
2015-02-07 19:02:28
阅读次数:
185
Python BeautifulSoup 简单笔记 http://rsj217.diandian.com/post/2012-11-01/40041235132http://www.cnblogs.com/scrat/archive/2013/01/18/2866637.htmlBeautiful ...
分类:
编程语言 时间:
2015-02-06 16:27:22
阅读次数:
160
写技术博客主要就是总结和交流的,如果文章用错,请指正啊!以前一直在使用SGMLParser,这个太费时间和精力了,现在为了毕业设计,改用BeautifulSoup来实现HTML页面的解析工作的。一、字符的编码和解码 和网页打交道,首先解决的就是web页面的编码方式,不幸的是不同网站的页面编码方式基....
分类:
编程语言 时间:
2015-01-28 17:40:25
阅读次数:
156
在网上看到有人利用python+beautifulsoup爬取豆瓣Top250试着自己模仿这个做了个爬取IMDB的,可惜只能爬取到11个。后来检查了超久,才发现,soup=BeautifulSoup(contents)这里,内容不完整,只能到11个电影为止。代码如下:import urllib2fr...
分类:
数据库 时间:
2015-01-26 21:03:15
阅读次数:
228
1、esay_install
easy_install是Python的发行包管理工具,类似于linux的apt-get或者yum包管理工具,使用easy_install可以很方便的获取第三方的Python发行模块。
安装方法:
1.1 Mac OS X 系统可以在终端执行以下命令:
curl https://bootstrap.pypa.io/ez_setup.py -o - ...
分类:
编程语言 时间:
2015-01-22 18:04:45
阅读次数:
629
1. 什么是beatifulsoup?beatifulsoup官网http://www.crummy.com/software/BeautifulSoup/ BeatifulSoup是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。 它...
分类:
编程语言 时间:
2015-01-19 20:54:36
阅读次数:
132
#!/usr/bin/python
# -*- coding: utf-8 -*-
import sys
import re
import urllib2
from BeautifulSoup import BeautifulSoup
def search(key):
#请求搜索链接,关键字用参数key代替
search_url='http://www.baidu.com/s?ie=UT...
分类:
编程语言 时间:
2015-01-19 09:22:12
阅读次数:
166
bs4:转换成unicode编码,http://www.crummy.com/software/BeautifulSoup/from bs4 import BeautifulSoupsoup = BeautifulSoup(open("index.html"))soup = BeautifulSou...
分类:
编程语言 时间:
2015-01-09 14:06:37
阅读次数:
194
功能 1.自动登录csdn 2.查找未评论的资源并自动评论 用到的库 1.python自带的requests,获取以及发送网页数据 2.python自带的time,用作休眠,csdn资源一段时间内只允许评论一个资源,每评论一个资源要休息一段时间 3.BeautifulSoup,解析htm...
分类:
编程语言 时间:
2015-01-07 16:20:56
阅读次数:
274