# -*- coding: utf-8 -*-import requestsimport reimport sysreload(sys)sys.setdefaultencoding('utf-8')class Spider(object): def __init__(self): ...
分类:
编程语言 时间:
2015-11-19 16:25:20
阅读次数:
265
环境centos:6.5安装numpypandasmatplotlibseabornscipy首先安装这些包的一些依赖不然用pip安装不了这些yum-yinstallblasblas-devellapack-devellapack
yum-yinstallseabornscipy
yum-yinstallfreetypefreetype-devellibpnglibpng-devel然后用豆瓣的pypi源要比官方的快很多pipi..
分类:
其他好文 时间:
2015-11-09 19:19:47
阅读次数:
230
阿里阿里的开源项目很多,这也跟@淘宝正明的开源态度密不可分。有很多重量级的项目,例如LVS、Tengine,或者很有实践价值的中间件,例如 MetaQ(分布式消息系统)、dubbo(RPC框架)、cobar(数据库中间件),或者是Java世界的工具,例如druid、fastjson。都说国内Java...
分类:
其他好文 时间:
2015-11-08 15:12:40
阅读次数:
469
一、书本大纲*整理大纲带有个人偏见阅读时间:1~2小时豆瓣评分:8.8书籍链接:http://read.douban.com/ebook/4868728/?dcs=book-searchxmind:http://pan.baidu.com/s/1gdCqW8r#path=%252Fblog%252F...
分类:
其他好文 时间:
2015-10-18 21:24:09
阅读次数:
135
用scrapy抓取的豆瓣的图书信息保存为csv文件用excel打开后显示乱码后来按照百度的解决csv乱码问题解决了方法是:1、先选择记事本为该csv文件的打开方式2、然后另存为编码格式为ansi的csv文件再用Excel打开就不是乱码了。爬下来的文件本来是UTF-8编码的中途尝试过保存为unicod...
分类:
其他好文 时间:
2015-10-17 10:33:37
阅读次数:
155
这是一个模拟登录知乎的爬虫。运行后输入用户名密码以及和程序同一目录下的验证码图片,登陆成功后能够显示你在豆瓣地昵称。#! /usr/bin/env python#! -*-coding: utf-8 -*-import jsonimport urllibimport urllib2import co...
分类:
编程语言 时间:
2015-10-12 00:21:46
阅读次数:
248
自从李总理视察了深圳的创客空间后,全国就挂起了一股“创客风”,无数的创客空间像雨后春笋一样迅速的建立起来,让“创客”一词走进了大家的视野里。 废话就不错说了,这里我就分享一下如何推广科技类的网站。...
分类:
其他好文 时间:
2015-10-08 23:22:40
阅读次数:
354
应用kNN算法预测豆瓣电影用户的性别摘要本文认为不同性别的人偏好的电影类型会有所不同,因此进行了此实验。利用较为活跃的274位豆瓣用户最近观看的100部电影,对其类型进行统计,以得到的37种电影类型作为属性特征,以用户性别作为标签构建样本集。使用kNN算法构建豆瓣电影用户性别分类器,使用样本中的90...
分类:
编程语言 时间:
2015-10-07 12:04:53
阅读次数:
498
简介朋友问我能不能做一个下载他在豆瓣读书上的短评的工具,于是就做了这个“豆瓣用户读书短评下载工具”。 GitHub链接:https://github.com/xiaff/dbc-downloader。这个小工具使用Python3.4编写,其工作流程为:用户输入其豆瓣ID;抓取用户评论列表网页对网页进...
分类:
编程语言 时间:
2015-10-07 11:58:31
阅读次数:
300
前言由于之后要做一个实验,需要用到大量豆瓣用户的电影数据,因此想到了从豆瓣电影的“看过这部电影 的豆瓣成员”页面上来获取较为活跃的豆瓣电影用户。链接分析这是看过"模仿游戏"的豆瓣成员的网页链接:http://movie.douban.com/subject/10463953/collections。...
分类:
编程语言 时间:
2015-10-07 10:51:00
阅读次数:
200