preface:最近学习工作之外,有个异性朋友需要爬取动态网页的要求,输入关键词爬取某个专利网站在该关键词下的一些专利说明。以往直接python urllib2可破,但是那只是对于静态网页可破,但是对于用js等其他的生成的动态网页的话,则貌似不行(没试过)。然后在网上找了些资料,发现scrapy结合selenium包好像可以。(之所以这么说,暂时卤主也还没实现,先记录下来。)
#========...
分类:
编程语言 时间:
2015-06-17 23:23:31
阅读次数:
209
preface:曾以为不会再用编程遇到定积分的计算,自从本科用过matlab编程计算积分后,没再用matlab,转而投向python的怀抱。python有对应的包sympy,用来计算积分,无论不定积分还是定积分。
主要用到integrate这个函数,
>>>:from sympy import integrate
>>>:integrate?
可以找到integrate函数的用法,...
分类:
编程语言 时间:
2015-06-17 11:32:57
阅读次数:
1431
源:libusb 开发者指南libusb Developers Guidelibusb 开发者指南原作者:Johannes Erdfelt翻译者:牛胜超Table of Contents目录Preface序言I. Introduction 引言 1. Overview 概述 2. Current O...
分类:
其他好文 时间:
2015-06-12 19:11:10
阅读次数:
647
preface:在ubuntu下做事情,在终端下运行一些命令,或者在vim里面做一些操作,自然而然需要用到一些小知识点,没有怎么系统地看《鸟哥的菜》,基本上是遇到了什么问题想要实现什么功能,就查找博客,学下该知识点,有些零散,便稍微积累总结下。
1.批处理命令sh:
需在终端运行多个命令时,将那些命令写到一个文件里面,并命名XX.sh,在终端运行sh XX.sh可破,终...
分类:
系统相关 时间:
2015-06-10 17:27:13
阅读次数:
175
preface: 这是个悲伤的故事。python基础没学好,容我写篇博客压压惊,不多说了,直接上代码。
一、复制运算,连等会让所有对象共享一个地址。还是不要偷懒的好。
In [4]: a = b = c = {}
In [5]: a["abc"] = 2
In [6]: b
Out[6]: {'abc': 2}
In [7]: a = {}
In [8]: b = {}
In [9]: c...
分类:
编程语言 时间:
2015-06-09 17:25:08
阅读次数:
132
数字比较小,所以题目的难点就转到了,阿拉伯数字向罗马数字转化的过程了。转化也不难。我直接手算了,值得注意的是8的写法VIII(不是IIX)。整体来说不难。只要观察出每一位是相互独立的就行。具体代码如下:/*ID: awsd1231PROG: prefaceLANG: C++*/#include#in...
分类:
其他好文 时间:
2015-06-05 00:20:17
阅读次数:
118
preface:同仁遇到一个问题,需要在上万个文件中找到第7000个文件,凌乱。。。查了下python相关资料,虽说没有完全解决,但还是有东西记录下来。
一、对某个文件夹下遍历文件,os.walk可破。若是多个文件夹的话,配合isdir, isfile等函数可破(参数可有可无):
for i in os.walk(os.getcwd(),topdown=True, onerror=No...
分类:
编程语言 时间:
2015-06-04 01:04:49
阅读次数:
112
preface:在走着走着的道路上,总会有些想法或者总结的念头,便想要记录下来,以备不时之需。ps:卤主搞自然语言处理相关,仅这块有些想法。
一、学好理论基础
卤主等有想法再些。
二、从数据入手,分析数据,看准需要实现的目标
无论科研还是工作,大同小异:做东西。在掌握基本方法(SVM, HMM, CRF, RF, LR等分类,聚类,回归工具)与工具(语言工具python,分...
分类:
其他好文 时间:
2015-06-02 18:03:01
阅读次数:
154
preface:许久没遇到过编码问题,一没注意就被绊倒脚了。。
一、编辑器是以ASICC编码格式的,若想在程序中有中文,需要改为utf-8格式,加入如下代码可破:
import sys
reload(sys)
sys.setdefaultencoding('utf8') 或者参考卤主转载的这篇http://blog.csdn.net/u010454729/article/details/40476015,另外一种方式可破。
二...
分类:
编程语言 时间:
2015-06-02 11:21:50
阅读次数:
141
USACO:2.2.1 Preface Numbering 序言页码
一、题目描述
★Preface Numbering 序言页码
一类书的序言是以罗马数字标页码的.传统罗马数字用单个字母表示特定的数值,一下是标准数字
表:
I 1 L 50 M 1000
V 5 C 100
X 10 D 500
最多3 个可以表示为10n 的数字(I,X,C,M)可以连续放在一起,表示它们的和:...
分类:
其他好文 时间:
2015-05-31 16:52:11
阅读次数:
128