爬虫框架:开发平台 centos6.7 根据慕课网爬虫教程编写代码 片区百度百科url,标题,内容 分为4个模块:html_downloader.py 下载器 html_outputer.py 爬取数据生成html模块 html_parser 获取有用数据 url_manager url管理器 sp ...
分类:
编程语言 时间:
2016-05-30 06:19:37
阅读次数:
1044
此Python脚本基本上实现了Linux系统里wc命令的全部功能vimwc.py#!/usr/bin/pythonimportosimportsysfromoptparseimportOptionParserdefopt():parser=OptionParser()parser.add_option("-c","--char",dest="chars",action="store_true",default=False,help="onlycountchars")par..
分类:
编程语言 时间:
2016-05-26 06:28:39
阅读次数:
540
需求分析: 在为网页服务提取API时需要解析页面中的信息 项目地址: https://github.com/hwding/LibXDUQuery 准备工作: 下载第三方库Jsoup(一款非常优秀的HTML Parser): https://jsoup.org/download 阅读Jsoup API ...
分类:
编程语言 时间:
2016-05-25 15:14:53
阅读次数:
190
名字空间 成员函数可以在名字空间的定义里去声明,然后再去采用一种定义方式例如:namespace__name::member_name的方式去定义这个成员函数 1 namespace parser{ 2 double prim(bool); 3 double term(bool); 4 } 5 6 ...
分类:
编程语言 时间:
2016-05-25 13:09:49
阅读次数:
193
修改后的实际应用全代码 草木瓜(七) 精读 源代码有百度云存盘
复杂的逻辑判断简化成程序判断语句,可便于应用的扩展和维护,也极大增强了代码的可读性。
我们对整体文件划分如下:
tree.l
tree.y
parser.h #内部编译使用的头文件
parser.c #内部编译的主函数
compile.h #内外部交互的头文件
main.c #外部程序
修改说...
分类:
其他好文 时间:
2016-05-23 15:07:36
阅读次数:
273
今天发现c_parser导出数据是会丢掉某些行,给过调试发现是他处理utf8编码时计算有误,目前还没有发现自动解决总是的方法,只会手动改代码来解决. 下一步计划把c_parser移植到windows下,并改正发现的问题, 做成windows程序的原因是自己对linux编程不太熟,调试更不熟,又考虑到... ...
分类:
数据库 时间:
2016-05-18 21:21:31
阅读次数:
176
1.apt-get install python-bs4 bs4只有py2的代码,安装在py3下会很麻烦 bs4支持HTML parser,也可以支持第三方的分析器 2.apt-get install python-lxml 3. apt-get install python-html5lib 4. ...
分类:
编程语言 时间:
2016-05-18 12:27:32
阅读次数:
165
19.1. HTMLParser — Simple HTML and XHTML parser 19.2. sgmllib — Simple SGML parser 19.3. htmllib — A parser for HTML documents 19.4. htmlentitydefs — ...
分类:
编程语言 时间:
2016-05-16 19:35:10
阅读次数:
292
一、fastjson 一款Json处理工具包,包括“序列化”和“反序列化”两部分,它具备如下特征:速度最快,测试表明,fastjson具有极快的性能,超越任其他的Java Json parser。包括自称最快的JackJson;功能强大,完全支持Java Bean、集合、Map、日期、Enum,支持 ...
分类:
Web程序 时间:
2016-05-15 18:05:35
阅读次数:
154
druid 是阿里开源在 github 上面的数据库连接池,里面有一个专门解析 sql 语句的模块 源码位置: https://github.com/alibaba/druid https://github.com/alibaba/druid SQL Parser 模块的介绍: https://gi ...
分类:
数据库 时间:
2016-05-13 18:43:13
阅读次数:
1907