利用国庆8天假期,从头开始学爬虫,现在分享一下自己项目过程。 技术思路: 1,使用scrapy爬去证监会反馈意见 分析网址特点,并利用scrapy shell测试选择器 加载代理服务器:IP池 模拟浏览器:user-agent 编写pipeitem,将数据写入数据库中 2,安装并配置mysql 安装 ...
分类:
其他好文 时间:
2017-10-09 16:49:05
阅读次数:
181
利用pdfbox和poi抽取pdf、doc以及docx文档的内容 ...
分类:
其他好文 时间:
2017-10-05 15:37:52
阅读次数:
225
卷 p2soft 的文件夹 PATH 列表 卷序列号为 9AD0-D3C8 D:. │ Aittit pato 面对拒绝 的回应.docx │ Atitit 中国明星数量统计 attilax.docx │ atitit bankcard r7 attilax sumup debit v4 r01.x ...
分类:
其他好文 时间:
2017-10-02 13:05:50
阅读次数:
490
Atitit 最近资料文章列表r9 r8 月份 attilax总结 atitit tag标签标示规范 attilax总结 v2 r922.docx 2017-09-28 02:04 阅读(27) 评论(0) 编辑 删除 atitit tag标签概念与原理 attilax总结 v2 r922.docx ...
分类:
其他好文 时间:
2017-10-02 09:35:31
阅读次数:
170
快速入门 入门python-docx很容易。让我们来看一下基础知识。 官方文档地址请点击 打开文档 你需要的第一件事是工作的文档。最简单的方法是: 1 2 3 from docx import Document document = Document() 1 2 3 from docx import ...
分类:
编程语言 时间:
2017-09-30 11:37:56
阅读次数:
1033
一. 使用win32读取word内容 二.使用模块docx读取word内容 ...
分类:
其他好文 时间:
2017-09-23 18:53:20
阅读次数:
218
IIS下不能下载文件的docx文档,XLSX文档的设置方法 Office 2007的的界面风格默认格式中都是。DOCX,XLSX,PPTX等等后缀,连结中包含此类文件时,界面风格默认什么打不开的其实只要在IIS中的MIME的类型中添加对此格式的支持就可以了下面提供两种方法扩展功能,推荐使用第二种。 ...
分类:
其他好文 时间:
2017-09-19 16:49:04
阅读次数:
253
字节流和字符流 对于文件必然有读和写的操作,读和写就对应了输入和输出流,流又分成字节和字符流。 1.从对文件的操作来讲,有读和写的操作——也就是输入和输出。 2.从流的流向来讲,有输入和输出之分。 3.从流的内容来讲,有字节和字符之分。 这篇文章先后讲解IO流中的字节流和字符流的输入和输出操作。 一 ...
分类:
编程语言 时间:
2017-09-14 18:52:33
阅读次数:
214
使用字节流操作汉字或特殊的符号语言的时候,容易乱码,建议使用字符流. 先有字节流,后有字符流,字符流是对字节流的补充. 使用记事本打开某个文件,可以看到内容的就是文本文件,否则可以理解二进制. 一般的,操作二进制文件(图片,音频,视频等)必须使用字节流. 一般的,操作文本文件使用字符流. 如果不清楚 ...
分类:
编程语言 时间:
2017-09-02 16:49:14
阅读次数:
208
在使用element-ui的upload上传组件的时候,有时候会遇到 控制上传文件类型 的需求,只需要配置accept属性为允许的类型即可,比如: 即: 添加 accept=".doc,.txt,.pdf,.xls,.docx,.xlsx 属性,意思是上传文件的类型只能是 .doc, .txt, . ...
分类:
其他好文 时间:
2017-08-24 20:20:43
阅读次数:
310