第一份的爬虫爬取小说网 没解决的问题: 1. 爬取主页小说时,由于章节主页有最近章节,导致每一本小说的前面都有最新的十几章内容没法去除 2. 写入速度太慢,两本书大约10M,爬取了13分钟. 3. 代码冗余,暂时没有分函数爬取 ...
分类:
其他好文 时间:
2019-11-21 20:08:37
阅读次数:
66
首先:文章用到的解析库介绍 BeautifulSoup: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。 它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。 Beautiful So ...
分类:
编程语言 时间:
2019-11-16 23:42:24
阅读次数:
110
一、测试 英语的26 个字母的频率在一本小说中是如何分布的?某类型文章中常出现的单词是什么?某作家最常用的词汇是什么?《飘》 中最常用的短语是什么,等等 1、要求1: 输出某个英文文本文件中 26 字母出现的频率,由高到低排列,并显示字母出现的百分比,精确到小数点后面两位 (注:1、字母频率 = 这 ...
分类:
其他好文 时间:
2019-11-06 13:35:26
阅读次数:
97
'最喜欢通俗易懂地解释一个事情。', '<b>一、协方差:', '可以通俗的理解为:两个变量在变化过程中是同方向变化?还是反方向变化?同向或反向程度如何?', '你变大,同时我也变大,说明两个变量是同向变化的,这时协方差就是正的。', '你变大,同时我变小,说明两个变量是反向变化的,这时协方差就是负 ...
分类:
其他好文 时间:
2019-11-06 13:21:12
阅读次数:
96
1 import re 2 import requests 3 from bs4 import BeautifulSoup 4 5 url = 'http://www.biquge6.com/11_11147/' 6 r = requests.get(url) 7 b = BeautifulSoup ...
分类:
其他好文 时间:
2019-11-05 21:48:10
阅读次数:
115
IO_课堂测试 一,用户需求 英语的26 个字母的频率在一本小说中是如何分布的?某类型文章中常出现的单词是什么?某作家最常用的词汇是什么?《飘》 中最常用的短语是什么,等等。 (1)要求1: 输出某个英文文本文件中 26 字母出现的频率,由高到低排列,并显示字母出现的百分比,精确到小数点后面两位。 ...
分类:
其他好文 时间:
2019-11-04 19:55:38
阅读次数:
77
最近做了一个WIFI传书本地阅读功能,有所收获在这里记录下吧。 用户下载的书籍分为两种,一种是有章节格式的,比如 第一章,001章、等,这种可以用正则来直接分章节,还有绝大多数书籍是没有这种格式的,这种如果整本书来直接解析的话,对CPU要求比较大,可能会卡死闪退,所有手动分章节还是很有必要的,这种情 ...
分类:
移动开发 时间:
2019-11-01 16:31:17
阅读次数:
103
1 import requests 2 import bs4 3 4 #获取网页代码 5 def gethtml(url): 6 try: 7 response = requests.get(url) 8 response.raise_for_status() 9 response.encoding... ...
分类:
其他好文 时间:
2019-10-31 23:44:28
阅读次数:
212
场景 喜马拉雅电台: https://www.ximalaya.com/ 找到一步小说音频,这里以下面为例 https://www.ximalaya.com/youshengshu/16411402/ 博客:https://blog.csdn.net/badao_liumang_qizhi关注公众号 ...
分类:
编程语言 时间:
2019-10-28 00:50:42
阅读次数:
198
只有想不到,没有做不到,用python可以做哪一些有趣的事情呢?一起来看看吧!1.词云用Python读取极品家丁小说,分词后展示词云。2.分析了70多万场绝地求生的比赛数据,总结出独家吃鸡攻略分析了总共20多G、70多万场的绝地求生比赛数据,总结出各种地图哪里跳的人最多、近战最佳武器、狙击最佳武器等,程序员嘛,靠技术吃鸡也很重要。海岛地图中,跳机场跟学校是死得最快的。沙漠地图中,跳Pecado、S
分类:
编程语言 时间:
2019-10-26 22:35:41
阅读次数:
135