码迷,mamicode.com
首页 > 编程语言 > 详细

英语学习自测神器——用python爬虫打造专属英文词汇量测试脚本!

时间:2019-01-09 12:13:51      阅读:290      评论:0      收藏:0      [点我收藏+]

标签:href   学习   技术   .com   实现   选择   类别   联系   资料   

英语是现在传播很广的一门语言,它是由26个字母组成,像小编这种小时候不喜欢学英语的人,一直都是看见英语就头大。后来发现这东西不学不行,还是咬着牙学了。大家应该都知道学习英语,最重要的是词汇量,所以今天我们就用python做一个小的爬虫,然后自己写一个脚本来实现这个功能吧!

技术分享图片

 

目标:打造一个英文词汇量测试脚本

url:

扇贝网

工具:

python3.6、pycharm、requests库

思路:

和网页一样,总共分三步:

技术分享图片

 

先来看看网页中数据,用F12开发者工具抓包就可以

为了更好的演示,这里网页缩小了。

技术分享图片

 

点击开始,在来看看出现了什么

技术分享图片

 

这里我们抓到了一个包,这个json数据中包含了所有的类别或者说是级别,一共十大类,我们点击”响应”验证下

技术分享图片

 

可以看到,显示内容在我们抓到的json数据中,但是0和1中的内容有的一样,有的不一样是什么鬼?不要急,我们先选择‘高考’,在抓下包看看

技术分享图片

 

选择高考后,网页直接给出了第二步,50个单词选择,注意,先看下抓到的json数据的真实地址

技术分享图片

 

还记得我们在第一步抓到的包吗?0里面就是这个真实地址最后的category的值,1里面是对应的显示在网页中的内容,好了,第二步的真实url也被我们找到规律了,那下来就是分析单词了,看看有什么规律,我们点开一个看看

技术分享图片

 

有几个值非常重要,也是我们的目标:

Content的值是显示的单词

Definition_choices是需要我们判断的多个词义,中间包含有正确的词义,每个词义中的rank值应该是该词义的标识

rank值是正确的词义,也由此判断上述多个词义中的正确词义

ok,到这里我们就可以开始写代码了,具体过程就不一一说明了,没有反爬,全部是json数据的读取和判断,先放上我的代码和运行效果

技术分享图片

 

文章到此就告一段落了,喜欢本文的小伙伴欢迎转发或点波关注喔!

如果大家在学习Python的路上,或者打算学习Python需要学习资料,可以加群571799375,群里学习资料免费赠送大家喔!

本文来自网络,如有侵权,请联系小编删除!

英语学习自测神器——用python爬虫打造专属英文词汇量测试脚本!

标签:href   学习   技术   .com   实现   选择   类别   联系   资料   

原文地址:https://www.cnblogs.com/jiajia101/p/10243457.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!