1.选一个自己感兴趣的主题或网站。(所有同学不能雷同) 我选了附近松田学校的校园网来爬取 2.用python 编写爬虫程序,从网络上爬取相关主题的数据。 # -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup as ...
分类:
其他好文 时间:
2018-04-24 21:51:36
阅读次数:
202
1.选一个自己感兴趣的主题或网站。(所有同学不能雷同) 源地址:http://www.18ladys.com/ 2.用python 编写爬虫程序,从网络上爬取相关主题的数据。 3.对爬了的数据进行文本分析,生成词云。 图3-1 爬虫小程序的词云 4.对文本分析结果进行解释说明。 因为爬取的是各个中药 ...
分类:
编程语言 时间:
2018-04-24 20:22:36
阅读次数:
635
利用2018年政府工作报告的例子向大家展示一下R语言如何进行文本挖掘的~用到的包有jiebaR和wordcloud2。 1、安装并加载jiebaR 2、以2018年政府工作报告为文本,进行分词 (1)首先要将2018年政府工作报告以txt的形式下载到R语言的工作路径中 读取文本: (2)分词处理: ...
分类:
编程语言 时间:
2018-04-22 12:48:11
阅读次数:
900
layout: post title: 七牛云图床存储+Alfread工作流+使用QSHELL 七牛云图床存储+Alfread工作流+使用QSHELL 使用markdown最头疼的问题就是贴图问题。有多种方式来上传图片到图床,并获得外链的方面。而我们所希望最便捷以及最自然的方式就是,截取图片,然后粘 ...
分类:
系统相关 时间:
2018-04-21 16:16:05
阅读次数:
286
Wordcloud各参数含义 Python(wordcloud+jieba)生成中文词云图 ...
分类:
其他好文 时间:
2018-04-14 21:01:59
阅读次数:
191
后台用户上传的图片往往很大,并且现在iphone手机的图片质量大的都高达几M,而在移动端展示时,即便做了懒加载,如vue-lazyLoad,也会很影响性能。移动端的图片一般控制在100K以内,否则3g网络加载太慢,会出现白屏现象。目前遇到的场景,图片都存放在阿里云的cdn上,从而可以采用阿里云的图片 ...
分类:
其他好文 时间:
2018-04-01 20:54:15
阅读次数:
552
深度图转点云的计算方法不复杂,是根据内外参矩阵变换公式得到的。 一个相机的三维点[x,y,z]和它在图像中的像素坐标[u,v,d],存在着一个固定的对应关系(对于小孔成像的相机原理的相机) 上述的公式是从世界坐标得到图像中像素坐标,同理也可从从图像的像素坐标转换到世界坐标下。 根据这个公式可以对点云 ...
分类:
其他好文 时间:
2018-03-24 22:30:46
阅读次数:
4841
异常的主要信息是说无法创建ossClient对象 下面debug显示出具体的原因是因为找不到org.apache.http.ssl.TrustStrategy org.apache.http.ssl.TrustStrategy其实是httpClient jar包中的,原因是因为httpClient ...
分类:
Web程序 时间:
2018-03-20 18:08:28
阅读次数:
1309
教材学习内容总结 本周教材的内容为基础的JAVA引入,对于理论知识的理解上没有太大的问题,但是当自己实践的时候,却出现了各种各样的问题 教材学习中的问题和解决过程 问题1:对于代码的敏感度不高归根结底是对于记背的内容记忆不深 问题1解决方案:多用多练,练熟了便能记下来了 问题2:薄弱的英语基础。。。 ...
分类:
编程语言 时间:
2018-03-13 15:45:30
阅读次数:
226