1、中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容? 讲点网络技术、路由交换领域的东西,或者介绍一下华为的产品设备。 2、中文分词 1.下载一中文长篇小说,并转换成UTF-8编码。 2.使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 3.**排除一些无意 ...
分类:
其他好文 时间:
2017-09-25 18:55:06
阅读次数:
214
1.中软国际华南区技术总监曾老师还会来上两次课。希望老师能够讲一下 现在的网络发展和现状,感觉计算机专业是最受欢迎的,但是凭借着每年不断毕业(增多)的人数,我们凭借着什么来跟好比如我们是网工专业,跟学软件班的同学去PK,去取得更好的就业岗位。并且一般现在看到比我们大一届的师兄师姐很多都是(大部分), ...
分类:
其他好文 时间:
2017-09-25 17:27:36
阅读次数:
171
中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 希望老师讲一下python技术在哪些地方、哪些项目部分有所应用,可以的话展示一下部分的实际项目。 中文分词 下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的 ...
分类:
其他好文 时间:
2017-09-25 16:40:44
阅读次数:
126
希望曾老师讲的内容没有什么意见,希望可以讲一下大数据的就业前景,就业的薪资待遇。 小说词频统计import jieba book = "F:\最强升级系统.txt" txt = open(book,"r",encoding='GBK').read() ex = {'神仙','系统','狂暴','玩家... ...
分类:
其他好文 时间:
2017-09-25 16:05:39
阅读次数:
154
1、中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) a、关于这门课的相关工作经历 b、自己对于这门课的看法 2、中文分词 a、之前的英文练习将要测试词频的文章放在一个TXT里, 然后引用 结果如下 b、测试jieba c、这次我选择的是对于小说雪山飞狐的 ...
分类:
其他好文 时间:
2017-09-25 14:38:49
阅读次数:
153
pip install jieba Users\duym\AppData\Local\Programs\Python\Python36>pip install wordcloud-1.3.2-cp36-cp36m-win_amd64.whl ...
分类:
其他好文 时间:
2017-09-25 13:26:32
阅读次数:
160
jieba是python下的一个检索库, 有人将这个库移植到了asp.net 平台下, 完全可以替代lucene.net以及盘古分词的搭配 之所以写这个, 其实是因为昨天面试时, 被问到网站的关键字检索你怎么做?我就是说了下sql模糊查询以及sql语句优化, 缓存。以前接触过关键字分词, 但是在.n ...
分类:
Web程序 时间:
2017-09-24 17:23:29
阅读次数:
164
爬虫推荐的工具:pyspider,BeautifulSouprequestsscrapymongodbrediskafka.repyV8:python执行js的插件phatomjs:一个无界面的,可脚本编程的WebKit浏览器引擎。它原生支持多种web 标准:DOM 操作,CSS选择器,JSON,C ...
分类:
其他好文 时间:
2017-09-08 16:26:09
阅读次数:
227
# -*- coding: utf-8 -*- import jieba import jieba.analyse import math def sentence_resemble(): ''' 计算两个句子的相似度: 1,将输入的两个句子分词 2,求分词后两句子的并集(去重) 3,计算两句子各自... ...
分类:
编程语言 时间:
2017-08-18 18:46:26
阅读次数:
534
接上一章,抓取京东评论区内容。 url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98vv399&productId=4560435&score=0&sortType=5&pag ...
分类:
编程语言 时间:
2017-08-07 01:20:09
阅读次数:
350