在协同过滤推荐算法总结中,我们讲到了用矩阵分解做协同过滤是广泛使用的方法,这里就对矩阵分解在协同过滤推荐算法中的应用做一个总结。(过年前最后一篇!祝大家新年快乐!明年的目标是写120篇机器学习,深度学习和NLP相关的文章)# 一、1.矩阵分解用于推荐算法要解决的问题 在推荐系统中,我们常常遇到的问题... ...
分类:
编程语言 时间:
2019-07-19 19:10:03
阅读次数:
138
上一节我们介绍了CRF的背景,本节开始进入CRF的正式的定义,简单来说条件随机场就是定义在隐马尔科夫过程的无向图模型,外加可观测符号X,这个X是整个可观测向量。而我们前面学习的HMM算法,默认可观测符号是独立的,但是根据我们的实际语言来说,独立性的假设太牵强,不符合我们的语言规则,因此在HMM的基础 ...
分类:
其他好文 时间:
2019-07-16 00:02:07
阅读次数:
537
cd /opt 657 ls 658 cd tengine 659 ls 660 vim conf 661 cd conf 662 ls 663 vim nginx.conf 664 top 665 clear 666 cd /opt 667 mkdir s18static 668 ls 669 c... ...
分类:
其他好文 时间:
2019-07-10 01:11:55
阅读次数:
127
1.停用词 stop words: 在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词。 停用词都是人工输入、或者由一个停用词表导入。 2.jieba是目前最好的 Python 中文分词组件,它主要有以下 3 种特性: 支持 3 种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析 ...
分类:
其他好文 时间:
2019-07-09 22:34:17
阅读次数:
160
+ 情感在自然语言中的表达方式 | 例句 | 解释 | | | | | I am very happy | 开心的情感 | | She is so :( | 表达悲伤的图标 | 输出: + 高阶情感分析 输出: ...
分类:
其他好文 时间:
2019-07-05 16:44:55
阅读次数:
674
1.jieba分词的安装 直接在cmd窗口当中pip install即可 2.jieba分词的介绍 jieba分词是目前比较好的中文分词组件之一,jieba分词支持三种模式的分词(精确模式、全模式、搜索引擎模式),并且支持自定义词典(这一点在特定的领域很重要,有时候需要根据领域的需要来添加特定的词典 ...
分类:
编程语言 时间:
2019-07-04 00:50:31
阅读次数:
168
1、不同类别文本量统计,类别不平衡差异 2、文本长度统计 3、文本处理,比如文本语料中简体与繁体共存,这会加大模型的学习难度。因此,他们对数据进行繁体转简体的处理。 同时,过滤掉了对分类没有任何作用的停用词,从而降低了噪声。 4、上文提到训练数据中,存在严重的样本不均衡问题,如果不对该问题做针对性的 ...
分类:
其他好文 时间:
2019-07-02 16:15:03
阅读次数:
135
1. 安装 CentOS通过yum安装subversion。 # yum install subversion subversion安装在/bin目录: # which svnserve #查看目录命令/usr/bin/svnserve 检查一下subversion是否安装成功。不要使用1.8版本 ...
分类:
其他好文 时间:
2019-06-30 15:53:07
阅读次数:
76
Data arrangement 1.Reference Webs http://nlp.csai.tsinghua.edu.cn/~tcc/ https://blog.csdn.net/a609640147/article/details/89562262 https://blog.csdn.ne ...
分类:
Web程序 时间:
2019-06-25 17:21:17
阅读次数:
207