译自:Don't Interpret Linear Hidden Units, they do not exist! http://building-babylon.net/2016/10/19/dont-interpret-linear-hidden-units-they-dont-exist/  ...
                            
                            
                                分类:
其他好文   时间:
2016-10-21 19:56:55   
                                阅读次数:
179
                             
                         
                    
                        
                            
                            
                                (1)词向量模型(vector space model),它将文档中的词项映射到$n$维线性空间。 (2) 词项频率-逆文档频率(term frequncy-inverse document frequency)模型,简称TF-IDF。这种模型的本质是:文档中出现频繁(TF),但在整个文档集中出现相 ...
                            
                            
                                分类:
其他好文   时间:
2016-10-12 11:20:19   
                                阅读次数:
123
                             
                         
                    
                        
                            
                            
                                英文原文地址:https://districtdatalabs.silvrback.com/modern-methods-for-sentiment-analysis 转载文章地址:http://datartisan.com/article/detail/48.html 情感分析是一种常见的自然语言 ...
                            
                            
                                分类:
其他好文   时间:
2016-09-29 21:46:27   
                                阅读次数:
744
                             
                         
                    
                        
                            
                            
                                欢迎fork我的github:https://github.com/zhaoyu611/DeepLearningTutorialForChinese最近在学习Git,所以正好趁这个机会,把学习到的知识...
                            
                            
                                分类:
其他好文   时间:
2016-09-18 21:15:54   
                                阅读次数:
318
                             
                         
                    
                        
                            
                            
                                    一、Java语言的特点(养成经常查看Java在线帮助文档的习惯) (1)简单性:Java语言是在C和C++计算机语言的基础上进行简化和改进的一种新型计算机语言。它去掉了C和C++最难正确应用的指针和最难理解的多重继承技术等内容,通过垃圾回收机制简化了程序内存管理,统一了各种数据类型在不同操作系统平台 ...
                            
                            
                                分类:
编程语言   时间:
2016-09-04 15:59:45   
                                阅读次数:
233
                             
                         
                    
                        
                            
                            
                                前言相关内容链接: 第一节:Google Word2vec 学习手札 
昨天好不容易试用了一下Google自己提供的Word2Vector的源代码,花了好长时间训练数据,结果发现似乎Python并不能...
                            
                            
                                分类:
编程语言   时间:
2016-08-25 21:23:17   
                                阅读次数:
481
                             
                         
                    
                        
                            
                            
                                    本文简述了以下内容: 神经概率语言模型NPLM word2vec:CBOW / Skip-gram,直接以得到词表示为目标的模型(加速策略将在下篇文介绍) 神经概率语言模型NPLM 近年来,基于神经网络来得到词表示的模型备受青睐。这类模型所得到的词的向量表示是分布式表示distributed rep ...
                            
                            
                                分类:
其他好文   时间:
2016-08-24 17:22:36   
                                阅读次数:
272
                             
                         
                    
                        
                            
                            
                                使用gensim的word2vec训练了一个词向量。 语料是1G多的维基百科,感觉词向量的质量还不错,共享出来,希望对大家有用。 下载地址是http://pan.baidu.com/s/1pLGlJ7d 密码:hw47 包含训练代码、使用词向量代码、词向量文件(3个文件) 因为机器内存足够,也没有分 ...
                            
                            
                                分类:
其他好文   时间:
2016-08-19 13:00:40   
                                阅读次数:
365
                             
                         
                    
                        
                            
                            
                                1、收集预料 自己写个爬虫去收集网页上的数据。 使用别人提供好的数据http://www.sogou.com/labs/dl/ca.html 2、对预料进行去噪和分词 我们需要content其中的值,通过简单的命令把非content 的标签干掉 cat news_tensite_xml.dat |  ...
                            
                            
                                分类:
其他好文   时间:
2016-08-07 16:51:08   
                                阅读次数:
154
                             
                         
                    
                        
                            
                            
                                (Deep) Neural Networks (Deep Learning) , NLP and Text Mining 最近翻了一下关于Deep Learning 或者 普通的Neural Network在NLP以及Text Mining方面应用的文章,包括Word2Vec等,然后将key ide ...
                            
                            
                                分类:
Web程序   时间:
2016-08-06 15:54:23   
                                阅读次数:
432