1 大纲概述 文本分类这个系列将会有十篇左右,包括基于word2vec预训练的文本分类,与及基于最新的预训练模型(ELMo,BERT等)的文本分类。总共有以下系列: word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention ...
                            
                            
                                分类:
其他好文   时间:
2019-01-02 12:54:39   
                                阅读次数:
406
                             
                    
                        
                            
                            
                                Spark2.x机器学习视频教程讲师:轩宇老师链接:https://pan.baidu.com/s/1TcFl6KDjxJS597TxYFSCOA密码:3t2z本课程讲解Spark在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学习系统的数据。内容涵盖推荐系统、回归、聚类、分类等经典机器学习算法及其实际应用,涵盖使用SparkMLPipelineAPI创建和调试机器学习流程,内容更加系统、
                            
                            
                                分类:
其他好文   时间:
2018-12-25 13:57:46   
                                阅读次数:
150
                             
                    
                        
                            
                            
                                    VocabularyProcessor:类似于keras里面的那个padding,将词映射到词向量词字典的id上 ...
                            
                            
                                分类:
其他好文   时间:
2018-12-23 12:49:37   
                                阅读次数:
131
                             
                    
                        
                            
                            
                                1、fasttext是facebook开源的一个词向量与文本分类工具,在学术上没有太多创新点,好处是模型简单,训练速度非常快。简单尝试可以发现,做出来的结果也不错,可以达到上线使用的标准。 2、简单说来,fastText做的事情,就是把文档中所有词通过lookup table变成向量(word2ve ...
                            
                            
                                分类:
其他好文   时间:
2018-12-14 15:00:32   
                                阅读次数:
507
                             
                    
                        
                            
                            
                                    simpleRNN 训练集为《爱丽丝梦境》英文版txt文档,目标:根据随机给出的10个字符,生成可能的后100个字符 词向量空间生产 模型训练与预测 python (base) C:\Users\杨景\Desktop\keras深度学习实战\DeepLearningwithKeras_Code\Ch ...
                            
                            
                                分类:
其他好文   时间:
2018-12-08 15:41:11   
                                阅读次数:
180
                             
                    
                        
                            
                            
                                1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
                            
                            
                                分类:
其他好文   时间:
2018-12-06 22:25:26   
                                阅读次数:
257
                             
                    
                        
                            
                            
                                    1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
                            
                            
                                分类:
其他好文   时间:
2018-12-06 22:18:18   
                                阅读次数:
177
                             
                    
                        
                            
                            
                                1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
                            
                            
                                分类:
其他好文   时间:
2018-12-06 21:23:36   
                                阅读次数:
247
                             
                    
                        
                            
                            
                                1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 ...
                            
                            
                                分类:
其他好文   时间:
2018-12-06 20:35:31   
                                阅读次数:
106
                             
                    
                        
                            
                            
                                朴素贝叶斯应用:垃圾邮件分类 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词 ...
                            
                            
                                分类:
其他好文   时间:
2018-12-06 11:05:10   
                                阅读次数:
253