1. wordvec的概念 2. 语言模型训练的两种模型CBOW+skip gram 3. word2vec 优化的两种方法:层次softmax+负采样 4. gensim word2vec默认用的模型和方法 ...
分类:
其他好文 时间:
2019-07-14 19:33:18
阅读次数:
787
近日,Reddit上的一篇帖子引起了网友的热议。帖子作者「mlvpj」称:「我们使用深度学习完成了一个简单的项目,可以自动进行Python代码补全。」根据介绍,该项目基于LSTM模型,训练后,负责对代码的缺失部分进行补全。评价模型的方法是判断节省了多少的按键信息——即模型给出长度为L的代码建议,如果和真实的代码匹配,则节省L-1个键入操作。实验结果说明,大约可以节省30%-50%的**时间键入成本
分类:
编程语言 时间:
2019-07-14 09:40:46
阅读次数:
116
过拟合与欠拟合及其解决方法 我们在进行模型训练的时候会出现模型不能够很好地拟合数据的情况,这个时候就需要我们来判断究竟现在的模型是欠拟合还是过拟合。 1. 欠拟合 首先欠拟合就是模型没有很好地捕捉到数据特征,不能够很好地拟合数据 training error cross validation err ...
分类:
其他好文 时间:
2019-07-04 22:42:00
阅读次数:
136
1.简介 TensorFlow可以很容易地利用单个GPU加速深度学习模型的训练过程,但要利用更多的GPU或者机器,需要了解如何并行化训练深度学习模型。常用的并行化深度学习模型训练方式有两种,同步模式和异步模式。 2.两种模式的区别 为帮助读者理解这两种训练模式,首先简单回顾一下如何训练深度学习模型。 ...
分类:
其他好文 时间:
2019-06-30 23:15:38
阅读次数:
236
<!--?xml version="1.0" encoding="UTF-8"?--> Keras中有一个层是Flatten层,这个层可以把二维的图片转换成一维的数据,因此不需要单独做处理,而是在做完各种数据预处理后,用这个平层,把二维的数据处理成一维。 Keras模型中有对数据进行分类,首先不是一 ...
分类:
其他好文 时间:
2019-06-29 15:02:24
阅读次数:
91
现在要针对我们需求引入检测模型,只检测人物,然后是图像能侧立,这样人物在里面占比更多,也更清晰,也不需要检测人占比小的情况,如下是针对这个需求,用的yolov3-tiny模型训练后的效果。 Yolov3模型网上也讲烂了,但是总感觉不看代码,不清楚具体实现看讲解总是不清晰,在这分析下darknet的实 ...
分类:
其他好文 时间:
2019-06-27 19:23:02
阅读次数:
140
在模型训练结束,结束后,通常是一个分割模型,输入 1024x1024 输出 4x1024x1024。 一种方法就是将整个图切块,然后每张预测,但是有个不好处就是可能在边界处断续。 由于这种切块再预测很ugly,所以直接遍历整个图预测,防止边界断续,还有一个问题就是防止图过大不能超过20M。 很有意思 ...
分类:
其他好文 时间:
2019-06-25 16:48:20
阅读次数:
134
数据集为玻森命名实体数据。 目前代码流程跑通了,后续再进行优化。 项目地址:https://github.com/cyandn/practice/tree/master/NER 步骤: 数据预处理: 加载数据: 构建模型: 训练: 预测: 参考: https://zhuanlan.zhihu.com ...
分类:
其他好文 时间:
2019-06-24 09:15:34
阅读次数:
126
推荐算法在互联网行业的应用非常广泛,今日头条、美团点评等都有个性化推荐,推荐算法抽象来讲,是一种对于内容满意度的拟合函数,涉及到用户特征和内容特征,作为模型训练所需维度的两大来源,而点击率,页面停留时间,评论或下单等都可以作为一个量化的 Y 值,这样就可以进行特征工程,构建出一个数据集,然后选择一个... ...
分类:
编程语言 时间:
2019-06-23 19:09:30
阅读次数:
254
简要介绍Active Learning(主动学习)思想框架,以及从IF(isolation forest)衍生出来的算法:FBIF(Feedback-Guided Anomaly Discovery) ...
分类:
数据库 时间:
2019-05-30 17:59:52
阅读次数:
140