机器学习领域有个很重要的假设:独立同分布假设,就是假设训练数据和测试数据是满足相同分布的,这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。神经网络学习过程本质上是为了学习数据的分布,一旦训练数据与测试数据的分布不同,那么网络的泛化能力也大大降低;另一方面,一旦在mini-batch ...
分类:
其他好文 时间:
2020-07-10 11:32:44
阅读次数:
57
目录 定义网络 梯度反向传播 梯度更新 面试时的变相问法 参考资料 BPTT(back-propagation through time)算法是常用的训练RNN的方法,其实本质还是BP算法,只不过RNN处理时间序列数据,所以要基于时间反向传播,故叫随时间反向传播。 BPTT算法在吴恩达和李宏毅等教授 ...
分类:
其他好文 时间:
2020-07-09 22:05:20
阅读次数:
123
开源的文字识别,文字场景识别 最近公司有文字识别的需求,简单的研究了一下,想找开源的用,无奈开源的还是比较少(最后还是用了百度。。。),找了不少但都比较老,有位大神说的很清楚,文字识别能做好的肯定不会开源,基本上都是收费的,但是还是找到了一个比较好的开源项目在这里记录下 文字识别:cnocr git ...
分类:
其他好文 时间:
2020-07-09 12:28:26
阅读次数:
60
心得体会 1交叉验证:从训练的数据里随机抽取作为测试集 # 4-6朴素贝叶斯过滤垃圾邮件 #朴素贝叶斯交叉验证 def textParse(bigString): import re listOfTokens=re.split('\\W+',bigString) return [tok.lower( ...
分类:
其他好文 时间:
2020-07-09 11:59:40
阅读次数:
68
1.数据预处理 xgb 训练的数据是 DataFream 不能是List 读取数据 利用pandas 读取数据,这里读取的是excel数据 data = pd.read_excel(filename, sheet_name='tabelname') 分词处理 利用jieba分词搞定 seg1 = j ...
分类:
其他好文 时间:
2020-07-08 23:05:15
阅读次数:
64
定义:假设有很多组采样点,每组采样点都拟合一次模型,得到若干组模型。选定某个特征值(非训练集),根据训练出的多个模型会产生多个预测值。这些预测值的平均值和真实值之间的差值代表模型的偏差(bias);预测值的方差(variance)代表模型的方差。 用图表表示如下: ...
分类:
其他好文 时间:
2020-07-08 19:46:42
阅读次数:
55
阿里云容器服务团队结合多年 Kubernetes 产品与客户支持经验,对 Kube-scheduler 进行了大量优化和扩展,逐步使其在不同场景下依然能稳定、高效地调度各种类型的复杂工作负载。《进击的 Kubernetes 调度系统》系列文章将把我们的经验、技术思考和实现细节全面地展现给 Kubernetes 用户和开发者,期望帮助大家更好地了解 Kubernetes 调度系统的强大能力和未来发展方向。
分类:
Web程序 时间:
2020-07-08 18:19:00
阅读次数:
67
R = [obj for obj in recs[imagename] if obj['name'] == classname] KeyError:'1' 测试和训练前需要将cache中的pkl文件+VOCdevkit2007中annotations_cache的缓存删掉。删掉后可正常运行。 ...
分类:
其他好文 时间:
2020-07-08 13:34:10
阅读次数:
87
打靶场上来了4个枪手,开始打靶,PIAPIAPIA……一阵枪响,不一会儿,打靶成绩出来了。以下是4位抢手的打靶结果: 不难看出,第一位抢手打的又准,而且稳定性也好,把把命中红星。第二位枪手惨不忍睹,打的又偏,而且又毫无章法。第三位抢手准度一般,好在稳定性还不错,只要提升下准度,还是可以抢救一下。第四 ...
分类:
其他好文 时间:
2020-07-08 01:42:36
阅读次数:
73
2019 ICPC Asia Taipei-Hsinchu Regional ...
分类:
其他好文 时间:
2020-07-07 00:08:06
阅读次数:
89