第1章 欢迎来到 Python3 玩转机器学习1-1 什么是机器学习1-2 课程涵盖的内容和理念1-3 课程所使用的主要技术栈第2章 机器学习基础2-1 机器学习世界的数据2-2 机器学习的主要任务2-3 监督学习,非监督学习,半监督学习和增强学习2-4 批量学习,在线学习,参数学习和非参数学习2- ...
分类:
编程语言 时间:
2019-05-21 09:38:55
阅读次数:
263
DeltaGrad 对外展示DeltaGrad用神经网络替代传统数学、统计、机器学习模型,突破一般股票机器人的研发模式,通过增强学习的方式,让机器自主产生海量高质交易数据,构建深度学习神经网络,最终完成能够自博弈进化的智慧机器人。
分类:
其他好文 时间:
2019-04-19 20:05:09
阅读次数:
196
马尔可夫决策过程 现在我们开始讨论增强学习(RL,reinforcement learning)和自适应控制( adaptive control)。在监督式学习中,我们的算法总是尝试着在训练集合中使预测输出尽可能的模仿(mimic)实际标签y(或者潜在标签)。在这样的设置下,标签明确的给出了每个输入 ...
分类:
其他好文 时间:
2018-11-04 19:39:22
阅读次数:
139
最近一位外国友人在复现某个项目的代码时环境配置出了些问题,找我帮忙解决。说实话,游戏和增强学习这两方面我都不是很熟悉,但好在对 Ubuntu 还算熟悉,前前后后折腾了好久,终于让程序顺利运行了起来。不得不说,这些深度学习的环境配置起来真是让人心烦,各种库的版本层出不穷,一着不慎满盘皆输,但我们又能怎 ...
分类:
其他好文 时间:
2018-10-09 13:28:09
阅读次数:
167
NEAT算法是相对提出较早的算法,在2013年大名鼎鼎的DeepMind提出了一种深度增强学习的算法,该算法主要结合的CNN和Q-Learning两种算法,本质利用遗传算法创建神经网络 1、RL:增强学习 奖赏假设 : 任务的目标可以等价的表示为在某个奖赏函数上的累积最大化 马尔可夫性:当一个随机过 ...
分类:
编程语言 时间:
2018-09-30 18:16:12
阅读次数:
382
https://mp.weixin.qq.com/s/KRyr0y84k6vkezuuM408lw Google 近日宣布开源一个新的基于 Tensorflow 的框架 —— Dopamine,旨在为新手和资深 RL(强化学习)研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发, ...
分类:
其他好文 时间:
2018-09-01 12:22:22
阅读次数:
150
该文章转至: https://www.cnblogs.com/xlturing/p/5844555.html 马里奥AI实现方式探索 ——神经网络+增强学习 儿时我们都曾有过一个经典游戏的体验,就是马里奥(顶蘑菇^v^),这次里约奥运会闭幕式,日本作为2020年东京奥运会的东道主,安倍最后也已经典的 ...
分类:
其他好文 时间:
2018-07-30 15:34:33
阅读次数:
593
There are some problems: mismatch of model and reality; gradient explosion so, the dynamics can be quite messy, and backpropogating can be quite probl ...
分类:
其他好文 时间:
2018-05-23 20:26:52
阅读次数:
163