本文提出了一种Deep Q-Network(DQN),借助端到端(end-to-end)的强化学习方法能够直接从高维的输入中,学习一种很优的策略(policy)。输入是游戏的实时图像(当前`状态S`),借助卷积神经网络捕捉局部特征的关联性,输出所有可能采取`动作A`的概率分布。 ...
分类:
其他好文 时间:
2020-04-18 17:16:22
阅读次数:
143
小程序中提供了两种录音的API,wx.startRecord和wx.getRecorderManager(),前一个现在微信团队已经不再维护,所以在这里写一下新的录音管理,比之前要强大 1.小程序录音管理介绍 wx.getRecorderManager() 基础库 1.6.0 开始支持,低版本需做兼 ...
分类:
微信 时间:
2020-04-16 20:56:14
阅读次数:
114
YARN 调度器 1、FIFO(先进先出调度器) 单队列,任务独占所有资源,先进先出; 优点:简单不需配置; 缺点:大集群中大小任务都会阻塞; 2、Capacity(容量调度器) 多队列(单队列FIFO),支持配额,弹性队列,延迟调度(等待别的队列容器释放而非抢占) 优点:相比FIFO更适用于集群 ...
分类:
其他好文 时间:
2020-04-16 13:05:12
阅读次数:
74
跨域:指的是浏览器不能执行其他网站的脚本。它是由浏览器的同源策略造成的,是浏览器对javascript施加的安全限制。 同源策略:同源策略/SOP(Same origin policy)是一种约定,它是浏览器最核心也最基本的安全功能,如果缺少了同源策略,浏览器很容易受到XSS、CSFR等攻击。所谓同 ...
分类:
Web程序 时间:
2020-04-12 20:21:44
阅读次数:
70
一 故障指南 1.1 常见问题排障 为了跟踪和发现在Kubernetes集群中运行的容器应用出现的问题,常用如下查错方法: 查看Kubernetes对象的当前运行时信息,特别是与对象关联的Event事件。这些事件记录了相关主题、发生时间、最近发生时间、发生次数及事件原因等,对排查故障非常有价值。此外 ...
分类:
Web程序 时间:
2020-04-12 14:02:55
阅读次数:
98
我们知道刷新组的目的是为了解决外键关系表刷新先后的问题,从这个目的出发,说明刷新组内物化视图刷新是串行的。 我通过触发器的方式,监控了一下这个现象。 同时也说明了刷新组内,物化视图的刷新并不能并行。 --创建物化视图日志 CREATE TABLE POLICY (ID INTEGER PRIMARY ...
分类:
其他好文 时间:
2020-04-10 00:39:13
阅读次数:
78
RK为了解决很多显示器显示图片溢出的问题,将scale默认设置为95%,只要将其值修改为100%就OK了modified patch : system/displayd/Config.h #define ENABLE_OTG_MANAGER 0 #ifdef DISPLAY_POLICY_BOX-# ...
分类:
其他好文 时间:
2020-04-07 13:04:27
阅读次数:
163
目标 通过 Python 的多线程、多进程等手段并发执行下载音频文件 MP3文本信息 只拿出几行作为例子显示,实际还有更多信息 并行任务 concurrent.futures.ThreadPoolExecutor 多线程 threading 多进程 multiprocessing ...
分类:
其他好文 时间:
2020-04-07 12:35:06
阅读次数:
93
Action Space(行为空间) 定义:在所在环境中所有有效的行为的集合叫行为空间。 一些环境是有离散的行为,对于agent来说是有限的行为,如Atari游戏、Alpha Go。 其他的环境是有连续的行为,如在真实世界的机器人的控制角度等。 Policy(策略) 定义:策略是一种被agent使用 ...
分类:
其他好文 时间:
2020-04-05 18:40:34
阅读次数:
98