Action Space(行为空间) 定义:在所在环境中所有有效的行为的集合叫行为空间。 一些环境是有离散的行为,对于agent来说是有限的行为,如Atari游戏、Alpha Go。 其他的环境是有连续的行为,如在真实世界的机器人的控制角度等。 Policy(策略) 定义:策略是一种被agent使用 ...
分类:
其他好文 时间:
2020-04-05 18:40:34
阅读次数:
98
实验二中涉及到的是用fork()来创建进程,并通过这个实验对"ps -ef"和"ps -aux"进行了详细解释 ...
分类:
系统相关 时间:
2020-04-05 13:44:20
阅读次数:
122
1.Android.mk { LOCAL_PATH := $(call my-dir)include $(CLEAR_VARS)$(call import-add-path,$(LOCAL_PATH)/../../../cocos2d)$(call import-add-path,$(LOCAL_P ...
分类:
其他好文 时间:
2020-04-05 09:54:33
阅读次数:
89
题目分析 下载文件后首先使用checksec检查文件保护机制 文件名太长了,就更改了一下 发现是一个64位程序,使用ida查看伪代码 注意到一个特殊的函数名callsystem 确定思路,直接栈溢出 信息收集 确定偏移量 /bin/sh地址 方法1 方法2 编写脚本 本地测试 靶机测试 ...
分类:
其他好文 时间:
2020-04-03 20:13:16
阅读次数:
209
使用python检查SSL证书到期情况 代码示例: 结果示例: ...
分类:
编程语言 时间:
2020-04-03 16:43:16
阅读次数:
187
一.urllib2方法 二、requests方法 ...
分类:
其他好文 时间:
2020-04-03 11:52:14
阅读次数:
100
思考良久,一方面对技术的热爱令我难以割舍,另一方面迫于现实的压力令我难以对下一个十年负责,最终,在大学即将结束的最后时光,我选择考研,成功与失败,我已看淡,只想享受这个认真学习专业知识的过程,希望以后回首,大学不留遗憾。 感谢关注我的朋友们,希望我的博客能让看到的人少趟点坑。 ...
分类:
其他好文 时间:
2020-04-03 10:26:29
阅读次数:
59
狄克斯特拉算法用于在加权图中查找最短路径。 仅当权重为时算法才管用,如果图中包含负权边,请使用贝尔曼-福得算法。 # 有向无环图 graph = {} graph["start"] = {} graph["start"]["a"] = 6 graph["start"]["b"] = 2 graph[ ...
分类:
编程语言 时间:
2020-04-02 15:58:18
阅读次数:
78
一.Github项目地址:https://github.com/lyh27/exercise 团队成员:卢耀恒3118005065 莫政3118005067 二.需求 自然数:0, 1, 2, …。 真分数:1/2, 1/3, 2/3, 1/4, 1’1/2, …。 运算符:+, ?, ×, ÷。 ...
分类:
其他好文 时间:
2020-04-02 01:36:13
阅读次数:
81
Keil MDK 5.17 releasedThis update for Keil MDK-ARM extends language support to East European and Asian character sets. Added are also several new feat ...
分类:
其他好文 时间:
2020-04-02 01:30:50
阅读次数:
887