【导语】:在深度强化学习第四篇中,讲了Policy Gradient的理论。通过最终推导得到的公式,本文用PyTorch简单实现以下,并且尽可能搞清楚torch.distribution的使用方法。代码参考了LeeDeepRl-Notes中的实现。 1. 复习 \[ \theta \leftarro ...
分类:
其他好文 时间:
2021-01-16 12:16:36
阅读次数:
0
原因: composer 升级到2.0,下载新的插件时发现tp6运行失败,经查发现是版本问题 # 解决方案:回到上一个版本 composer self-update -r ...
分类:
其他好文 时间:
2021-01-16 11:42:10
阅读次数:
0
树的构造 class TreeNode: def __init__(self,val,left=None,right=None): self.val=val self.left=left self.right=right t7 = TreeNode(7) t6 = TreeNode(6) t5 = ...
分类:
其他好文 时间:
2021-01-14 11:27:23
阅读次数:
0
Merge Sorted Array (E) 题目 Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note: The number of elements in ...
分类:
其他好文 时间:
2021-01-13 11:10:22
阅读次数:
0
需求: 1.需要往数据库插入批量数据,且数据需要随机,带有日期格式的数据。 2.查看目的接收表,存在唯一key,字段2是日期格式。其他数据可以一样。 首先需要写一个链接数据库的函数:import MySQLdb class MySql(): def __init__(self, db): self. ...
分类:
数据库 时间:
2021-01-13 10:54:27
阅读次数:
0
1609. 链表的中间结点 中文English 给定一个带有头结点 head 的非空单链表,返回链表的中间结点。 如果有两个中间结点,则返回第二个中间结点。 样例 样例 1: 输入:1->2->3->4->5->null 输出:3->4->5->null 样例 2: 输入:1->2->3->4->5 ...
分类:
其他好文 时间:
2021-01-13 10:37:47
阅读次数:
0
https://www.jianshu.com/p/ced2793bfde4?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation ...
分类:
其他好文 时间:
2021-01-12 11:23:38
阅读次数:
0
设计模式:工厂方法模式 定义 工厂方法模式(Factory Method Pattern)又称为工厂模式,又称工厂模式、多态工厂模式和虚拟构造器模式,它属于类创建型模式。在工厂方法模式中,工厂父类负责定义创建产品对象的公共接口,而工厂子类则负责生成具体的产品对象,这样做的目的是将产品类的实例化操作延 ...
分类:
其他好文 时间:
2021-01-12 11:19:33
阅读次数:
0
import os import base64 def base_data_product_image(self): """ odoo里批量创建产品,并上传图片 图片为binary类型字段 :param self: :return:# odoo里面附近存储格式三base64编码格式的 """ pat ...
分类:
Web程序 时间:
2021-01-12 10:56:05
阅读次数:
0
note creator version : 4.13.1 敲黑板,一定要先配置好 Qt creator的default build directory , 再创建项目,最后再编译 敲黑板,一定要先配置好 Qt creator的default build directory , 再创建项目,最后再编 ...
分类:
其他好文 时间:
2021-01-11 11:24:06
阅读次数:
0