自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

白水的博客

欢迎你的光临,随便看看就好

  • 博客(3)
  • 资源 (6)
  • 论坛 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 强化学习——马尔科夫决策过程 MDP

文章目录1. 马尔科夫过程 Markov Process,MP1.1. 马尔科夫性质 Markov Property1.2. 马尔科夫链 Markov Chain2. 马尔科夫反馈过程 Markov Reward Process,MRP3. 马尔科夫决策过程 Markov Decision Process,MDP马尔可夫决策过程是强化学习里面的一个基本框架,在马尔可夫决策过程的定义中,Agent所处的环境是 Fully Observable ,就是全部可以观测的。但是很多时候环境里面有些量是不可观测的,这

2020-11-29 12:22:46 2807 2

原创 强化学习——强化学习概述

本篇博客是对强化学习的基本概念进行解释,无深入的算法推导文章目录1.强化学习 Reinforcement Learning1.1. 强化学习的目的1.2. 强化学习的过程1.3. 强化学习的特点2. 序列决策过程 Sequential Decision Making2.1. 智能体(Agent)与动作空间(Action Spaces)2.1.1. 智能体 Agent2.1.1.1. 策略函数2.1.1.2. 价值函数2.1.1.3. 模型2.1.1.4. 智能体的分类2.1.2. 动作空间 Actio.

2020-11-20 20:12:55 662 1

原创 英文文献调研方法综述

文章目录1. 进行英文文献调研的理由2. 文献调研的纲要2.1. 文献调研的目的2.2. 文献调研的原则2.3. 文献调研的步骤3. 常用的论文搜索平台及数据库3.1. Text Analyzer - JSTOR3.2. Web of Science3.3. Google Scholar3.4. CORE & DOAJ3.5. ProQuest3.6. Google Images & ScienceDirect Images4. 常用的数据搜索平台及数据库4.1. Research Data

2020-11-09 20:50:06 5017 13

软考系统架构设计师历年真题及答案、题型归类

软件资格考试2009-2018年的真题及答案,以及综合知识题型归类,案例分析与论文部分必备知识点等,需要的小伙伴自行下载

2020-11-16

AgentTable.csv

内含9000余条国外浏览器user-agent信息,csv文件,可直接导入数据库

2019-07-29

软考初级程序员历年真题

2009年-2017年计算机技术与软件专业技术资格(水平)考试初级程序员真题

2018-06-20

进制转换工具

转换二进制、八进制、十进制和十六进制数,只需要输入数字后按回车即可(或者移开光标)

2018-03-10

DirectX修复工具V3.3

DirectX修复工具(DirectX Repair)是一款系统级工具软件,下载后无需安装,可直接运行。

2018-03-06

微信小游戏跳一跳辅助脚本Python源码

来自GitHub:wangshub/wechat_jump_game 开发的微信小游戏Python脚本

2018-01-01

白水你一定要努力啊的留言板

发表于 2020-01-02 最后回复 2020-01-02

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除