Lesson1 强化学习初印象学习笔记

首页版块访问AI主站注册发帖

Lesson1 强化学习初印象学习笔记

发布于2020-06 浏览:4298 回复:2

快速回复

1.智能
智能一部分来自遗传，另一部分来自后天的学习，后天的学习包括模仿和对环境的探索。

2.人工智能
人工智能最主要的是赋予物体自我学习意识，通过模仿和对已知环境的理解和认识来探索和应对未知的环境及事物。
人工智能对未知的事物进行多次的探索与试错可以自己总结出一条最佳的解决方案，然后进行强化学习，对以后遇到类似的情况进行更快速和高效的处理。

3.强化学习
1）核心思想：智能体在环境中学习，根据环境的状态，执行动作，并根据环境的反馈来指导更好的动作。
2）强化学习主要是试错和探索，强化学习在探索与利用中来实现预测和控制。
3）强化学习的两种方案：基于价值和基于策略。
4）分类：根据环境是否已知、按照学习目标和按照学习方式。

4.总结
RL的基本概念：智能体和环境、状态、动作和反馈信息；
RL应用：游戏、机器人、交通等；
RL与监督学习的主要区别：一个是同分布数据，一个是序列决策数据
RL如何解决问题：探索与利用

5.感想
人工智能最主要的实现自我学习，通过已知的事物学习解决未知的事物，对未知的事物可以进行智能的探索和学习，可以通过自己学习解决相似的问题能力。
通过第一课的学习让我重新认识了人工智能与强化学习的关系，知道了强化学习就是在不断的探索和利用来解决未知的事物，实现人工智能。

其他

个赞

共2条回复最后由用户已被禁言回复于2022-04

#3用户已被禁言回复于2021-05

上海
http://xasgkfp.diytrade.com/
https://xasgkfp.diytrade.com/
http://cdfapiao.simplesite.com/
http://xakfp.simplesite.com/

#2wangwei8638回复于2021-01

不错

快速回复

小编推荐

小帅丶干货之图像识别在微信小程序展示

用户已被禁言 62回复

用php开发的在线OCR文字识别工具

交换机高手 15回复

C# SDK-CLI快速部署框架

goJhou 33回复

个人学习总结瞎扯蛋类博客成功建站完成

goJhou 47回复

[人脸检测] 基于C# WPF的开发尝试

goJhou 24回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服