深度强化学习实践（原书第2版）最新章节全文无弹窗在线阅读-QQ阅读女生中文青春网

QQ阅读女生现言网

女生现言网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书的主题是强化学习（ReinforcementLearning，RL），它是机器学习（MachineLearning，ML）的一个分支，强调如何解决在复杂环境中选择最优动作时产生的通用且极具挑战的问题。学习过程仅由奖励值和从环境中获得的观察驱动。该模型非常通用，能应用于多个真实场景，从玩游戏到优化复杂制造过程都能涵盖。

品牌：机械工业出版社

译者：林然王薇

上架时间：2021-07-01 00:00:00

出版社：机械工业出版社

本书数字版权由机械工业出版社提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

(俄)马克西姆·拉潘

同类热门书

最新上架

会员
AI数字人原理与实现
本书是一部系统介绍AI数字人技术的专业著作，涵盖了数字人的定义、发展历程、关键技术及应用实践等内容，全书共分3部分。在技术基础部分，首先介绍了数字人的定义、发展历程、分类和应用场景，接着详细解析了数字人系统的架构设计、视觉算法和语音合成技术的原理，以及语义理解和知识表示技术如何提升数字人的智能和表现力。在应用实践部分，带领读者深入探索数字人的创作流程，从内容策划、角色建模到交互设计，每一步都进行了
方进计算机26.2万字
会员
洞察AIGC：智能创作的应用、机遇与挑战
《洞察AIGC：智能创作的应用、机遇与挑战》内容分为3篇：第1篇AIGC的蜕变讲述AIGC的发展历史及其背后的智能；第2篇AIGC的应用讲述AIGC在文学创作、日常办公、知识管理、科研出版、工业制造、健康医疗、金融服务、品牌营销领域的应用现状及常用工具；第3篇AIGC的机遇与挑战讲述AIGC的资本与技术前景，同时提出需要注意的风险。
李海俊计算机13.9万字
制造业大模型的构建与实践
本书分两篇，为读者提供基于制造业视角的大模型理论与应用指南。基础篇深入大模型理论层面，主要介绍大模型的基础知识、构建路径、价值对齐策略，同时涉及多模态与AIGC技术、提示词工程的相关知识。应用篇则聚焦于大模型的实践应用层面，主要讲解垂直制造领域微调、RAG等构建技术，AIAgent的原理与应用，以及大模型压缩与部署策略，并且通过具体案例来展示大模型在工业制造及设备运维等方面的应用，最后对大模型进行
郭秉义计算机18.3万字
会员
人工智能对北京市就业的影响与应对
人工智能作为数字经济及高精尖产业发展的原创性、引领性和代表性技术，在北京国际科技创新中心、全球数字经济标杆城市的建设中迎来了发展的“关键窗口期”和“政策红利期”，成为北京高质量发展的重要引擎和打造高质量就业“北京样板”的重大机遇。本书是一部经济学学术专著，书稿导向积极。本书采用多元数据来源，运用案例研究法、舆情分析与大数据分析法等多种研究方法，从产业与就业动态匹配视角，聚焦人工智能对北京市就业的影
何勤计算机25.6万字
空间计算：人工智能驱动的新商业革命
空间计算是一种不断发展的以三维世界为中心的计算形式和交互形式，是以计算机视觉为基础的高阶应用。其核心是使用AI、计算机视觉和扩展现实将虚拟体验融入物理世界，让用户摆脱屏幕的束缚，自然地与数字世界中的对象互动，就像与真实世界中的对象互动一样。随着生成式AI的爆发，空间计算平台将拥有更加丰富的内容，将在很大程度上改变我们的生活和工作，重新定义商业模式，并改变我们与技术和整个世界互动的方式，推动我们进入
(美)凯西·哈克尔伊雷娜·克罗宁计算机12.1万字
会员
机器学习（第2版）
机器学习是人工智能的重要技术基础，涉及的内容十分广泛。本书涵盖了机器学习和深度学习的基础知识，主要包括机器学习的概述、统计学基础、分类、聚类、神经网络、贝叶斯网络、支持向量机、文本分析、分布式机器学习算法等经典的机器学习基础知识，还包括卷积神经网络、循环神经网络、生成对抗网络、目标检测、自编码器等深度学习的内容。此外，本书还介绍了机器学习的热门应用领域推荐系统以及强化学习等主题。本书深入浅出、内容
赵卫东董亮编著计算机30.2万字
会员
AI自媒体写作超简单
本书结合作者10多年写作经验，基于AI应用ChatGPT、文心一言、智谱清言、讯飞星火、通义千问、Kimi等，详细介绍了使用AI写作的流程、方法和技巧，旨在帮助想要通过内容输出加速个人发展的读者，快速掌握AI自媒体写作的方法和技巧。本书分为11章，涵盖AI自媒体写作概述、AI提示词、AI起标题、AI做选题、AI角色化写作、AI套路化写作、AI仿写、AI模块化写作、AI改写、AI润色、AI智能体写作
安晓辉计算机9.2万字
会员
智能控制与强化学习：先进值迭代评判设计
在人工智能技术的大力驱动下，智能控制与强化学习发展迅猛，先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题，以实现稳定学习、演化学习和快速学习为目标，建立一套先进的值迭代评判学习控制理论与设计方法。首先，对先进值迭代框架下迭代策略的稳定性进行全面深入的分析，建立一系列适用于不同场景的稳定性判据，从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次
王鼎赵明明哈明鸣任进计算机8.7万字
会员
量子人工智能
量子计算与人工智能的交叉融合，促使量子人工智能的不断发展。本书旨在采用对深度学习爱好者友好的方式，构建量子人工智能应用。全书共13章，第1章和第2章系统介绍量子计算机发展脉络和量子计算编程的基础知识。第3~7章分别介绍不同的深度学习方法和在这些算法逻辑上构建量子启发算法的方式，用量子线路中的相位作为神经网络的可学习参数，重构为量子神经网络算子。这些算子可以在PyTorch环境中直接调用。第8章和第
金贤敏胡俊杰编著计算机7.6万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 webook.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015