深度强化学习实践(原书第2版)在线阅读
会员

深度强化学习实践(原书第2版)

(俄)马克西姆·拉潘
开会员,本书免费读 >

计算机网络人工智能29万字

更新时间:2021-08-18 17:40:31 最新章节:25.7 总结

立即阅读
加书架
下载
听书

书籍简介

本书的主题是强化学习(ReinforcementLearning,RL),它是机器学习(MachineLearning,ML)的一个分支,强调如何解决在复杂环境中选择最优动作时产生的通用且极具挑战的问题。学习过程仅由奖励值和从环境中获得的观察驱动。该模型非常通用,能应用于多个真实场景,从玩游戏到优化复杂制造过程都能涵盖。
品牌:机械工业出版社
译者:林然 王薇
上架时间:2021-07-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

(俄)马克西姆·拉潘
主页

同类热门书

最新上架

  • 会员
    本书是一部系统介绍AI数字人技术的专业著作,涵盖了数字人的定义、发展历程、关键技术及应用实践等内容,全书共分3部分。在技术基础部分,首先介绍了数字人的定义、发展历程、分类和应用场景,接着详细解析了数字人系统的架构设计、视觉算法和语音合成技术的原理,以及语义理解和知识表示技术如何提升数字人的智能和表现力。在应用实践部分,带领读者深入探索数字人的创作流程,从内容策划、角色建模到交互设计,每一步都进行了
    方进计算机26.2万字
  • 会员
    《洞察AIGC:智能创作的应用、机遇与挑战》内容分为3篇:第1篇AIGC的蜕变讲述AIGC的发展历史及其背后的智能;第2篇AIGC的应用讲述AIGC在文学创作、日常办公、知识管理、科研出版、工业制造、健康医疗、金融服务、品牌营销领域的应用现状及常用工具;第3篇AIGC的机遇与挑战讲述AIGC的资本与技术前景,同时提出需要注意的风险。
    李海俊计算机13.9万字
  • 本书分两篇,为读者提供基于制造业视角的大模型理论与应用指南。基础篇深入大模型理论层面,主要介绍大模型的基础知识、构建路径、价值对齐策略,同时涉及多模态与AIGC技术、提示词工程的相关知识。应用篇则聚焦于大模型的实践应用层面,主要讲解垂直制造领域微调、RAG等构建技术,AIAgent的原理与应用,以及大模型压缩与部署策略,并且通过具体案例来展示大模型在工业制造及设备运维等方面的应用,最后对大模型进行
    郭秉义计算机18.3万字
  • 会员
    人工智能作为数字经济及高精尖产业发展的原创性、引领性和代表性技术,在北京国际科技创新中心、全球数字经济标杆城市的建设中迎来了发展的“关键窗口期”和“政策红利期”,成为北京高质量发展的重要引擎和打造高质量就业“北京样板”的重大机遇。本书是一部经济学学术专著,书稿导向积极。本书采用多元数据来源,运用案例研究法、舆情分析与大数据分析法等多种研究方法,从产业与就业动态匹配视角,聚焦人工智能对北京市就业的影
    何勤计算机25.6万字
  • 空间计算是一种不断发展的以三维世界为中心的计算形式和交互形式,是以计算机视觉为基础的高阶应用。其核心是使用AI、计算机视觉和扩展现实将虚拟体验融入物理世界,让用户摆脱屏幕的束缚,自然地与数字世界中的对象互动,就像与真实世界中的对象互动一样。随着生成式AI的爆发,空间计算平台将拥有更加丰富的内容,将在很大程度上改变我们的生活和工作,重新定义商业模式,并改变我们与技术和整个世界互动的方式,推动我们进入
    (美)凯西·哈克尔 伊雷娜·克罗宁计算机12.1万字
  • 会员
    机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书涵盖了机器学习和深度学习的基础知识,主要包括机器学习的概述、统计学基础、分类、聚类、神经网络、贝叶斯网络、支持向量机、文本分析、分布式机器学习算法等经典的机器学习基础知识,还包括卷积神经网络、循环神经网络、生成对抗网络、目标检测、自编码器等深度学习的内容。此外,本书还介绍了机器学习的热门应用领域推荐系统以及强化学习等主题。本书深入浅出、内容
    赵卫东 董亮编著计算机30.2万字
  • 会员
    本书结合作者10多年写作经验,基于AI应用ChatGPT、文心一言、智谱清言、讯飞星火、通义千问、Kimi等,详细介绍了使用AI写作的流程、方法和技巧,旨在帮助想要通过内容输出加速个人发展的读者,快速掌握AI自媒体写作的方法和技巧。本书分为11章,涵盖AI自媒体写作概述、AI提示词、AI起标题、AI做选题、AI角色化写作、AI套路化写作、AI仿写、AI模块化写作、AI改写、AI润色、AI智能体写作
    安晓辉计算机9.2万字
  • 会员
    在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次
    王鼎 赵明明 哈明鸣 任进计算机8.7万字
  • 会员
    量子计算与人工智能的交叉融合,促使量子人工智能的不断发展。本书旨在采用对深度学习爱好者友好的方式,构建量子人工智能应用。全书共13章,第1章和第2章系统介绍量子计算机发展脉络和量子计算编程的基础知识。第3~7章分别介绍不同的深度学习方法和在这些算法逻辑上构建量子启发算法的方式,用量子线路中的相位作为神经网络的可学习参数,重构为量子神经网络算子。这些算子可以在PyTorch环境中直接调用。第8章和第
    金贤敏 胡俊杰编著计算机7.6万字