Joy RL:强化学习实践教程在线阅读
会员

Joy RL:强化学习实践教程

江季 王琦 杨毅远
开会员,本书免费读 >

计算机网络人工智能7.8万字

更新时间:2025-05-19 16:15:54 最新章节:第12章

立即阅读
加书架
下载
听书

书籍简介

本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

最新上架

  • 会员
    《秒懂AI写作:让你轻松成为写作高手》针对职场、学习、生活、艺术创作领域常见的40余种写作应用场景,遵循“场景+方法+总结”的框架,详细介绍了如何正确利用AI完成多种写作任务,并归纳出使用AI写作的方法和技巧。《秒懂AI写作:让你轻松成为写作高手》分为6章。第1章通过5个步骤、6大场景介绍了如何驾驭AI完成多种类型的写作任务;第2章至第6章分别详细介绍了在职场应用文写作、商业营销文案写作、新媒体写
    秋叶 刘进新 贾凝墨 万静计算机8.1万字
  • 会员
    本书通过81个官方案例解析、120个知识点梳理,深入浅出介绍了Sora的技术原理、特色功能、创新之处、优势特点、文案工具、脚本创作、提示词技巧、绘画工具、创意应用、变现方式等,帮助读者一本书全面精通Sora的AI视频生成技术。10大专题内容、108分钟视频,手机扫码可看精华内容,同时赠送了9大超值资源:74组AI绘画提示词、104个效果文件、165页PPT课件、31集《AI摄影》教学视频、40集《
    智发编著计算机6.8万字
  • 2022年末,ChatGPT在全球的风靡,让大模型随之出圈。大模型带来的机遇是人类突破能力边界最大的一次飞跃。未来基于人工智能或将实现“想象即现实,所想即所得”,这将是一次巨大的飞跃。中国、美国以及欧洲各国纷纷出台相关政策,将推动人工智能发展、大模型迭代作为重要的创新引擎。了解、应用大模型,既是时代的要求,也是产业发展的必需。但是在实践中也发现,大家对大模型的了解并不深刻,甚至时常被技术名词“劝退
    沈抖计算机16.8万字
  • 会员
    本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型
    文亮 江维计算机12.2万字
  • 会员
    本书以“人工智能(ArtificialIntelligence,AI)+”为主题,探讨了AI如何赋能千行百业,促进各类先进生产要素向发展新质生产力集聚。本书共7章,主要介绍了新质生产力之问,AI之问,AI顾问实践:人类的“辅导员”,AI助手实践:人类的“副驾驶”,智能体实践:人类的“AI代理人”,用尺度定律推演未来,新质生产关系与AI伦理观等内容。本书基于国内多行业、多领域应用“AI+”已取得明
    田丰计算机13.7万字
  • 会员
    大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、
    腾讯游戏数据团队编著计算机15.6万字
  • 会员
    本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“Joy
    江季 王琦 杨毅远计算机7.8万字
  • 会员
    全书通过118个实用技巧讲解+118集教学视频演示+160多个素材回复文件+144页PPT教学课件,通过“提问生成+修改润色+热门模板+应用案例”4大专项内容,帮助小白快速成为AI文案高手!本书具体内容包括16种AI提问技巧、13种指令优化技巧、11种高效提问技巧、9种文案修改技巧、7种文案润色方法、11类营销文案指令模板、12类办公文案指令模板、13类自媒体文案指令模板、12类教育学术文案指令模
    AIGC文画学院编著计算机11.6万字
  • 会员
    这是一本面向初中级读者的Agent学习指南,作者既是资深的AI技术专家,又是经验丰富的项目导师,融合作者亲身实践、培训反馈与官方资源,为Agent使用者和开发者提供了快速上手的实用指导。本书从基础知识、操作和应用开发3个维度循序渐进地讲解Agent实战技巧,分为三篇:基础篇(1~2章):介绍Agent定义、发展历程、常用开源技术、主要组件等基础知识和开发环境的搭建过程。应用篇(3~6章):从通用型
    高强文计算机7.2万字