会员
MindSpore大语言模型实战
更新时间:2024-11-14 15:26:31 最新章节:9.7 参考文献
书籍简介
随着ChatGPT等大语言模型的迅速发展,大语言模型已经成为人工智能领域发展的快车道,不同领域涌现出各种强大的新模型。开发者想要独立构建、部署符合自身需求的大语言模型,需要理解大语言模型的实现框架和基本原理。本书梳理大语言模型的发展,首先介绍Transformer模型的基本原理、结构和模块及在NLP任务中的应用;然后介绍由只编码(Encoder-Only)到只解码(Decoder-Only)的技术路线发展过程中对应的BERT、GPT等大语言模型;接下来介绍大语言模型在部署、训练、调优过程中涉及的各种关键技术,如自动并行、预训练与微调、RLHF等,并提供相应的实践指导;最后以开源大语言模型BLOOM和LLaMA为样例,介绍其架构和实现过程,帮助读者理解并构建、部署自己的大语言模型。本书还提供了基于MindSpore框架的丰富样例代码。本书适合人工智能、智能科学与技术、计算机科学与技术、电子信息工程、自动化等专业的本科生和研究生阅读,同时也为从事大语言模型相关工作的软件开发工程师和科研人员提供翔实的参考资料。
品牌:人邮图书
上架时间:2024-10-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
陈雷编著
- 会员本书系统介绍深度学习的高阶技术,并基于MindSporeAI计算框架进行实践。全书共分10章,内容涵盖数据处理、网络构建、训练与推理性能优化、模型安全与隐私、模型可靠性、可解释AI、AI中的公平性问题、数据驱动AI建模、AI求解科学计算方程、AI加速科学方法等内容。为便于读者学习,书中还给出了基于MindSpore实现的关于深度学习高阶技术的示例代码。本书在深度学习的理论基础上结合MindSpor软件工程17.8万字
同类热门书
最新上架
- 会员人工智能作为数字经济及高精尖产业发展的原创性、引领性和代表性技术,在北京国际科技创新中心、全球数字经济标杆城市的建设中迎来了发展的“关键窗口期”和“政策红利期”,成为北京高质量发展的重要引擎和打造高质量就业“北京样板”的重大机遇。本书是一部经济学学术专著,书稿导向积极。本书采用多元数据来源,运用案例研究法、舆情分析与大数据分析法等多种研究方法,从产业与就业动态匹配视角,聚焦人工智能对北京市就业的影计算机25.6万字
- 会员Sora是一个文本生成视频工具,本书介绍了Sora在视频生成领域的巨大潜力。本书共9章,系统讲解人工智能的演进、Sora的应用实践、Sora深度解析、Sora的挑战与未来等。本书内容全面、图文并茂、经典易懂,适合想要学习Sora的初学者,以及想要学习文本生成文本、文本生成图片、文本生成视频等内容的人工智能爱好者、自媒体从业人员、短视频制作者、设计师、相关专业的企业和高校人员阅读。计算机3.2万字
- 会员这是一本系统梳理并深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法的著作,也是一本能手把手教你构建角色扮演、信息抽取、知识问答、AIAgent等各种强大的应用程序的著作。本书得到了零一万物、面壁智能、通义千问、百姓AI、澜舟科技等国内主流大模型团队的负责人的高度评价和鼎力推荐。具体地,通过本书你能了解或掌握以下知识:(1)大型语言模型的基础理论,包括常见的模型架构、领计算机11.2万字
- 会员本书以Python3.10.7为平台,以实际应用为背景,通过概念、公式、经典应用相结合的形式,深入浅出地介绍了Python图形图像处理经典实现。全书共10章,主要包括绪论、迈进Python、Python图形用户界面、数据可视化分析、图像视觉增强分析、图像视觉复原分析、图像视觉几何变换与校正分析、图像视觉分割技术分析、图像视觉描述与特征提取分析、车牌识别分析等内容。通过本书的学习,读者可领略到Py计算机12.3万字
- 会员大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建计算机12.8万字
- 会员本书以人工智能为核心,上篇讲述了人工智能理论知识及发展蓝图规划,目的是帮助读者认识人工智能,找到入局人工智能领域的途径和方法;中篇罗列了可以为人工智能赋能的前沿技术,包括NLP、机器学习、大数据、物联网、区块链等;下篇总结了人工智能对交通、农业、医疗、制造、教育、金融、文娱等行业的影响和作用,旨在让读者了解人工智能是如何在这些行业实现商业化落地的。本书从多个角度出发,描绘了一幅完整的人工智能发展蓝计算机15.8万字
- 会员本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的核心知识、原理和内在逻辑。经过基础篇的学习,想必你已经对深度学习的总体框架有了初步的了解和认识,掌握了深度神经网络从核心概念、常见问题到典型网络的基本知识。本书为核心篇,将带领读者实现从入门到进阶、从理论到实战的跨越。全书共7章,前三章包括复杂CNN、RNN和注意力机制网络,深入详解各类主流模型及其变体;第4章介绍这三类基计算机13.4万字