超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

不再提示
关闭
图书盲袋,以书为“药”
欢迎光临中图网 请 | 注册
> >
理解大语言模型:学习其基本思想和技术

理解大语言模型:学习其基本思想和技术

出版社:西安交通大学出版社出版时间:2024-08-01
开本: 32开 页数: 180
中 图 价:¥58.5(7.8折) 定价  ¥75.0 登录后可看到会员价
加入购物车 收藏
运费6元,满39元免运费
?新疆、西藏除外
本类五星书更多>

理解大语言模型:学习其基本思想和技术 版权信息

  • ISBN:9787569338812
  • 条形码:9787569338812 ; 978-7-5693-3881-2
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>

理解大语言模型:学习其基本思想和技术 内容简介

随着人工智能技术飞速发展,近两年出现了以chatGPT为代表的智能化程度极高的处理工具,支撑它们的关键技术就是大语言模型(LLM)。大语言模型(LLM)是人工智能在自然语言处理领域的应用,也是人工智能的*新前沿,源于自然语言处理(NLP)和深度学习的研究发展。本书首先介绍了大语言模型的基本情况,讲述了自然语言处理的发展历史、基本概念和主要任务。以一种重要的大语言模型Transformer模型为例介绍了大建模语言的基础模型、应用方法、过拟合问题等。*后介绍了生成式预训练Transformer模型、Meta人工智能大语言模型等几种常用的大语言模型。

理解大语言模型:学习其基本思想和技术 目录

第1章 绪 论 1.1 人工智能简史 1.2 大语言模型所处的地位 1.3 小结 第2章 自然语言处理的前世今生 2.1 自然语言处理的历史 形式语法 转换语法与生成语法 句法解析 语境与语义 语言理解 知识工程 概率模型 隐马尔可夫模型 统计语言模型 *大熵模型 条件随机场 大型注释语料库 词义消歧 机器翻译 信息检索 统计方法 大型文本语料库的可用性 自然语言处理任务的监督学习 命名实体识别 情感分析 词嵌入简介 深度学习与神经网络 在现实世界的应用中部署 2.2 自然语言处理的任务 2.3 自然语言处理的基本概念 词元化 语料库与词库 词嵌入 2.4 语言建模 N元语言模型 神经语言模型 2.5 小结 第3章 Transformer模型 3.1 注意力机制 3.2 Transformer架构 编码器 解码器 缩放点积 多头注意力 3.3 小结 第4章 大语言模型大在哪? 4.1 如何使Transformer模型成为大语言模型 参数数量 数据规模 计算能力 微调和任务自适应 能力 为什么参数很重要 计算需求 过拟合的风险 模型大小 数据的规模 4.2 大语言模型的类型 基于架构的分类 基于训练目标的分类 基于使用的分类 4.3 基础模型 在广泛数据上进行预训练 微调和灵活性 迁移学习 规模经济 通用能力 微调功能 迁移学习 规模经济 快速部署 跨学科应用 减少训练开销 持续适应性 人工智能的民主化 4.4 应用大语言模型 提示工程 微调 4.5 小结 第5章 流行的大语言模型 5.1 生成式预训练Transformer模型 5.2 基于Transformer模型的双向编码器表示 5.3 Pathways语言模型 5.4 大语言模型Meta AI 5.5 小结 第6章 挑战、机遇和误区 6.1 大语言模型与超人工智能的挑战 人工智能的级别 超人工智能带来的人类存亡风险 大语言模型适用的场景 6.2 误解与滥用 6.3 机遇 6.4 小结
展开全部

理解大语言模型:学习其基本思想和技术 作者简介

[斯里兰卡]蒂姆拉·阿马拉通加是培生集团斯里兰卡公司的高级软件架构师,拥有超过15年的行业经验。他也是人工智能、机器学习、教育深度学习和计算机视觉领域的发明家、作家和研究员。蒂姆拉拥有斯里兰卡科伦坡大学计算机科学理学硕士学位和信息技术学士学位。他也是TOGAF认证的企业架构师。他为在线学习平台申请了三项专利(动态神经网络和语义学领域)。他出版了三本关于深度学习和计算机视觉的书。

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服