中文科研领域命名实体知识图谱的构建与应用 版权信息
- ISBN:9787509587201
- 条形码:9787509587201 ; 978-7-5095-8720-1
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
中文科研领域命名实体知识图谱的构建与应用 本书特色
本书以互联网Web2.0为背景分析了科研领域命名实体知识图谱基于语义网技术的构建与应用。首先,梳理了国内外语义网的研究框架与重要应用技术的文献;其次分析中文命名实体在图书期刊、科研会议、专利管理和商业网络知识库等领域的应用现状、取得成果及其存在的问题;第三,针对上述问题,分析借用国外网络知识技术方法和应用,借鉴国外知识库联合协作的开发运营理念;第四,研究中文命名实体知识图谱的顶层框架,主要的实体类别和实体间的关系;第五在前面研究的基础上提出基于异质网络聚合的知识图谱构建方法和应用策略。
中文科研领域命名实体知识图谱的构建与应用 内容简介
本书以互联网Web2.0为背景分析了科研领域命名实体知识图谱基于语义网技术的构建与应用。首先,梳理了国内外语义网的研究框架与重要应用技术的文献;其次分析中文命名实体在图书期刊、科研会议、专利管理和商业网络知识库等领域的应用现状、取得成果及其存在的问题;第三,针对上述问题,分析借用国外网络知识技术方法和应用,借鉴国外知识库联合协作的开发运营理念;第四,研究中文命名实体知识图谱的顶层框架,主要的实体类别和实体间的关系;第五在前面研究的基础上提出基于异质网络聚合的知识图谱构建方法和应用策略。
中文科研领域命名实体知识图谱的构建与应用 目录
第1章 绪论
1.1 知识图谱与命名实体
1.1.1 知识图谱的概念
1.1.2 命名实体的知识图谱构建
1.1.3 国内外命名实体的知识图谱构建
1.2 中文网络知识库存在的问题与研究的意义
1.2.1 海量信息与“信息孤岛”的问题
1.2.2 本书的研究意义
1.3 关联数据语义化聚簇研究综述
1.3.1 虚拟国际规范档VIAF关联数据研究
1.3.2 Wikipedia及其系列项目知识库研究
1.3.3 语义化基础工具的研究
1.3.4 LDA主题模型
1.4 本书的研究内容和研究路线
第2章 基础理论
2.1 语义Web的构成
2.1.1 RDF与关系数据库
2.1.2 网络本体语言OWL与本体的构建与应用
2.1.3 语义推理应用
2.1.4 基于数学关系的本体定义和逻辑公式
2.2 规范数据和关联数据
2.2.1 规范数据的描述格式
2.2.2 规范数据的关联
2.2.3 跨语言的一体化关联数据Wikidata
2.3 语义聚簇
2.3.1 VIAF初期项目分析一连接德意志图书馆和美国国会
图书馆的规范文档
2.3.2 VIAF周期性关联实践的算法流程及歧义处理
2.3.3 VIAF独立网站服务开通的运营分析
2.3.4 VIAF与Wikidata的结合实践与发展趋势
2.4 基于主题模型的语义化
2.4.1 LDA输入
2.4.2 LDA的假设
2.4.3 LDA的图形表示与生成模型表示
2.4.4 LDA的参数估计
2.4.5 LDA的新样本推断
2.5 异构知识库的实体定义与识别
2.5.1 使用RDF模式定义知识库的实体、属性及实体问的关系
2.5.2 命名实体知识图谱的类层次定义与实例构建
2.5.3 中文命名实体的对齐
2.5.4 中文命名实体的识别困难
2.6 小结
第3章 基于个人属性表的中文个人名称规范记录聚簇
3.1 名称规范记录与规范控制
3.1.1 CNASS结果集记录未聚簇的问题分析
3.1.2 国内学者对名称记录聚簇的研究
3.1.3 VIAF匹配算法的参考
3.2 规范记录实体匹配分析
3.2.1 CNASS检索结果集总体特征
3.2.2 中文名称规范记录的各级表示方法
3.2.3 VIAF聚簇内详细内容和结构分析
3.2.4 不同中文规范数据库的特征比较
3.2.5 中文名称规范记录的匹配枪索点的构建
3.3 自动聚簇方法与实现
3.3.1 数据库表的构建
3.3.2 数据预处理
3.3.3 名称实体匹配和聚簇算法
3.3.4 聚簇结果分析
3.3.5 聚簇结果与VIAF匹配聚簇验证
3.4 小结
第4章 基于作品关系扩展的中文个人名称规范记录聚簇
4.1 名称规范记录的FRBR语义化表示
4.2 中文个人名称规范记录聚簇的E—R分析
4.2.1 中文个人名称规范记录的实体分析
4.2.2 中文个人名称规范记录的实体关系分析
4.3 基于作品关系扩展的中文个人名称规范记录聚簇算法
4.3.1 基于外部关联记录的作品关系属性扩展
4.3.2 基于作品关系扩展的中文个人名称记录识别与聚簇算法
4.4 中文个人名称规范记录聚簇实验
4.4.1 实验聚簇结果的评价指标和描述统计分析
4.4.2 聚簇的综合效果分析
4.4.3 聚簇实验结果分析
4.5 利用虚拟国际规范档的Ccs记录进行关联扩展
4.5.1 CCS规范记录号能否重定向到VIAF聚簇
4.5.2 VIAF聚簇中的ccs记录的特征研究
4.6 小结
第5章 基于WiKidata的个人职业本体构建
5.1 中文名称规范检索系统结果集附加信息识别问题
5.2 wikidata个人名称数据的职业表示方法
5.3 基于准马尔可夫过程的职业层次关系分析
5.3.1 职业条目数据的获取
5.3.2 职业上位关系的矩阵表示与特征研究
5.3.3 职业上位关系矩阵的准马尔可夫转化
5.3.4 结果分析
5.4 中文个人职业本体的推导
5.5 小结与展望
第6章 基于主题模型识别的个人名称规范记录聚簇
6.1 基于主题模型的记录语义结构化问题
6.2 中文个人名称规范记录的主题模型构建
6.2.1 中文个人名称规范记录的主题特征分析
6.2.2 主题框架构建
6.2.3 主题词抽取方法
6.2.4 基于主题词方法的案例
6.3 实验和结果分析
6.4 小结
第7章 机构实体知识库构建研究
7.1 基于名称的机构识别方法
7.1.1 名称文本近似度识别
7.1.2 曾用名表简称表识别
7.1.3 分段识别
7.1.4 总体分支语义关联识别
7.2 参考知识库的机构
7.2.1 中文名称规范数据库的机构查询分析
7.2.2 虚拟国际规范档的机构
7.2.3 百度百科的机构分析
7.2.4 维基数据的机构
7.3 机构实体的分析与构建
7.3.1 机构的概念
7.3.2 机构的分类及类层次关系
7.3.3 机构实例库的初步构建
7.3.4 机构库实体结点构建
7.3.5 机构库实例结点与外部知识库的实例等同关系构建
7.4 命名实体知识图谱概念层次定义和实例构建
7.5 小结
第8章 研究结论、局限与展望
8.1 研究结论
8.2 研究局限与展望
附录A 个人名称检索语料
附录B 示例:Amarc3—005.XML文件内容
附录C 初步收集科研实体机构一总体机构名称表
附录D 本书术语的中英文对应表
参考文献
后记
展开全部
中文科研领域命名实体知识图谱的构建与应用 作者简介
王瑞云,主要研究特长:语义网知识管理与信息经济。山西省太原市坞城路92号山西大学经济与管理学院。讲师。