自顶向下构建中药知识图谱初探
自顶向下构建中药知识图谱初探 关键词:中药知识图谱;自然语言处理;可视化 当前,知识图谱已在金融、电商和医疗等领域开展了诸多实践性探索,并被广泛的应用在了智能问答、知识搜索、个性化推荐和辅助诊断等知识型驱动的任务中。本文从中药和知识图谱研究视角出发,对所收集中药相关数据进行预处理与实体关系抽取,自顶向下构建中药知识图谱。同时利用neo4j对部分数据进行了可视化分析。 1、知识图谱简介知识图谱最初是谷歌知识搜索功能的产品名称,现在是各类结构化知识库的统称,也是一种用图模型描述知识关联关系的技术方法。知识图谱由节点和关系组成,一般用三元组表示不同概念间的复杂关系。图1所示为“中药术语”知识图谱的部分节点关系。 图1“中药术语”知识图谱示例 知识图谱构建主要包括自顶向下和自底向上两种方式。自顶向下构建是指在较高质量数据集中提取三元组信息并加入知识库中;而自底向上构建是指利用相关技术从一般数据集中提取可信度较高的三元组经人工审核后将其加入知识库中。知识图谱的构建过程如图2所示,包括数据获取、知识抽取、知识融合和知识加工等几方面,详细内容可参考文献[4]。 图2知识图谱构建技术架构 2、定义中药知识图谱实体和关系知识图谱的核心是“实体-关系-实体”三元组,为此,本文首先简要介绍一些相关的中药术语,定义需要构建中药知识图谱的主要概念,为后续中药知识图谱的构建做铺垫。 中药是以中国传统医药理论为指导,用于预防和治疗疾病的物质。中药学术语主要包括一般概念、中药采集、中药贮藏、中药鉴定、中药炮制、中药性能、中药功效、中药配伍、中药禁忌、和中药用法等10大类,每类又包含相关的多个子类层级,本文提供5级包含关系+节点的术语图谱,其可视化效果如图3所示。 图3“中药术语”知识图谱 该图谱svg格式获取 |
转载请注明地址:http://www.hongyaozia.com/hyzyl/10460.html
- 上一篇文章: 治疗肝癌的常用中医偏方秘方大全
- 下一篇文章: 没有了