详细信息
基于深度学习的中风病症药知识图谱的构建与研究
文献类型:学位论文
中文题名:基于深度学习的中风病症药知识图谱的构建与研究
作者:陈月月[1];
第一作者:陈月月
机构:[1]甘肃中医药大学;
第一机构:甘肃中医药大学
导师:李燕;甘肃中医药大学
授予学位:硕士
语种:中文
中文关键词:中风病;知识图谱;深度学习;联合抽取;症药问答
年份:2023
摘要:随着我国医疗信息化的发展以及大数据等相关技术的普遍应用,开放共享医疗大数据,挖掘数据中的有用信息并实现数据的广泛应用对时代的发展有着重要的意义。医疗数据中蕴含着大量的疾病信息,从中抽取目标信息,挖掘信息间的潜在联系,可为分析、探索疾病的相关因素提供丰富的数据支撑。利用知识图谱技术结合医疗知识构建医学知识图谱,对医学信息中的知识关系进行建模,抽取医疗信息中的知识并存储,是解决和处理医学数据的一种优良方案。因此,本文基于深度学习和知识图谱技术构建中风病知识图谱,挖掘医案中的潜在信息,以期能为中风病的防治提供数据支撑。论文的主要研究内容如下:1.构建中风病医案数据集。通过收集中医智库中医药大数据分析平台中的中风病医案数据,并利用数据清洗等一系列的数据预处理工作进一步对收集到的医案进行处理。在对医案文本中的实体和关系类型进行分析和预定义的基础上,根据知识图谱的特点,本文共定义了6种实体和5种关系,构建了实体、关系抽取语料库,并通过doccano文本标注平台对医案中的实体和关系进行标注,完成对中风病医案数据集的构建。2.构建知识抽取模型。针对标注好的数据集,采用联合抽取方法,构建BERT-Cas Rel信息抽取模型,提取医案文本中的<头实体,关系,尾实体>三元组,并利用kaggle平台对模型进行训练,实现对医案文本中知识的抽取。设置对比模型,并以精确率(Precision)、召回率(Recall)、F1-Score作为模型的评价标准对模型知识抽取的效果进行评估分析。对比实验结果表明,本研究提出的模型能够有效的完成实体关系联合抽取任务,为下一步的中风病知识图谱的构建提供了可靠的数据支撑。3.构建中风病知识图谱,并实现知识图谱的可视化。遵循知识图谱构建的基本流程,在利用知识抽取模型完成“头实体-关系-尾实体”三元组知识抽取的工作后,通过编写python代码将从医案文本中抽取出的6种实体和5种关系转换为Neo4j图数据库中的节点和关系,完成知识图谱中实体、关系的创建,实现知识图谱的可视化和图谱的检索等功能。4.以构建的中风病知识图谱作为高质量的知识源,设计并实现基于中风病知识图谱的症药问答系统。该系统主要功能为通过Q&A的问答方式,利用python语句将问题信息转换为图数据库中的Cypher查询语言,并将转换后的信息输入到Neo4j数据库中,对已创建的中风病知识图谱进行查询,从而确定用户输入信息所对应的中风病相关信息,并针对知识图谱的查询结果给出回答。本文对中风病病例的中医医案进行了综合分析,并将其作为数据源,构建了实体和关系抽取语料库,完成了实体抽取和关系抽取,构建了中风病知识图谱,系统的梳理中风病的临床症状表现及治法用药,并以构建的知识图谱为知识库设计并实现了中风病症药问答系统,实现了知识图谱的扩展应用,对于推动中风病的有效治疗具有积极的影响作用。
参考文献:
正在载入数据...