1.一种中医知识图谱的构建方法,其特征在于,所述方法包括:
对获取的原始文本进行正则提取,得到转化为中医药的初始实体与关系数据,并将部分数据进行审核,以得到文本训练数据;
基于所述文本训练数据进行训练,以得到文本挖掘模型;
再将所述初始实体与关系数据的剩余部分送入所述文本挖掘模型进行预测,得到预测的实体与关系数据;
利用Neo4j图数据库,并根据所述预测的实体与关系数据生成对应的中医知识图谱;其中,所述中医知识图谱中构建有各实体之间的关系作为边,且对实体有扩展解释,并将其作为对应的属性;所述实体包括症、病、证、部位、治疗手段、草药、药性、药方、书籍、产地和西医疾病名词。
2.根据权利要求1所述的一种中医知识图谱的构建方法,其特征在于,所述构建有各实体之间的关系作为边,且对实体有扩展解释,并将其作为对应的属性,具体包括:
病实体与症、证、药方、治疗手段、西医疾病名词、草药和病类型实体关联;
证实体与症、证、药方、草药、治疗手段、部位和病类型实体关联;
症实体与证、病类型实体关联;
部位与证、草药类型关联;
草药与药性、病、证和药方实体类型关联;
药方与病、证、草药和医书实体类型关联;
其中,病实体有概述、临床表现、治疗方法、病因、预防、预后和来源七个扩展属性;
证实体有来源、概述、临床表现、病因、治疗方法和辩证要点六个扩展属性;
草药实体有功效、化学成分、原形态、基源、备注、归经、性状鉴别、注意、炮制、理化鉴别、用法、药性、药理、贮藏、采收储藏和附方十五个扩展属性;
药方实体有主治、用量用法、方法和出处四个扩展属性。
3.根据权利要求1所述的一种中医知识图谱的构建方法,其特征在于,所述文本挖掘模型通过以下步骤进行训练:
S1,对输入文本数据中的句子进行bert编码,以得到句子向量h;
S2,使用句子向量h预测句子中可能存在的关系,得到向量r;
S3,使用向量h预测句子中每个词之间是否存在主宾关系,得到n*n的矩阵;
S4,[h,r]拼接后进行指针标注,找出主体和客体;
S5,根据S4步的标注查找r,判断关系是否生效;
S6,重复S4和S5步直到达到训练效果。
4.根据权利要求1至3中任一所述的一种中医知识图谱的构建方法,其特征在于,所述中医知识图谱还用于进行个性化推荐,具体包括:
首先通过所述文本挖掘模型提取出用户请求信息中所包含的实体加关系;
然后,送入所述知识图谱中,并对知识图谱节点间关系的重叠相似度进行计算,获取节点相似度排序;其中,所述重叠相似度计算的公式为:
O(0)
其中,分母n 是作为一个归一化因子;g(xi,yi)成为共同维度函数;O(xi,yi)为重合度函数;X,Y表示所选的实体;
最后由最终得分决定推荐顺序。
5.一种中医知识图谱的构建系统,其特征在于,包括:
数据处理模块,用于对获取的原始文本进行正则提取,得到转化为中医药的初始实体与关系数据,并将部分数据进行审核,以得到文本训练数据;
文本挖掘模块,用于:
基于所述文本训练数据进行训练,以得到文本挖掘模型;
再将所述初始实体与关系数据的剩余部分送入所述文本挖掘模型进行预测,得到预测的实体与关系数据;
知识图谱构建模块,用于利用Neo4j图数据库,并根据所述预测的实体与关系数据生成对应的中医知识图谱;其中,所述中医知识图谱中构建有各实体之间的关系作为边,且对实体有扩展解释,并将其作为对应的属性;所述实体包括症、病、证、部位、治疗手段、草药、药性、药方、书籍、产地和西医疾病名词。
6.根据权利要求5所述的一种中医知识图谱的构建系统,其特征在于,所述文本挖掘模型通过以下步骤进行训练:
S1,对输入文本数据中的句子进行bert编码,以得到句子向量h;
S2,使用句子向量h预测句子中可能存在的关系,得到向量r;
S3,使用向量h预测句子中每个词之间是否存在主宾关系,得到n*n的矩阵;
S4,[h,r]拼接后进行指针标注,找出主体和客体;
S5,根据S4步的标注查找r,判断关系是否生效;
S6,重复S4和S5步直到达到训练效果。
7.根据权利要求5或6所述的一种中医知识图谱的构建系统,其特征在于,还包括个性化推荐模块,所述个性化推荐模块用于:
首先通过所述文本挖掘模型提取出用户请求信息中所包含的实体加关系;
然后,送入所述知识图谱中,并对知识图谱节点间关系的重叠相似度进行计算,获取节点相似度排序;其中,所述重叠相似度计算的公式为:
O(0)
其中,分母n 是作为一个归一化因子;g(xi,yi)成为共同维度函数;O(xi,yi)为重合度函数;X,Y表示所选的实体;
最后由最终得分决定推荐顺序。
8.根据权利要求7所述的一种中医知识图谱的构建系统,其特征在于,所述重叠相似度为杰卡德相似度的一种延伸,它用两个集合的交集除以两个集合中较小的集合的大小来表示两个集合的相似程度。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任意项所述的一种中医知识图谱的构建方法的步骤。
法律信息
- 2024-07-11
- 2023-05-19
实质审查的生效
IPC(主分类): G06F 16/36
专利申请号: 202211631052.X
申请日: 2022.12.19
- 2023-05-02
- 2022-12-20
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |