一种用于提高时效性的儿童标本签收管理系统

阅读: 评论:0

著录项
  • CN202211659498.3
  • 20221222
  • CN115862798A
  • 20230328
  • 河南省儿童医院郑州儿童医院
  • 董凤梅;范桂林;张瑞楠;胡玲玲;王歆茹
  • G16H10/60
  • G16H10/60 G16H50/70 G16H70/60 G06F40/194 G06F40/30 G06N3/0464 G06N3/0475 G06N3/08

  • 河南省郑州市郑东新区龙湖外环东路33号
  • 河南(41)
  • 安徽善安知识产权代理事务所(特殊普通合伙)
  • 刘勇
摘要
本发明涉及一种标本签收技术领域,本发明公开了一种用于提高时效性的儿童标本签收管理系统,包括儿童标本数据录入,病理申请单的文本图像信息数据预处理,基于字符之间的相似性选择相似度最高的历史书写字符数据作为分析对象,将手写字符的融合特征向量输入至全连接层中输出手写字符语义预测结果,以条形码信息作为先验信息,基于病理申请单的填写医生的书写风格随机生成患儿的电子诊断信息,计算生成样本与真实样本之间的对比损失,通过利用医生手写诊断记录数据对病理申请单的书写字符进行预测同时根据与预测语义构建书写风格渲染模型对书写医生的书写风格进行渲染反向模拟预测书写结果与现有的病理申请单相对比可得出语义预测的结果准确性。
权利要求

1.一种用于提高时效性的儿童标本签收管理系统,其特征在于,包括以下签收流程:

S1:儿童标本数据录入,通过扫描送检儿童术中切除标本的条形码信息获得患儿诊断信息以及扫描录入病理申请单的文本图像信息来构建儿童标本数据库;

S2:病理申请单的文本图像信息数据预处理,根据病理申请单的表格样式,以表格边框符号前后的字符作为文本分断标准,将病理申请单中的文本分为固定字符与手写字符。

S3:病理申请单的手写字符特征提取,使用word2vec模型提取病理申请单中手写字符的d0维词向量,并且以所提取的词向量空间构建形近字向量特征;

S4:根据患儿基本信息中的诊治医生链接医生医疗诊治语料库的历史书写字符数据,基于字符之间的相似性选择相似度最高的历史书写字符数据作为医生医疗诊治语料库中符合手写字符语义的分析对象;

S5:将手写字符的融合特征向量Xi输入至一个全连接层中,根据语义预测概率输出手写字符语义预测结果Y,计算语义预测分类损失Ls;

S6:验证病理申请单的文本信息的手写字符语义预测结果Y与儿童术中切除标本的条形码信息x的一致性,计算对比损失L1.

S7:以儿童术中切除标本的条形码信息x作为先验信息,提取条形码信息x中的患儿电子诊断信息,基于病理申请单的填写医生的书写风格随机生成患儿的电子诊断信息,计算生成样本与真实样本之间的对比损失L2;

S71:构建书写字符生成模型,令H={hc|c∈A}表示患儿电子诊断信息各个字符对应的特征图集合,其中A表示患儿电子诊断信息而hc表示字符c对应的特征图,同时对于各个字符特征图hc均加入同一随机噪声ε来引入字符一定的变形和扭曲,经转化过后对应生成字符特征图n表示患儿的电子诊断信息字符数量,通过水平拼接字符特征图/>得到一个随机风格的文本特征图R,使用全卷积网络对文本特征图R进行采样和风格渲染,注入病理申请单的填写医生的书写风格特征s,生成基于病理申请单的填写医生的书写风格的假样本;

S72:计算书写字符生成模型的训练损失函数,将对病理申请单的填写医生的书写风格提取损失以及患儿电子诊断信息书写假样本的生成对抗损失的加权和作为书写字符生成模型的总训练损失函数。

2.根据权利要求1所述的一种用于提高时效性的儿童标本签收管理系统,其特征在于,所述S2中定义TWi代表病理申请单的字符序列,i=1时代表病理申请单的固定字符序列,i=2时代表病理申请单的手写字符序列,N为字符的数目,将TW1划分为由若干整词集合Sn={wn}组成的数据集,n代表固定字符序列中的第n个整词,根据字符之间的间隔距离将TW2划分为由若干字符块Bi={wi}组成的数据集,此时i代表手写字符序列中的第i个字符块,TW1的语义已知,TW2作为待解译字符数据集参与下一步特征提取。

3.根据权利要求1所述的一种用于提高时效性的儿童标本签收管理系统,其特征在于,所述S4是通过定义历史书写字符数据集合La={Lai},手写字符集合Bi={wi},目标历史书写字符为z={zi},计算历史书写字符数据中目标历史书写字符与手写字符的语义相似性Lai∩z代表历史书写字符数据集合的节点Lai与目标历史书写字符的共同集合,p(i|z)表示节点Lai与z对应的i的概率,同时加入节点Lai与zi的连接边权重w(Lai,zi)来计算目标历史书写字符与手写字符的语义一致性S,即S=Sim(z|Lai,bi)+w(Lai,zi)。

4.根据权利要求3所述的一种用于提高时效性的儿童标本签收管理系统,其特征在于,在目标历史书写字符的引导下,分析字形特征与字义特征的相关性,将字形特征Vt与字义特征Vp输入至注意力层,借助softmax函数生成字形和字义在目标历史书写字符引导下得到手写字符的融合特征向量代表目标历史书写字符引导下的注意力分布,/>,σ代表字形特征Vt与字义特征Vp在注意力层的权重参数,Wp代表字形特征Vt与字义特征Vp在注意力层的权重,bp代表字形特征Vt与字义特征Vp在注意力层的偏移值。

5.根据权利要求1所述的一种用于提高时效性的儿童标本签收管理系统,其特征在于,所述S5中是利用softmax激活函数对各特征向量的节点进行语义分类预测,即分类预测概率,/>代表特征向量矩阵Xi的转置矩阵,Wf代表语义识别模型的参数矩阵,f是训练数据集中含有的语义类别种类,根据语义预测概率输出手写字符语义预测结果Y,同时语义预测分类损失函数/>,pij表示节点i在第j维的分布概率,fi代表节点i的真实语义。

6.根据权利要求1所述的一种用于提高时效性的儿童标本签收管理系统,其特征在于,所述S6中语义预测结果Y与儿童术中切除标本的条形码信息x的一致性

,对患儿基础信息的检验模型的损失函数进行计算,即,N代表数据库中参加检验的样本数量,γ·Ls用于验证手写字符语义预测的分类损失,/>用于语义预测结果Y与条形码信息x的匹配程度,γ代表优化过程中的影响因子。

7.根据权利要求1所述的一种用于提高时效性的儿童标本签收管理系统,其特征在于,所述S7中的书写字符生成模型能够有效地学习手写相邻字符间的重叠并且能够根据需要自动添加连笔书写。

8.根据权利要求1所述的一种用于提高时效性的儿童标本签收管理系统,其特征在于,所述S72中的书写字符生成模型的训练损失函数

∑x,s[||s-ε(x,s)||]表示对病理申请单的填写医生的书写风格提取损失,x表示病理申请单的填写医生的书写参考样本,s表示病理申请单的填写医生的书写风格特征,

ε(x,s)表示在风格编码器ε的辅助权重,

∑t[logD(t)+∑x,s[log(1-D(x,ε(t)))]表示在识别器D的判别区分下患儿电子诊断信息书写假样本的生成对抗损失,患儿电子诊断信息书写假样本的生成对抗损失能够使书写字符生成模型生成足够贴近真实样本的书写假样本,对病理申请单的填写医生的书写风格提取损失使风格特征s能够明确地影响生成样本的书写风格。

说明书
技术领域

本发明涉及一种标本签收技术领域,具体是一种用于提高时效性的儿童标本签收管理系统。

儿童患肿瘤一旦明确,就会在第一时间安排肿瘤切除手术,由于儿童年龄及发育的特殊性,康复会影响患儿日后的身心健康,手术时必须考虑的彻底性和及时性,同时保留其他器官的正常功能,肿瘤切除手术中需做冷冻切片检查来确定手术范围,不能贸然对儿童进行肿瘤切除手术,以免对儿童日后的成长发育带来不可挽回的损伤,冷冻切片的结果需要在半小时之内给出,而在手术切片送检过程中,病理科需专人对儿童术中标本进行检验核对之后才能查收,在核对过程中,需对儿童切除标本与病理申请单信息进行核对,但是由于病理申请单的信息大多由儿童诊治医师手写,在进行信息核对时难免会有识别错误与识别困难等问题出现,这就造成了手术等待时间的延误,在信息核对时受校核人员主观因素的影响较大,因而在标本签收过程中会因病理申请单的核对耗费较多的时间,为了提高标本签收效率降低儿童肿瘤手术风险,因此可以设计一种用于提高时效性的儿童标本签收管理系统用来辅助标本签收人员对儿童术中标本进行签收核对,减少主观因素对标本核对的影响。

本发明的目的在于提供一种用于提高时效性的儿童标本签收管理系统,通过利用医生手写诊断记录数据对病理申请单的书写字符进行预测同时根据与预测语义构建书写风格渲染模型对书写医生的书写风格进行渲染反向模拟预测书写结果与现有的病理申请单相对比可得出语义预测的结果准确性可以有效解决背景技术中的问题。

为实现上述目的,本发明提供如下技术方案:

一种用于提高时效性的儿童标本签收管理系统,包括以下签收流程:

S1:儿童标本数据录入,通过扫描送检儿童术中切除标本的条形码信息获得患儿诊断信息以及扫描录入病理申请单的文本图像信息来构建儿童标本数据库;

S2:病理申请单的文本图像信息数据预处理,根据病理申请单的表格样式,以表格边框符号前后的字符作为文本分断标准,将病理申请单中的文本分为固定字符与手写字符;

S3:病理申请单的手写字符特征提取,使用word2vec模型提取病理申请单中手写字符的d0维词向量,并且以所提取的词向量空间构建形近字向量特征;

S4:根据患儿基本信息中的诊治医生链接医生医疗诊治语料库的历史书写字符数据,基于字符之间的相似性选择相似度最高的历史书写字符数据作为医生医疗诊治语料库中符合手写字符语义的分析对象;

S5:将手写字符的融合特征向量Xi输入至一个全连接层中,根据语义预测概率输出手写字符语义预测结果Y,计算语义预测分类损失Ls;

S6:验证病理申请单的文本信息的手写字符语义预测结果Y与儿童术中切除标本的条形码信息x的一致性,计算对比损失L1.

S7:以儿童术中切除标本的条形码信息x作为先验信息,提取条形码信息x中的患儿电子诊断信息,基于病理申请单的填写医生的书写风格随机生成患儿的电子诊断信息,计算生成样本与真实样本之间的对比损失L2;

S71:构建书写字符生成模型,令H={hc|c∈A}表示患儿电子诊断信息各个字符对应的特征图集合,其中A表示患儿电子诊断信息而hc表示字符c对应的特征图,同时对于各个字符特征图hc均加入同一随机噪声ε来引入字符一定的变形和扭曲,经转化过后对应生成字符特征图,n表示患儿的电子诊断信息字符数量,通过水平拼接字符特征图/>得到一个随机风格的文本特征图R,使用全卷积网络对文本特征图R进行采样和风格渲染,注入病理申请单的填写医生的书写风格特征s,生成基于病理申请单的填写医生的书写风格的假样本;

S72:计算书写字符生成模型的训练损失函数,将对病理申请单的填写医生的书写风格提取损失以及患儿电子诊断信息书写假样本的生成对抗损失的加权和作为书写字符生成模型的总训练损失函数。

作为本发明再进一步的方案:所述S2中定义,i=1、2,TWi代表病理申请单的字符序列,i=1时代表病理申请单的固定字符序列,i=2时代表病理申请单的手写字符序列,N为字符的数目,将TW1划分为由若干整词集合Sn={wn}组成的数据集,n代表固定字符序列中的第n个整词,根据字符之间的间隔距离将TW2划分为由若干字符块Bi={wi}组成的数据集,此时i代表手写字符序列中的第i个字符块,TW1的语义已知,TW2作为待解译字符数据集参与下一步特征提取。

作为本发明再进一步的方案:所述S4是通过定义历史书写字符数据集合La={Lai},手写字符集合Bi={wi},目标历史书写字符为z={zi},计算历史书写字符数据中目标历史书写字符与手写字符的语义相似性Lai∩z代表历史书写字符数据集合的节点Lai与目标历史书写字符的共同集合,p(i|z)表示节点Lai与z对应的i的概率,同时加入节点Lai与zi的连接边权重w(Lai,zi)来计算目标历史书写字符与手写字符的语义一致性S,即S=Sim(z|Lai,bi)+w(Lai,zi)。

作为本发明再进一步的方案:在目标历史书写字符的引导下,分析字形特征与字义特征的相关性,将字形特征Vt与字义特征Vp输入至注意力层,借助softmax函数生成字形和字义在目标历史书写字符引导下得到手写字符的融合特征向量,Xi={Vti,Vpi}∈R,/>代表目标历史书写字符引导下的注意力分布,/>,σ代表字形特征Vt与字义特征Vp在注意力层的权重参数,Wp代表字形特征Vt与字义特征Vp在注意力层的权重,bp代表字形特征Vt与字义特征Vp在注意力层的偏移值。

作为本发明再进一步的方案:所述S5中是利用softmax激活函数对各特征向量的节点进行语义分类预测,即分类预测概率代表特征向量矩阵Xi的转置矩阵,Wf代表语义识别模型的参数矩阵,f是训练数据集中含有的语义类别种类,根据语义预测概率输出手写字符语义预测结果Y,同时语义预测分类损失函数

,pij表示节点i在第j维的分布概率,fi代表节点i的真实语义。

作为本发明再进一步的方案:所述S6中语义预测结果Y与儿童术中切除标本的条形码信息x的一致性,对患儿基础信息的检验模型的损失函数进行计算,即/>,N代表数据库中参加检验的样本数量,γ·Ls用于验证手写字符语义预测的分类损失,/>用于语义预测结果Y与条形码信息x的匹配程度,γ代表优化过程中的影响因子。

作为本发明再进一步的方案:所述S71中的书写字符生成模型能够有效地学习手写相邻字符间的重叠并且能够根据需要自动添加连笔书写。

作为本发明再进一步的方案:所述S72中的书写字符生成模型的训练损失函数,

∑x,s[||s-ε(x,s)||]表示对病理申请单的填写医生的书写风格提取损失,x表示病理申请单的填写医生的书写参考样本,s表示病理申请单的填写医生的书写风格特征,ε(x,s)表示在风格编码器ε的辅助权重,

∑t[logD(t)]+∑x,s[log(1-D(x,ε(t)))]表示在识别器D的判别区分下患儿电子诊断信息书写假样本的生成对抗损失,患儿电子诊断信息书写假样本的生成对抗损失能够使书写字符生成模型生成足够贴近真实样本的书写假样本,对病理申请单的填写医生的书写风格提取损失使风格特征s能够明确地影响生成样本的书写风格。

与现有技术相比,本发明的有益效果是:

通过利用医生手写诊断记录数据对病理申请单的书写字符进行预测同时根据与预测语义构建书写风格渲染模型对书写医生的书写风格进行渲染反向模拟预测书写结果与现有的病理申请单相对比可得出语义预测的结果准确性。

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为一种用于提高时效性的儿童标本签收管理系统的结构示意图;

图2为一种用于提高时效性的儿童标本签收管理系统中S7的流程示意图。

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

实施例:

如图1-图2所示,本发明提供一种用于提高时效性的儿童标本签收管理系统的签收方法,所示具体步骤如下:

S1:在专门送检人员将儿童标本送至病理检验科时,利用扫描仪器录入儿童标本数据,通过扫描送检儿童术中切除标本的条形码信息获得患儿诊断信息以及扫描录入病理申请单的文本图像信息来构建儿童标本数据库;

S2:病理申请单的文本图像信息数据预处理,根据病理申请单的表格样式,以表格边框符号前后的字符作为文本分断标准,将病理申请单中的文本分为固定字符与手写字符,定义TWi代表病理申请单的字符序列,i=1时代表病理申请单的固定字符序列,i=2时代表病理申请单的手写字符序列,N为字符的数目,将TW1划分为由若干整词集合Sn={wn}组成的数据集,n代表固定字符序列中的第n个整词,根据字符之间的间隔距离将TW2划分为由若干字符块Bi={wi}组成的数据集,此时i代表手写字符序列中的第i个字符块,TW1的语义已知,TW2作为待解译字符数据集参与下一步特征提取;

S3:病理申请单的手写字符特征提取,使用word2vec模型提取病理申请单中手写字符的d0维词向量,并且以所提取的词向量空间构建形近字向量特征;

S4:根据患儿基本信息中的诊治医生链接医生医疗诊治语料库的历史书写字符数据,基于字符之间的相似性选择相似度最高的历史书写字符数据作为医生医疗诊治语料库中符合手写字符语义的分析对象;

进一步有定义历史书写字符数据集合La={Lai},手写字符集合Bi={wi},目标历史书写字符为z={zi},计算历史书写字符数据中目标历史书写字符与手写字符的语义相似性Lai∩z代表历史书写字符数据集合的节点Lai与目标历史书写字符的共同集合,p(i|z)表示节点Lai与z对应的i的概率,同时加入节点Lai与zi的连接边权重w(Lai,zi)来计算目标历史书写字符与手写字符的语义一致性S,即S=sim(z|Lai,bi)+w(Lai,zi),然后在目标历史书写字符的引导下,分析字形特征与字义特征的相关性,将字形特征Vt与字义特征Vp输入至注意力层,借助softmax函数生成字形和字义在目标历史书写字符引导下得到手写字符的融合特征向量/>代表目标历史书写字符引导下的注意力分布,/>,σ代表字形特征Vt与字义特征Vp在注意力层的权重参数,Wp代表字形特征Vt与字义特征Vp在注意力层的权重,bp代表字形特征Vt与字义特征Vp在注意力层的偏移值;

S5:将手写字符的融合特征向量Xi输入至一个全连接层中,利用softmax激活函数对各特征向量的节点进行语义分类预测,即分类预测概率代表特征向量矩阵Xi的转置矩阵,Wf代表语义识别模型的参数矩阵,f是训练数据集中含有的语义类别种类,根据语义预测概率输出手写字符语义预测结果Y,计算语义预测分类损失Ls,语义预测分类损失函数/>,pij表示节点i在第j维的分布概率,fi代表节点i的真实语义;

S6:验证病理申请单的文本信息的手写字符语义预测结果Y与儿童术中切除标本的条形码信息x的一致性,计算对比损失L1;

语义预测结果Y与儿童术中切除标本的条形码信息x的一致性,对患儿基础信息的检验模型的损失函数进行计算,即,N代表数据库中参加检验的样本数量,γ·Ls用于验证手写字符语义预测的分类损失,/>用于语义预测结果Y与条形码信息x的匹配程度,γ代表优化过程中的影响因子;

S7:以儿童术中切除标本的条形码信息x作为先验信息,提取条形码信息x中的患儿电子诊断信息,基于病理申请单的填写医生的书写风格随机生成患儿的电子诊断信息,计算生成样本与真实样本之间的对比损失L2;

S71:构建书写字符生成模型,令H={hc|c∈A}表示患儿电子诊断信息各个字符对应的特征图集合,其中A表示患儿电子诊断信息而hc表示字符c对应的特征图,同时对于各个字符特征图hc均加入同一随机噪声ε来引入字符一定的变形和扭曲,经转化过后对应生成字符特征图,n表示患儿的电子诊断信息字符数量,通过水平拼接字符特征图/>得到一个随机风格的文本特征图R,使用全卷积网络对文本特征图R进行采样和风格渲染,注入病理申请单的填写医生的书写风格特征s,生成基于病理申请单的填写医生的书写风格的假样本,书写字符生成模型能够有效地学习手写相邻字符间的重叠并且能够根据需要自动添加连笔书写;

S72:计算书写字符生成模型的训练损失函数,将对病理申请单的填写医生的书写风格提取损失以及患儿电子诊断信息书写假样本的生成对抗损失的加权和作为书写字符生成模型的总训练损失函数L2;

书写字符生成模型的训练损失函数

∑x,s[||s-ε(x,s)||]表示对病理申请单的填写医生的书写风格提取损失,x表示病理申请单的填写医生的书写参考样本,s表示病理申请单的填写医生的书写风格特征,ε(x,s)表示在风格编码器ε的辅助权重,∑t[logD(t)]+∑x,s[log(1-D(x,ε(t)))]表示在识别器D的判别区分下患儿电子诊断信息书写假样本的生成对抗损失,患儿电子诊断信息书写假样本的生成对抗损失能够使书写字符生成模型生成足够贴近真实样本的书写假样本,对病理申请单的填写医生的书写风格提取损失使风格特征s能够明确地影响生成样本的书写风格。

本发明的工作原理是:通过利用医生手写诊断记录数据对病理申请单的书写字符进行预测同时根据与预测语义构建书写风格渲染模型对书写医生的书写风格进行渲染反向模拟预测书写结果与现有的病理申请单相对比可得出语义预测的结果准确性。

以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

本文发布于:2023-04-13 11:36:49,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/4/85842.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图