一种基于神经网络的智能病案文字识别的方法

Submitted by neurta on Thu, 02/06/2020 - 11:12
ocr

颐保医疗科技有限公司

权力要求书

 

一:1.一种基于神经网络的智能病案文字识别的方法,其特征在于,包括以下步骤:

S1、取病案文本行数据进行标注,标出每个文本行里面所包含的文字,得到病案训练数据:

S2、将标注病案训练数据与已有的通过通用文字识别方法识别的文字检测数据一起作为训练数据,并将已有的文字检测数据按照98:1:1的比例分成训练集、测试集和验证集;

S3、将训练数据按32*280*3的图片进行灰度处理转换成32*280*1的灰度图,并输入卷积神经网络模块中进行图片的特征提取,生成4*35*192的特征图,然后将特征图进行维度交换35*4*192,再将最后两个维度进行合并35*768的特征图转入双层双向循环神经网络做特征提取,得到特征图的35个切片;

S4、利用文本识别模型对特征图的35个切片分别进行分类预测得分;

S5、取每一个切片预测得分最高的分类,该分类对应的字即为所预测的字,最后将35个切片的相同字符进行合并,得到10个字符。

2.根据权力要求1所述的一种基于神经网络的智能病案文字识别的方法,其特征在于,在步骤S1中,每张病案训练数据长宽相同并包含10个文字。

3.根据权力要求1所述的一种基于神经网络的智能病案文字识别的方法,其特征在于,在步骤S3中,所述特征图的35个切片为35个字或字符的数量。

4.根据权力要求1所述的一种基于神经网络的智能病案文字识别的方法,其特征在于,在步骤S4中,文本识别模型采用CTC作为损失函数,采用Adam梯度下降优化器进行模型的反向传播,调整神经网络模型参数。

有益效果是:

(1)数据集增加医学用词及医学用词训练数据,增加了医学用词的预测能力;

(2)由真实病案数据制作的数据集,能够有效的消除背景的影响

(3)通过新设计的卷积神经网络模块和双层双向神经网络的结合,使得本专利在通用文本及病案文本的识别准确率上显著提高,特别是比现有的ocr识别病案的准确率高,准确度达到98.3%