针对传统实体关系抽取方法中主体特征与句向量难以有效融合、现有BIO标注策略难以有效处理重叠关系的问题,提出一种基于BERT和双重指针标注的家禽疾病诊疗文本实体关系联合抽取模型(Joint extraction of entity relationship of poultry disease diagnosis and treatment text,JEER_PD)。JEER_PD使用双重指针标注(Dual-pointer labeling,DPL)策略,建立头、尾2个指针标注器,一次性标注出所有实体的开始和结束位置;引入CLN(Conditional layer normalization)网络层,强化主体抽取任务与客体关系联合抽取任务之间的联系;利用概率平衡策略PBS对抗正负类标签类别失衡,以加速模型收敛。实验表明,JEER_PD准确率、召回率和F1分别为97.69%、97.59%和97.64%,3项指标较现有方法均有显著提升,说明JEER_PD能够快速、准确地抽取家禽疾病诊疗复杂知识文本中的实体关系三元组。
单位种植面积的麦穗数量是评估小麦产量的关键农艺指标之一。针对农田复杂场景中存在的大量麦芒、卷曲麦叶、杂草等环境噪声、小尺寸目标和光照不均等导致的麦穗检测准确度下降的问题,提出了一种基于深度学习的麦穗检测方法(FCS RCNN)。以Cascade RCNN为基本网络模型,通过引入特征金字塔网络(Feature pyramid network,FPN)融合浅层细节特征和高层丰富语义特征,通过采用在线难例挖掘(Online hard example mining,OHEM)技术增加对高损失样本的训练频次,通过IOU(Intersection over union)阈值对网络模型进行阶段性融合,最后基于圆形LBP纹理特征训练一个SVM分类器,对麦穗检出结果进行复验。大田图像测试表明,FCS RCNN模型的检测精度达92.9%,识别单幅图像平均耗时为0.357 s,平均精度为81.22%,比Cascade RCNN提高了21.76个百分点。