235.
做好法律文书的实体识别可极大地帮助推动“智慧司法”,但目前对法律文书的命名实体识别存在着公共数据集缺乏、低频生僻和长实体识别效果不好、句法信息捕捉不足等问题。因此,该文针对民事案件提出了实体定义方案,构建了民事案件法律文书数据集,并且提出了GLYCE-ONLSTM-CRF(GOC)模型来识别法律文书的实体。该模型嵌入层基于BERT预训练模型并融合了汉字字形特征,再通过ONLSTM(Ordered Neuron Long Short Term Memory Networks)层学习句子的层级结构,最后通过条件随机场(CRF)算法输出结果。在构建的民事案件数据集上进行实验,测试集的F
1值提高了5.15%,证明了模型的优越性,为法律文书命名实体识别提供了新思路。… …
相似文献