867.
目的 化学结构识别是化学和计算机视觉领域的一个重要问题,传统光学化学结构识别技术在复杂化学结构识别任务中易发生信息丢失或误识别的现象,同时又因为化学物质的结构多样性常导致其无法解析,识别效果不佳。而基于深度学习的模型通常具有网络结构复杂度高、上下文信息易丢失和识别率低的问题。为此,提出一种结合注意力机制和编码器—解码器架构的化学结构识别方法。
方法 首先,使用改进的 ResNet50(residual network)作为特征提取器抓取表征信息;其次,使用 BLSTM(bi-directional long-short term memory)作为行编码器为 ResNet50提取的表征信息加强空间信息;最后,使用去填充模块和基于覆盖注意力机制的 LSTM(long short-term memory)网络作为模型解码器,对化学结构图像进行解码,将编码结果解码为 SMILES(simplified molecular input line entry system)序列。
结果 在 Indigo、ChemDraw、CLEF(Conference and Labs of the Evaluation Forum)、JPO(Japanese Patent Office)、UOB(University of Birmingham)、USPTO(United States Patent and Trademark Office)、Staker、ACS(American ChemistrySociety)、CASIA-CSDB(Institute of Automation of Chinese Academy of Sciences—Chemical Structure Database)和 MiniCASIA-CSDB 数据集上,所提方法识别准确率分别为 71. 1%、70. 21%、45. 8%、30. 3%、53. 02%、58. 21%、43. 39%、46. 3%、84. 42% 和 85. 78%,高于 SwimOCSR、Image2Mol 和 ChemPix 模型得分。
结论 与其他模型相比,本文方法通过少量训练集能够获得较高的识别准确率。… …
相似文献