66.
针对人群计数面临的人头尺寸不统一、人群密度分布不均匀、背景复杂干扰等问题, 提出一种解决多尺度变化加强关注人群区域的卷积神经网络模型 (multi-scale feature weighted fusion attention convolutional neural network, MSFANet). 该网络前端采用改进的VGG-16模型对输入人群图像做第1步的粗粒度特征提取, 中间加入多尺度特征提取模块提取图像的多尺度特征信息. 随后添加注意力模块对多尺度特征进行特征加权. 后端利用锯齿状空洞卷积模块增大感受野, 以提取图像的细节特征, 生成高质量的人群密度图. 对该模型在3个公开数据集上进行实验, 结果显示, 在Shanghai Tech Part B数据集上
MAE (平均绝对误差)达到7.8,
MSE (均方误差)达到12.5. 在Shanghai Tech Part A数据集上
MAE达到64.9,
MSE达到108.4. 在UCF_CC_50数据集上
MAE达到185.1,
MSE达到249.8. 实验结果证实该模型有较好的准确度和鲁棒性.… …
相似文献