人密度检测MCNN+CSRnet

阅读: 评论:0

密度检测MCNN+CSRnet
MCNN(简单理解):
窑链
三列卷积神经⽹络,分别为⼤中⼩三种不同尺度的卷积核,表⽰为L列(使⽤⼤尺度卷积核: 9*9, 7*7, 7*7,7*7), M(使⽤中等尺度卷积核: 7*7,
电机线束5*5, 5*5, 5*5), S列(使⽤⼩尺度卷积核: 5*5, 3*3, 3*3, 3*3)),其⽬的在于使⽤多种尺度的卷积核来适应不同尺度的⼈头⼤⼩。最后将L,M,S三列卷积神经⽹络进⾏合并,得到⽹络⽣成的密度图。
从图中可观察到,MCNN实际的下采样系数为4,因此⽹络输出的密度图也是原图宽⾼的1/4,在制作其作为训练数据的标签密度图时,除了要制作为原图1/4的密度图外,⼏何⾃适应⾼斯核相关的的限制,也要相应为1/4,将限制在100/4=25个像素之内
                    图 MCNN⽹络结构
CSRNet ⽹络可以理解⾼度拥挤的场景并执⾏准确的计数估计以及呈现⾼质量密度图
1.CSRnet⽹络结构丁pv病毒
CSRnet⽹络模型主要分为前端和后端⽹络,采⽤剔除了全连接层的VGG-16作为CSRnet的前端⽹络,输出图像的⼤⼩为原始输⼊图像的
1/8。卷积层的数量增加会导致输出的图像变⼩,从⽽增加⽣成密度图的难度。所以本⽂采⽤空洞卷积神经⽹络作为后端⽹络,在保持分辨率的同时扩⼤感知域,⽣成⾼质量的⼈分布密度图。
1.1⽹络结构
采⽤剔除了全连接层的VGG-16⽹络,并且采⽤3×3的卷积核。研究表明,对于相同⼤⼩的感知域,卷积核越⼩,卷积层数越多的模型要优于那些有着更⼤卷积核且卷积层数较少的模型。为了平衡准确性和资源开销,这⾥的VGG-16⽹络采⽤10层卷积层和3层池化层的组合。后端⽹络采⽤六层空洞卷积层,空洞率相同。最后采⽤⼀层1×1的普通卷积层输出结果。⽹络结构如下:
其中所有的卷积层均被填充保持原来⼤⼩。表中显⽰的卷积层的参数被表⽰成“conv-(卷积核⼤⼩)-(通道数)-(空洞率)”,其中最⼤池化层⼤⼩为2×2,步数为2。
1.2空洞卷积
CSRnet中最重要的部分是后端⽹络中的空洞卷积神经⽹络。定义⼀个⼆维的空洞卷积如下:
x(m,n)是长宽分别为M和N的输⼊图像信息,经过卷积核w(i,j)得到空洞卷积的输出y(m,n),其中参数r表⽰空洞率。如果r=1则空洞卷积就是普通卷积。实验证明,空洞卷积利⽤稀疏的卷积核,实现交替卷积和池化操作,在没有增加⽹络参数和计算规模的前提下增⼤了感知域,更适合⼈密度估计任务。⽽普通的卷积操作需要增加卷积层数才能获得更⼤的感知域,⽽且也增加了更多的数据操作。空洞率为r 的空洞卷积操作,K x K的卷积核会被扩⼤为K+(K-1)(r-1)。图1中卷积核⼤⼩为3×3的感知域分别被扩⼤为5×5和7×7。
2.训练过程无油空压机结构图
2.1⽣成密度图
通俗理解:根据josn⽂件中的标注,对训练集中每张图⽚⽣成密度图,原理为先⽣成⼀个与图⽚⼤⼩相同的全0矩阵,然后将⼈头坐标位置设为1,其他位置设为0,然后根据⾼斯核函数⽣成的矩阵保存在.Xls⽂件中作为密度图,即为label。
2.2损失函数
作为端到端⽹络的CSRnet,采⽤最直接的⽅法进⾏模型训练即可。前端⽹络中10个卷积层来⾃已经训练好的VGG-16,所以只需要进⾏微调训练。对于其他卷积层的参数采⽤0.01的标准偏差的⾼斯初始化。在训练期间,随机梯度下降的学习率固定为1e-6。采⽤欧⽒距离测量我
pvc覆膜胶水
们⽣成的密度图与真实值的距离。损失函数定义如下:小环钗
N表⽰batch size,Z表⽰⽣成的密度图,ZGT表⽰密度图ground truth
3实验结果
3.1评估标准
采⽤普遍被研究⼈员采⽤的均⽅误差(MSE)和平均绝对误差(MAE),MSE⽤来描述模型的准确度,MSE越⼩则准确度越⾼,MAE能反映出预测值的误差情况。
N表⽰⼀次测试序列中图⽚的数量,Ci表⽰对图⽚Xi的预测⼈数(得到的密度图求和即可),CiGT表⽰真实⼈数

本文发布于:2023-06-18 22:31:39,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/143970.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:卷积   空洞   密度
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图