这篇文章的思路是将原图resize出4个尺度,用同一个卷积模块提特征,因不同尺度的输入得到的特征图尺寸不同,需要上采样到同一尺寸。然后,基于注意力机制筛选与融合这些特征,具体做法是在特征图每个位置都生成4个得分,分别对应这4个特征图中该位置的权重,然后做加权和。