我知道,已经提出了许多解决方案来训练具有可变输入大小的CNN,但我面临的情况有所不同:
我的数据集由单细胞图像组成,这些图像均具有相同的像素分辨率(0.31x0.31 µm),但大小不同(在细胞分割过程后,来自细胞群体图像的裁剪)。此外,我正在实施VAE以进行多种学习。
因此:
- 使用完全卷积的网络或使用AdaptiveAvgPooling(或与pytorch相比适用于不同的深度学习框架)不是解决方案。对于编码部分来说确实是微不足道的,但是VAE的解码部分将不得不检索输入的原始大小,据我所知,这是不可能的。
- 通常建议将所有图像调整为给定形状,但是:由于所有数据集中的像素分辨率相同,因此尽管大小不同,元素/特征的比例也相同。我希望调整大小会严重破坏信息。细胞之间大小的差异是有意义的(由于形态的变化),所有其他特征的比例仍然相似。
- 我唯一能找到的解决方案是将所有图像归零并裁剪为给定大小。
- 多尺度训练可能无济于事,因为CNN可以专注于给定尺度的特征,因为所有数据都具有相同的像素分辨率。
我的问题是:
- 有人遇到过这种情况吗?我是否错过了另一种更好的方法?
- 如果没有,零填充是否可以胜任工作,这会恶化VAE学习吗?网络将需要学习,对于某些图像,很大一部分需要被忽略,而对于其他图像则不需要。最后,某些单细胞图像只能在填充图像的一小部分中表示。填充图像中单元格的位置可能保留为潜在特征,但不相关。
非常感谢您的帮助