关键内容
- 规模与多样性:包含超过219,770张高分辨率图像,覆盖20种杂草和10种作物。
- 图像内容:图像展示了作物和杂草的不同生长阶段、多个视角以及多样的环境条件。
- 数据收集:图像采集自不同地理位置、季节和农田,确保了数据集的广泛性和代表性。
- 层次分类法:支持细粒度分类,有助于开发更准确和稳健的深度学习模型。
- 数据组织:遵循ImageNet风格,方便使用数据加载工具如fmutils或GitHub上的数据加载器。
- 挑战:数据集存在类内变化、类间相似性和数据不平衡等挑战。
- 性能提升:使用CWD30预训练的主干可以提高模型性能,减少训练时间,节省资源。
- CWD30-S:CWD30的扩展,专为语义分割任务设计,提供像素级语义掩码和子类别注释。
CWD30数据集
CWD30数据集,专为作物杂草识别任务设计。CWD30包含219,770张高分辨率图像,涵盖20种杂草和10种作物的不同生长阶段、多角度视角和多种环境条件。数据集从不同地理位置和季节的农田收集,确保了数据的代表性。其分层分类法实现了细粒度分类,有助于开发更精确和强大的深度学习模型。广泛的基线实验表明,尽管存在类内差异、类间相似性和数据不平衡等挑战,CWD30能显著提升模型性能,减少收敛时间,节省训练资源。我们相信,CWD30将成为评估作物杂草识别算法的重要基准,推动精准农业进步,并促进研究人员的合作。
程序
- 在数据集上训练分类模型及其权重(如ResNet、MobileNet、EfficientNet、ViT)
- 在数据集上训练语义和实例分割模型(如UNet、DeepLab v3+、MaskRCNN)