为了帮助构建对象识别模型和场景识别模型,我们整理了一份最佳图像分类数据集的列表。这些数据集覆盖了不同的领域和用途,可以满足多种需求。以下是经过筛选和分类的数据集:
递归细胞图像分类
这个数据集源自递归2019挑战赛,旨在利用生物显微镜数据开发可识别细胞复制的模型。更多详细信息可以访问Kaggle上的相关页面。
TensorFlow Patch Camelyon医学图像
来自TensorFlow官网的医学图像分类数据集,包含超过327,000张96x96像素的彩色图像,主要用于组织病理学淋巴结扫描。
CoastSat图像分类数据集
该数据集用于开源海岸线测绘工具,包含从卫星获取的航空图像及相关的元数据。
天气图像分类数据集
这个数据集包含1125张图像,分为四个类别:日出、晴天、雨天和多云,适合多类天气识别任务。
MIT室内场景图像
包含15,000多张室内场景图像,分为67类,主要应用于室内场景识别。
Intel图像分类数据集
Intel创建的图像分类数据集,包含约25,000张图像,分为建筑物、森林、冰川、山脉、海洋和街道六个类别。数据集已按训练、测试和预测分类。
TensorFlow SUN397图像分类数据集
包含超过108,000张图像,分为397类,适用于场景理解和分类任务。
建筑遗产元素图像分类数据集
此数据集包含超过10,000张建筑遗产图像,分为10类,包括坛、后殿、钟楼等元素。
人和食物图像分类数据集
该数据集包含587张图像,由吃食物的人组成,并按性别和年龄分类。数据以CSV格式提供。
混凝土裂痕图像分类数据集
包含40,000张混凝土图像,每张图像为227x227像素,其中一半包含裂痕,另一半则没有。
这些数据集可以帮助您更好地训练和优化您的图像分类模型,从而实现更高效和准确的对象和场景识别。