人工智能算法的好坏取决于你提供给它的数据。
这既不是一个大胆的声明,也不是一个非常规的声明。 几十年前,人工智能似乎有些牵强,但从那时起,人工智能和机器学习已经走了很长一段路。
计算机视觉 帮助计算机理解和解释标签和图像。当您使用正确的图像数据集训练计算机时,它可以获得检测、理解和识别各种面部特征、检测疾病、驾驶自动驾驶汽车以及使用多维器官扫描挽救生命的能力。
计算机视觉市场预计将达到 $ 144.46十亿 从 2028 年的 7.04 亿美元到 2020 年,45.64 年至 2021 年间的复合年增长率为 2028%。
特 图像数据集 你正在喂养和训练你的机器学习和计算机视觉任务对于你的人工智能项目的成功至关重要。 很难获得高质量的数据集。 根据项目的复杂性,可能需要几天到几周的时间才能获得用于计算机视觉目的的可靠且相关的数据集。
在这里,我们为您提供了一系列(为方便您使用而分类)可立即使用的开源图像数据集。
用于训练计算机视觉模型的图像数据集综合列表
总机:
影像网
ImageNet 是一个广泛使用的数据集,它包含惊人的 1.2 万张图像,分为 1000 个类别。 该数据集按照 WorldNet 层次结构进行组织,并分为三部分——训练数据、图像标签和验证数据。
动力学700
Kinetics 700 是一个巨大的高质量数据集,包含 650,000 个不同的人类动作类别的 700 多个剪辑。 每个集体诉讼都有大约 700 个视频剪辑。 数据集中的剪辑具有人与对象和人与人的交互,这在识别视频中的人类行为时被证明是非常有用的。
CIFAR-10
CIFAR 10 是最大的计算机视觉数据集之一,拥有代表十个不同类别的 60000 张 32 x 32 彩色图像。 每个类有大约 6000 张图像用于训练计算机视觉算法和机器学习。
牛津-IIIT 宠物图像数据集
宠物图像数据集包含 37 个类别,每个类别有 200 幅图像。这些图像的大小、姿势和光照各不相同,并附有品种、头部 ROI 和像素级三图分割的注释。
谷歌的开放图片
凭借令人印象深刻的 9 万个 URL,这是列表中最大的图像数据集之一,包含 6,000 个类别的数百万张标记图像。
植物图像
该汇编包括多个图像数据集,其中包含令人印象深刻的 1 万张植物图像,涵盖大约 11 个物种。
面部识别:
野外带标签的面孔
Labeled Faced in the Wild 是一个庞大的数据集,包含从互联网检测到的近 13,230 人的 5,750 多张图像。 这个人脸数据集旨在使研究不受约束的人脸检测变得更容易。
CASIA 网页界面
CASIA Web face 是一个精心设计的数据集,有助于机器学习和科学研究无约束的面部识别。 它拥有近 494,000 个真实身份的 10,000 多张图像,是人脸识别和验证任务的理想选择。
UMD 人脸数据集
UMD 面对一个注释良好的数据集,该数据集包含两部分——静止图像和视频帧。 该数据集有超过 367,800 个面部注释和 3.7 万个带注释的主题视频帧。
口罩检测
该数据集包含 853 幅图像,分为“戴口罩”、“不戴口罩”和“口罩佩戴不正确”三类,并附有 PASCAL VOC 格式的边界框。
费雷特
FERET(面部识别技术数据库)是一个综合图像数据集,包含超过 14,000 张带注释的人脸图像。
手写识别:
对象检测:
可可女士
MS COCO 或 Common Objects in Context 是一个对象检测和字幕数据集。
它拥有超过 328,000 张具有关键点检测、多对象检测、字幕和分割掩码注释的图像。 它带有 80 个对象类别和每个图像五个标题。
龙生
LSUN 是大规模场景理解的缩写,在 20 个对象和 10 个场景类别中拥有超过一百万个标记图像。 一些类别有接近 300,000 张图像,其中 300 张图像专门用于验证,1000 张图像用于测试数据。
家庭物品
Home Objects 数据集包含来自房子周围(厨房、客厅和浴室)的随机对象的注释图像。 该数据集还包含一些带注释的视频和 398 张用于测试的未注释照片。
汽车:
城市景观数据集
Cityscape 是查找从几个城市的街景中记录的各种视频序列时要使用的数据集。 这些图像是在不同的天气和光照条件下长时间拍摄的。 注释适用于 30 类图像,分为 XNUMX 个不同类别。
巴克利深驱动
Barkley DeepDrive 专为自动驾驶车辆训练而设计,拥有超过 100 万个带注释的视频序列。 根据不断变化的道路和驾驶条件,它是自动驾驶汽车最有用的训练数据之一。
马普利亚
Mapillary 在全球拥有超过 750 亿个街景和交通标志,这对于训练机器学习和 AI 算法中的视觉感知模型非常有用。 它允许您开发满足各种照明和天气条件和观点的自动驾驶汽车。
医学影像:
Covid-19 开放研究数据集
这个原始数据集有大约 6500 个关于 AP/PA 胸部 X 射线的像素多边形肺分割。 此外,还提供了 517 张 Covid-19 患者 X 光片的图像,其标签包含姓名、位置、入院细节、结果等。
100,000 次胸部 X 光片的 NIH 数据库
NIH 数据库是最广泛的公开可用数据集之一,其中包含 100,000 张胸部 X 光图像和对科学和研究界有用的相关数据。 它甚至有晚期肺部疾病患者的图像。
数字病理学地图集
Atlas of Digital Pathology 提供了多个组织病理学补丁图像,总共超过 17,000 个,来自近 100 个不同器官的注释幻灯片。 该数据集可用于开发计算机视觉和模式识别软件。
场景识别:
室内场景识别
Indoor Scene Recognition 是一个高度分类的数据集,包含近 15620 张物体和室内风景图像,可用于机器学习和数据训练。 它有超过 65 个类别,每个类别至少有 100 张图像。
x视图
作为最著名的公开数据集之一,xView 包含来自各种复杂和大型场景的大量带注释的俯视图像。 该数据集拥有大约 60 个类和超过一百万个对象实例,其目的是使用卫星图像提供更好的救灾服务。
地方
麻省理工学院提供的数据集 Places 拥有来自 1.8 个不同场景类别的超过 365 万张图像。 每个类别中大约有 50 张图像用于验证,900 张图像用于测试。 学习深度场景特征以建立场景识别或视觉识别任务是可能的。
娱乐:
IMDB WIKI 数据集
IMDB – Wiki 是最受欢迎的公共面孔数据库之一,其中包含充分标记年龄、性别和姓名的面孔。 它还拥有大约 20 万张名人面孔和 62 万张来自维基百科的面孔。
名人面孔
Celeb Faces 是一个大型数据库,包含 200,000 张带注释的名人图像。 这些图像带有背景噪声和姿势变化,这使得它们对于训练计算机视觉任务中的测试集很有价值。 它对于在面部识别、编辑、面部局部定位等方面实现更高的准确性非常有益。
现在您拥有大量开源图像数据集来为您的人工智能机器提供动力。 您的 AI 和机器学习模型的结果主要取决于您提供和训练它们的数据集的质量。 如果您希望您的 AI 模型做出准确的预测,它需要经过聚合、标记和标记的高质量数据集。 为了扩大您的计算机视觉系统的成功,您必须使用与您的项目愿景相关的高质量图像数据库。 如果您正在寻找更多这样的数据集 了解更多