我们最擅长的
人工智能数据服务
数据收集 创建全球音频、图像、文本和视频。
数据注释和标签准确注释让 AI/ML 思考更快
数据去标识化保护敏感信息,保护隐私
其他面条
医疗保健AI 将复杂的数据转化为可行的见解。
对话式AI 使用多语言数据集本地化语音模型。
计算机视觉 一流的视觉训练数据
生成式人工智能使用我们的优质训练数据为您的 Gen AI 提供动力。
现成的数据目录和许可
医疗数据集黄金标准,去识别化数据
医生听写数据集
转录病历
电子健康记录(EHR)
CT 扫描图像数据集
X 射线图像数据集
查看相关房源
计算机视觉数据集用于 ML 开发的图像和视频数据
银行对账单数据集
损坏的汽车图像数据集
面部识别数据集
地标图像数据集
工资单数据集
语音/音频数据集以 50 多种语言转录和注释数据。
纽约英语
中国传统文化
西班牙语
加拿大法语
阿拉伯语
TTS
醒来的话
呼叫中心
脚本独白
一般对话
媒体音频
自发对话
自发 IVR
歌唱音频
解决方案
产业应用
电子商务网站 提高转化率、订单价值和收入
Retail / 零售 标记数据以增强店内产品搜索
使用案例
命名实体识别提取非结构化数据中的关键信息
人脸识别 通过面部标志自动检测面部
图像标注服务通过图像注释增强人工智能
文本转语音 (TTS) 增强与全球 TTS 数据集的交互
内容审核服务 提升人工智能信任度和品牌声誉
光学字符识别(OCR) 以数字方式优化数据
查看 Al
使用一流的工业机器图像和视频数据集增强 AI 模型。
边界框、关键点
使用案例: 汽车关键点识别数据集
格式: 图片
算: 25k
注解: Yes
描述: “汽车关键点识别数据集”专为视觉娱乐和自动驾驶应用而设计,包含一组分辨率为 640 x 512 像素的互联网采集图像。该数据集使用边界框来识别目标汽车,并标注每辆车上的 14 个关键点,包括四个顶部点、四个车灯、四个车轮以及前部和左侧的玻璃区域,为汽车建模和识别任务提供详细数据。
语义分割
使用案例: 损坏电路板部件分割数据集
算: 1,000
描述: “损坏的木板部件分割数据集”是专门为制造业(尤其是木材和木板生产)量身定制的利基集合。它包含从互联网收集的高分辨率图像,分辨率从 3024 x 4032 到 2048 x 5750 像素不等。该数据集专注于对各种类型的木板损坏(包括裂缝、虫害和腐烂)进行语义分割,以协助质量控制和制造流程。
使用案例: 保险索赔流程
格式: avi、mkv、mov、mp4、mp5
算: 48366
注解: 没有
描述: 360 度以正常、稳定的速度四处走动损坏的汽车视频,顶部和底部始终可见 损坏:长度大于高尔夫球的划痕、凹痕、叮当声或裂缝 外板损坏:保险杠、挡泥板、四分之一面板、门、引擎盖和行李箱 位置:亚洲、美国、加拿大和欧洲
录音设备: 移动照相机
录音条件: 混合照明条件
格式: 。JPG
算: 3958
描述: 490 多辆汽车和 3958 张汽车照片,其中包含受损汽车的注释图像(以及元数据)。涵盖汽车的所有侧面(每辆车 8 张照片)- 保险索赔流程用例。
分类
使用案例: 工业金属冶炼火焰分类
算: 41k
描述: “工业金属冶炼火焰分类数据集”是专为工业领域设计的数据集,包含通过互联网采集的金属冶炼火焰图像,分辨率为 350 x 350 像素。该数据集专门用于将火焰图像分为 10 个类别,包括过度曝光、黑烟、火团、火花和不同强度的跳渣和飞溅,为监控和优化冶炼过程提供重要数据。
二元分割
使用案例: 机器零件缺陷分割数据集
算: 120k
描述: “机器零件缺陷分割数据集”专为制造业设计,由互联网收集的图像组成,所有图像的分辨率均为 1000 x 1000 像素。该数据集专注于二元分割,以识别机器零件上的白色缺陷,提供清晰的注释,突出显示质量控制和检查流程关注的区域。
语义分割、多边形、关键点
使用案例: 机器零件分割数据集
算: 2.3k
描述: “机械零件分割数据集”是专为制造业量身定制的数据集,包含一组分辨率为 2048 x 1536 像素的互联网采集图像。该数据集专门用于语义分割、多边形和关键点标注,重点关注机械零件 X 射线图像中加工位置的轮廓标注,以促进制造过程中的精确分析和检查。
多边形、边界框
使用案例: 铁路线标记数据集
算: 3k
描述: “铁路线标注数据集”专为工业应用而定制,包含一组分辨率为 1920 x 1080 像素的互联网收集图像。该数据集专门使用多边形注释对铁路线进行详细标注,包括其转弯和合并。此外,这些图像中的火车用边界框标记。该数据集专门关注从武汉收集的铁路网络,为铁路线分析和火车检测提供本地化背景。