我们最擅长的
人工智能数据服务
数据收集 创建全球音频、图像、文本和视频。
数据注释和标签准确注释让 AI/ML 思考更快
数据去标识化保护敏感信息,保护隐私
其他面条
医疗保健AI 将复杂的数据转化为可行的见解。
对话式AI 使用多语言数据集本地化语音模型。
计算机视觉 一流的视觉训练数据
生成式人工智能使用我们的优质训练数据为您的 Gen AI 提供动力。
现成的数据目录和许可
医疗数据集黄金标准,去识别化数据
医生听写数据集
转录病历
电子健康记录(EHR)
CT 扫描图像数据集
X 射线图像数据集
查看相关房源
计算机视觉数据集用于 ML 开发的图像和视频数据
银行对账单数据集
损坏的汽车图像数据集
面部识别数据集
地标图像数据集
工资单数据集
语音/音频数据集以 50 多种语言转录和注释数据。
纽约英语
中国传统文化
西班牙语
加拿大法语
阿拉伯语
TTS
醒来的话
呼叫中心
脚本独白
一般对话
媒体音频
自发对话
自发 IVR
歌唱音频
解决方案
产业应用
电子商务网站 提高转化率、订单价值和收入
Retail / 零售 标记数据以增强店内产品搜索
使用案例
命名实体识别提取非结构化数据中的关键信息
人脸识别 通过面部标志自动检测面部
图像标注服务通过图像注释增强人工智能
文本转语音 (TTS) 增强与全球 TTS 数据集的交互
内容审核服务 提升人工智能信任度和品牌声誉
光学字符识别(OCR) 以数字方式优化数据
查看 Al
访问高质量的综合银行对账单、支票和工资单数据集,以进行准确的 AI/ML 模型训练
合成银行支票
使用案例: OCR
格式: 。JPG
算: 2023
注解: 没有
描述: 银行支票数据集 (Document AI):合成银行支票由人工生成的支票图像组成,旨在复制真实支票的外观和内容。它包括收款人姓名、金额、日期、签名和支票号码等各种元素。该数据集用于训练和评估 Document AI 系统在光学字符识别 (OCR)、支票处理和自动数据提取等任务中的性能,为模型开发提供受控环境,而无需担心真实支票的隐私问题。
录音条件: - 单击的图像 - 扫描的 - 网络抓取工具
合成银行对账单
格式: .jpg, PNG
算: 5366
描述: 银行对账单数据集 (Document AI):合成银行对账单包括人工生成的银行对账单,旨在模拟真实的财务文件。它包含各种交易记录、日期、金额和账户详细信息,其结构化以反映真实世界的格式和内容。该数据集用于训练和评估 Document AI 系统在光学字符识别 (OCR)、数据提取和文档分析等任务中的性能,提供受控环境,而不存在实际财务数据的隐私问题。
录音条件: - 已扫描 - Bank_Statement - Web 抓取工具
边界框+文本
格式: 图片
算: 6k
注解: Yes
描述: 中国票据数据集包含各种票据的图片或文本样本,例如以中文书写的发票、收据和对账单。它具有多种格式和内容,包括项目描述、金额和日期。此数据集用于光学字符识别 (OCR)、财务文档处理和自动数据提取等任务。
算: 2010
描述: 工资单数据集 (Document AI):合成工资单由人工生成的工资单图像组成,没有任何注释。它具有各种工资单格式和详细信息,例如员工姓名、工资和日期,用于训练和测试 Document AI 系统执行 OCR 和文档处理等任务。
录音条件: - 已扫描 - 网页抓取
使用案例: 文档 AI
格式: HEIC(图像)和 .mov(视频)
算: 23930
描述: 日语、韩语和俄语的带有手写文本的实时照片
录音设备: iPhone 和 iPad 相机
录音条件: - 强光/眩光 - 相机闪光灯开启 - 彩色光 - 弱光,无相机闪光灯 - 正常