银行支票数据集(文档 AI)

银行支票数据集(文档 AI)

使用案例: OCR

格式: 。JPG

算: 2023

注解: 没有

X

描述: 银行支票数据集 (Document AI):合成银行支票由人工生成的支票图像组成,旨在复制真实支票的外观和内容。它包括收款人姓名、金额、日期、签名和支票号码等各种元素。该数据集用于训练和评估 Document AI 系统在光学字符识别 (OCR)、支票处理和自动数据提取等任务中的性能,为模型开发提供受控环境,而无需担心真实支票的隐私问题。

录音条件: - 单击的图像 - 扫描的 - 网络抓取工具

银行对账单数据集(文档 AI)

银行对账单数据集(文档 AI)

使用案例: OCR

格式: .jpg, PNG

算: 5366

注解: 没有

X

描述: 银行对账单数据集 (Document AI):合成银行对账单包括人工生成的银行对账单,旨在模拟真实的财务文件。它包含各种交易记录、日期、金额和账户详细信息,其结构化以反映真实世界的格式和内容。该数据集用于训练和评估 Document AI 系统在光学字符识别 (OCR)、数据提取和文档分析等任务中的性能,提供受控环境,而不存在实际财务数据的隐私问题。

录音条件: - 已扫描 - Bank_Statement - Web 抓取工具

中国票据数据集

中国票据数据集

使用案例: OCR

格式: 图片

算: 6k

注解:

X

描述: 中国票据数据集包含各种票据的图片或文本样本,例如以中文书写的发票、收据和对账单。它具有多种格式和内容,包括项目描述、金额和日期。此数据集用于光学字符识别 (OCR)、财务文档处理和自动数据提取等任务。

文档/OCR – 阿拉伯语和英语 OCR 内容数据集

文档/OCR – 阿拉伯语和英语 OCR 内容数据集

使用案例: 文件/OCR

格式: 图像优化

算: 1,321

注解: 没有

X

描述: 阿拉伯语和英语内容图像集:用于 OCR 的图像 + 注释

文档/OCR – 条形码视频数据集

文档/OCR – 条形码视频数据集

使用案例: 文件/OCR

格式: 视频

算: 2,767

注解: 没有

X

描述: 条形码视频(Code128、UPC/EAN、PDF417、Aztec、多码)

文档/OCR – 曲面印刷文本数据集

文档/OCR – 曲面印刷文本数据集

使用案例: 文件/OCR

格式: 图像优化

算: 18,986

注解: 没有

X

描述: 弯曲的印刷文字:收集带有弯曲文字的图像,或带有非线性基线的文字

文件/OCR – 财务文件(银行、工资单、税务、美国)

文件/OCR – 财务文件(银行、工资单、税务、美国)

使用案例: 文件/OCR

格式: 图像优化

算: 26,446

注解: 没有

X

描述: 财务文件:银行对账单、支票、工资单、税单、抵押贷款、保险索赔(美国)

文件/OCR – 财务文件(第一阶段 – 抵押贷款)

文件/OCR – 财务文件(第一阶段 – 抵押贷款)

使用案例: 文件/OCR

格式: 图像优化

算: 9,192

注解: 没有

X

描述: 财务文件(第一阶段)抵押数据集——打印、扫描、拍照

文件/OCR – 财务文件(第 2 阶段 – 保险)

文件/OCR – 财务文件(第 2 阶段 – 保险)

使用案例: 文件/OCR

格式: 图像优化

算: 7,636

注解: 没有

X

描述: 财务文件(第 2 阶段)保险数据集 – 打印、扫描、拍照

文档/OCR – 手写文本数据集(日本/韩国/俄罗斯)

文档/OCR – 手写文本数据集(日本/韩国/俄罗斯)

使用案例: 文件/OCR

格式: 图像优化

算: 106,313

注解: 没有

X

描述: 手写文字:带有手写文字的 LivePhotos(日语、韩语、俄语)

文档/OCR – 带有边界框注释的发票数据集

文档/OCR – 带有边界框注释的发票数据集

使用案例: 文件/OCR

格式: 图像优化

算: 87

注解:

X

描述: 带有边界框注释的发票数据集包括扫描或数字发票,其中发票号码、日期、供应商详细信息、行项目和总金额等关键字段都用边界框标记,使 AI 模型能够准确地从非结构化文档中检测和提取结构化信息。

文档 / OCR – 带有印刷文本的 LivePhotos(日本/韩国/俄罗斯)

文档 / OCR – 带有印刷文本的 LivePhotos(日本/韩国/俄罗斯)

使用案例: 文件/OCR

格式: 图像优化

算: 4,944

注解: 没有

X

描述: 带有印刷文字的 LivePhotos(日语、韩语、俄语)

文档/OCR – 多语言收据/发票数据集

文档/OCR – 多语言收据/发票数据集

使用案例: 文件/OCR

格式: 图像优化

算: 8,961

注解: 没有

X

描述: 多语言收据和发票数据集包含多种语言的多样化财务文件,使 AI 模型能够训练跨语言文本识别、关键字段提取和文档理解。

文件/OCR – 合成银行对账单(40 个模板)

文件/OCR – 合成银行对账单(40 个模板)

使用案例: 文件/OCR

格式: 图像优化

算: 1,290

注解: 没有

X

描述: 银行对账单 - 唯一模板 - 40:综合银行对账单

文件/OCR – 合成工资单(60 个模板)

文件/OCR – 合成工资单(60 个模板)

使用案例: 文件/OCR

格式: 图像优化

算: 2,010

注解: 没有

X

描述: 支票 - 独特模板 - 60:合成工资单

文件/OCR – 合成工资单(130 个模板)

文件/OCR – 合成工资单(130 个模板)

使用案例: 文件/OCR

格式: 图像优化

算: 2,023

注解: 没有

X

描述: 工资单 - 独特模板 - 130:合成银行支票

工资单数据集(文档 AI)

工资单数据集(文档 AI)

使用案例: OCR

格式: 。JPG

算: 2010

注解: 没有

X

描述: 工资单数据集 (Document AI):合成工资单由人工生成的工资单图像组成,没有任何注释。它具有各种工资单格式和详细信息,例如员工姓名、工资和日期,用于训练和测试 Document AI 系统执行 OCR 和文档处理等任务。

录音条件: - 已扫描 - 网页抓取