阿拉伯语 & 泰语 & 越南语 & 印地语 & 英语 & 中文语言数据集

边界框+文本

阿拉伯语 & 泰语 & 越南语 & 印地语 & 英语 & 中文语言数据集

使用案例: OCR

格式: 图片

算: 150k

注解: Yes

X

描述: 阿拉伯语 & 泰语 & 越南语 & 印地语 & 英语 & 中文语言数据集

阿拉伯语文本数据集

边界框+文本

阿拉伯语文本数据集

使用案例: OCR

格式: 图片

算: 1k

注解: Yes

X

描述: 阿拉伯语文本数据集包含用阿拉伯语编写的文本样本集合。它包括各种形式的内容,例如新闻文章、社交媒体帖子、文学和对话,涵盖不同的主题和写作风格。此数据集用于阿拉伯语应用程序中的自然语言处理 (NLP)、文本分类、情感分析和机器翻译等任务。

汉语 & 英文 & 藏语 & 维吾尔语数据集

边界框+文本

汉语 & 英文 & 藏语 & 维吾尔语数据集

使用案例: OCR

格式: 图片

算: 38k

注解: Yes

X

描述: 汉语 & 英文 & 藏语 & 维吾尔语数据集

中英文菜单数据集

边界框+文本

中英文菜单数据集

使用案例: OCR

格式: 图片

算: 60k

注解: Yes

X

描述: 中英文菜单数据集包含中英文餐厅菜单的图片或文本样本。它包括各种字体、布局和菜单结构,显示双语菜名、描述和价格。此数据集可用于光学字符识别 (OCR)、机器翻译和多语言环境下的菜单数字化等任务。

中文手写作文数据集

边界框+文本

中文手写作文数据集

使用案例: OCR

格式: 图片

算: 3k

注解: Yes

X

描述: 中文手写作文数据集包含手写中文文本样本,包括作文、短文和其他长篇文本。它具有各种笔迹和复杂程度,可用于手写识别、文本分析和机器学习模型训练等任务。

中文WIFI提示数据集

边界框+文本

中文WIFI提示数据集

使用案例: OCR

格式: 图片

算: 1k

注解: Yes

X

描述: 中文 WIFI 提示数据集由 WIFI 提示和登录屏幕中的中文文本样本组成。它通常包括与连接或管理 WIFI 网络相关的各种提示、说明和错误消息。此数据集用于文本识别、自然语言处理和改进网络连接用户界面等任务。

中英文手写数据集

边界框+文本

中英文手写数据集

使用案例: OCR

格式: 图片

算: 12k

注解: Yes

X

描述: 英文和中文手写数据集包含英文和中文的手写样本,展示了各种书写风格和字符复杂性。它通常用于训练和评估手写识别模型、支持多语言文本分析和其他相关研究。该数据集包含两种语言的各种字符、数字、单词和句子。

英文和中文店牌数据集

边界框+文本

英文和中文店牌数据集

使用案例: OCR

格式: 图片

算: 30k

注解: Yes

X

描述: 英文和中文店标数据集包含带有英文和中文文本的店标图像。它捕获各种标牌元素,例如商店名称、广告、促销和路线,以不同的字体、样式和格式显示。此数据集用于文本检测和识别、多语言场景理解以及改进用于解释双语标牌的计算机视觉模型等任务。

英汉特殊角度文本数据集

边界框+文本

英汉特殊角度文本数据集

使用案例: OCR

格式: 图片

算: 50k

注解: Yes

X

描述: 英文和中文特殊角度文本数据集包含以各种角度和方向显示的英文和中文文本图像。它包括来自标志、广告和文档等非标准水平格式的文本。此数据集用于训练和评估文本检测和识别模型,特别是那些能够处理非传统方向和视角文本的模型。

英文菜單數據集

边界框+文本

英文菜單數據集

使用案例: OCR

格式: 图片

算: 20k

注解: Yes

X

描述: 英文菜单数据集包含用英文书写的餐厅菜单的图片或文本样本。它具有各种字体、布局和格式样式,内容包括菜品名称、描述和价格。此数据集通常用于食品相关应用中的光学字符识别 (OCR)、文本提取和菜单数字化等任务。

英文场景文本数据集

边界框+文本

英文场景文本数据集

使用案例: OCR

格式: 图片

算: 33k

注解: Yes

X

描述: 英语场景文本数据集由包含嵌入英语文本的自然场景的图像组成。文本以各种形式出现,例如标志、广告牌和海报,通常采用不同的字体、大小和方向。此数据集通常用于训练和测试文本检测、识别和场景理解任务中的模型。

手写文本数据集

手写文本数据集

使用案例: 文档 AI

格式: HEIC(图像)和 .mov(视频)

算: 94053

注解: 没有

X

描述: 日语、韩语和俄语的带有手写文本的实时照片

录音设备: iPhone 和 iPad 相机

录音条件: - 强光/眩光 - 相机闪光灯开启 - 彩色光 - 弱光,无相机闪光灯 - 正常

日韩语言数据集

边界框+文本

日韩语言数据集

使用案例: OCR

格式: 图片

算: 40k

注解: Yes

X

描述: 日语和韩语数据集包含日语和韩语的文本样本。它包含句子、短语和单词等一系列内容,涵盖各种上下文和风格。此数据集用于多语言应用程序中的自然语言处理 (NLP)、机器翻译和文本分析等任务。