阿拉伯数据集

阿尔巴尼亚 阿尔巴尼亚

用于人工智能和语音模型的高质量阿拉伯语一般对话和播客数据集

概述

职位名称

阿拉伯语语言数据集

数据集类型

一般对话

描述

两个人之间的即兴电话交谈。 约音频时长(范围)——15-60 分钟,来自海湾国家的阿拉伯语。

用例

ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模

数据集详细信息

全部小时数

292

采样率

8kHz

音频频道

双重

录音平台

桌面版

音频格式

WAV。

转录格式

.json

WER(%)

5

数据集人口统计

国家

阿拉伯语

Language

阿拉伯语

性别

女 838 男 1209 未知 78

使用者数量

706

年龄

18-50岁

概述

职位名称

阿拉伯语语言数据集

数据集类型

TTS

描述

单句录音,往往在 5 到 30 秒范围内。

用例

ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模

数据集详细信息

全部小时数

1,947

采样率

48kHz

音频频道

Mono

录音平台

移动应用程序

音频格式

WAV。

转录格式

.json

WER(%)

5

数据集人口统计

国家

阿拉伯语

Language

阿拉伯语

性别

女 838 男 1209 未知 78

使用者数量

2,125

年龄

18-50岁

特色客户

赋能团队打造世界领先的人工智能产品。

Amazon
Google
Microsoft
赛普联系我们

不能找到你想要的?

正在收集所有数据类型的新现成数据集

立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧

  • 通过注册,我同意 Shaip 隐私政策服务条款 并同意接受来自 Shaip 的 B2B 营销传播。
  • 此字段是为了进行验证,并应保持不变。