阿拉伯数据集

阿尔巴尼亚 阿尔巴尼亚

适用于人工智能和语音模型的高质量阿拉伯语通用对话和文本转语音 (TTS)

概述

标题(语言)

阿拉伯语语言数据集

数据集类型

呼叫中心、一般对话、音乐、脚本独白

国家

阿拉伯语

描述

该数据集包括非脚本合成代理与客户之间的电话对话(5-15 分钟)、海湾阿拉伯语的自然人与人之间的电话对话(15-60 分钟)以及带有转录的歌唱音频,为训练和评估语音和语言技术提供了多样化的语音数据。

用例

ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模

数据集详细信息

数据集类型 采样频率 演讲者 频道 全部小时数 演讲者总数
呼叫中心 8kHz 2音箱 双重 62:52:19 在请求
呼叫中心 8kHz 2音箱 Mono 1,025:09:19 在请求
一般对话 8kHz 2音箱 双重 254:16:34 626
音乐 48kHz 单扬声器 Mono 03:17:21 10
脚本独白 48kHz 单扬声器 Mono 4,249:00:00 2,125
脚本独白 24kHz 单扬声器 Mono 2,300:00:00 在请求

特色客户

赋能团队打造世界领先的人工智能产品。

Amazon
Google
Microsoft
赛普联系我们

不能找到你想要的?

正在收集所有数据类型的新现成数据集

立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧

  • 此字段是为了进行验证,并应保持不变。
  • 通过注册,我同意 Shaip 隐私政策服务条款 并同意接受来自 Shaip 的 B2B 营销传播。