标题(语言)
阿拉伯语语言数据集
数据集类型
呼叫中心、一般对话、音乐、脚本独白
国家
阿拉伯语
描述
该数据集包括非脚本合成代理与客户之间的电话对话(5-15 分钟)、海湾阿拉伯语的自然人与人之间的电话对话(15-60 分钟)以及带有转录的歌唱音频,为训练和评估语音和语言技术提供了多样化的语音数据。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
| 数据集类型 | 采样频率 | 演讲者 | 频道 | 全部小时数 | 演讲者总数 |
|---|---|---|---|---|---|
| 呼叫中心 | 8kHz | 2音箱 | 双重 | 62:52:19 | 在请求 |
| 呼叫中心 | 8kHz | 2音箱 | Mono | 1,025:09:19 | 在请求 |
| 一般对话 | 8kHz | 2音箱 | 双重 | 254:16:34 | 626 |
| 音乐 | 48kHz | 单扬声器 | Mono | 03:17:21 | 10 |
| 脚本独白 | 48kHz | 单扬声器 | Mono | 4,249:00:00 | 2,125 |
| 脚本独白 | 24kHz | 单扬声器 | Mono | 2,300:00:00 | 在请求 |
赋能团队打造世界领先的人工智能产品。
立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧