标题(语言)
马拉雅拉姆语数据集
数据集类型
一般对话、媒体(播客)数据
国家
印度
描述
该数据集包括代理和客户之间非脚本的合成电话对话(5-15 分钟)以及可授权的公共领域音频或视频文件,例如 1 至 5 名参与者的采访和播客(15-60 分钟)。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
| 数据集类型 | 采样频率 | 演讲者 | 频道 | 全部小时数 | 演讲者总数 |
|---|---|---|---|---|---|
| 一般对话 | 8kHz | 2音箱 | 双重 | 70:46:30 | 576 |
| 一般对话 | 8kHz | 2音箱 | 双重 | 149:39:33 | 296 |
| 媒体数据 | 16kHz | 多个扬声器 | Mono | 12:39:24 | 81 |
赋能团队打造世界领先的人工智能产品。
立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧