标题(语言)
卡纳达语数据集
数据集类型
呼叫中心、一般对话、媒体数据、脚本独白
国家
印度
描述
该数据集包括非脚本的合成代理与客户电话对话(5-15 分钟)、可授权的公共领域音频或视频文件(例如有 1 至 5 名参与者的访谈和播客)(15-60 分钟)以及单个说话者提供预定义内容以用于训练和评估语音和语言模型的脚本独白。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
| 数据集类型 | 采样频率 | 演讲者 | 频道 | 全部小时数 | 演讲者总数 |
|---|---|---|---|---|---|
| 呼叫中心 | 8kHz | 2音箱 | 双重 | 59:57:02 | 494 |
| 呼叫中心 | 16kHz | 2音箱 | Mono | 195:26:56 | 9,504 |
| 一般对话 | 8kHz | 2音箱 | 双重 | 141:27:15 | 424 |
| 媒体数据 | 16kHz | 多个扬声器 | Mono | 14:19:52 | 124 |
| 脚本独白 | 24kHz | 单扬声器 | Mono | 500:00:00 | 在请求 |
赋能团队打造世界领先的人工智能产品。
立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧