卡纳达语数据集

ಕನ್ನಡಡೇಟಾಸೆಟ್

适用于人工智能和语音模型的高质量卡纳达语呼叫中心、一般对话、脚本独白和媒体(播客)数据集

概述

标题(语言)

卡纳达语数据集

数据集类型

呼叫中心、一般对话、媒体数据、脚本独白

国家

印度

描述

该数据集包括非脚本的合成代理与客户电话对话(5-15 分钟)、可授权的公共领域音频或视频文件(例如有 1 至 5 名参与者的访谈和播客)(15-60 分钟)以及单个说话者提供预定义内容以用于训练和评估语音和语言模型的脚本独白。

用例

ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模

数据集详细信息

数据集类型 采样频率 演讲者 频道 全部小时数 演讲者总数
呼叫中心 8kHz 2音箱 双重 59:57:02 494
呼叫中心 16kHz 2音箱 Mono 195:26:56 9,504
一般对话 8kHz 2音箱 双重 141:27:15 424
媒体数据 16kHz 多个扬声器 Mono 14:19:52 124
脚本独白 24kHz 单扬声器 Mono 500:00:00 在请求

特色客户

赋能团队打造世界领先的人工智能产品。

Amazon
Google
Microsoft
赛普联系我们

不能找到你想要的?

正在收集所有数据类型的新现成数据集

立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧

  • 此字段是为了进行验证,并应保持不变。
  • 通过注册,我同意 Shaip 隐私政策服务条款 并同意接受来自 Shaip 的 B2B 营销传播。