马拉雅拉姆语数据集

മലയാളംഡാറ്റാസെറ്റ്

用于人工智能和语音模型的高质量马拉雅拉姆语通用对话和播客数据集

概述

标题(语言)

马拉雅拉姆语数据集

数据集类型

一般对话、媒体(播客)数据

国家

印度

描述

该数据集包括代理和客户之间非脚本的合成电话对话(5-15 分钟)以及可授权的公共领域音频或视频文件,例如 1 至 5 名参与者的采访和播客(15-60 分钟)。

用例

ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模

数据集详细信息

数据集类型 采样频率 演讲者 频道 全部小时数 演讲者总数
一般对话 8kHz 2音箱 双重 70:46:30 576
一般对话 8kHz 2音箱 双重 149:39:33 296
媒体数据 16kHz 多个扬声器 Mono 12:39:24 81

特色客户

赋能团队打造世界领先的人工智能产品。

Amazon
Google
Microsoft
赛普联系我们

不能找到你想要的?

正在收集所有数据类型的新现成数据集

立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧

  • 此字段是为了进行验证,并应保持不变。
  • 通过注册,我同意 Shaip 隐私政策服务条款 并同意接受来自 Shaip 的 B2B 营销传播。