马拉雅拉姆语数据集
മലയാളംഡാറ്റാസെറ്റ്
适用于 AI 和语音模型的高质量马拉雅拉姆语呼叫中心、一般对话和播客数据集
呼叫中心数据
一般对话数据
播客数据
呼叫中心数据
概述
檔案/文件名称
马拉雅拉姆语 语言数据集
数据集类型
呼叫中心
描述
“代理”和“客户”之间的无脚本合成电话对话,大约音频持续时间(范围)5-15 分钟。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
数据集详细信息
全部小时数
60
采样率
8 Khz
音频频道
双重
录音平台
桌面
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
印度
语言
马拉雅拉姆语
性别
男性:421,女性:119,未知:0
使用者数量
540
年龄
18-50
一般对话数据
概述
檔案/文件名称
马拉雅拉姆语 语言数据集
数据集类型
一般对话
描述
“代理”和“客户”之间的无脚本合成电话对话,大约音频持续时间(范围)5-15 分钟。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
数据集详细信息
全部小时数
100
采样率
8 Khz
音频频道
双重
录音平台
桌面
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
印度
语言
马拉雅拉姆语
性别
男性:222,女性:80,未知:0
使用者数量
302
年龄
18-50
播客数据
概述
檔案/文件名称
马拉雅拉姆语 语言数据集
数据集类型
播客
描述
可许可的公共领域音频/视频文件,例如访谈、播客等 – 1 至 5 人。 约音频持续时间(范围)15-60 分钟。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
数据集详细信息
全部小时数
40
采样率
16 Khz
音频频道
Mono
录音平台
网络采购
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
印度
语言
马拉雅拉姆语
性别
男性:53,女性:26,未知:0
使用者数量
79
年龄
18-50
特色客户
赋能团队打造世界领先的人工智能产品。

不能找到你想要的?
正在收集所有数据类型的新现成数据集
立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧