马来语数据集
设置数据马来语
一般对话数据
媒体音频数据
一般对话数据
概述
标题
马来语 语言数据集
数据集类型
一般对话
课程描述
两个人之间的即兴电话交谈。 约音频时长(范围)——15-60 分钟,马来西亚马来语。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
数据集详细信息
全部小时数
266
采样率
8kHz
音频频道
双重
录音平台
桌面版
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
马来语
语言
马来语
性别
女316,男176,未知0
使用者数量
492
年龄
18-50
媒体音频数据
概述
标题
马来语 语言数据集
数据集类型
媒体音频
课程描述
可许可的公共领域音频/视频文件,例如访谈、播客等 – 1 至 5 人。 约音频持续时间(范围)15-60 分钟。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
数据集详细信息
全部小时数
344
采样率
16kHz
音频频道
Mono
录音平台
网络采购
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
马来语
语言
马来语
性别
女236,男626,未知47
使用者数量
909
年龄
18-50
特色客户
赋能团队打造世界领先的人工智能产品。
不能找到你想要的?
正在收集所有数据类型的新现成数据集
立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧