多格里数据集
多格里数据集
一般对话数据
TTS
一般对话数据
概述
标题
多格里语言数据集
数据集类型
一般对话
课程描述
“说话者 1”和“说话者 2”之间的即兴合成电话对话,音频持续时间(范围)大约为 5-15 分钟。
用例
政治、时事、地方新闻、宗教、经济金融、旅游
数据集详细信息
全部小时数
50
采样率
44kHz
音频频道
Mono
录音平台
移动应用
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
印度
语言
多格里
年龄
18-50
TTS
概述
标题
多格里语言数据集
数据集类型
TTS
课程描述
单句录音,往往在 5 到 30 秒范围内。
用例
政治、时事、地方新闻、宗教、经济金融、旅游
数据集详细信息
全部小时数
200
采样率
16kHz
音频频道
Mono
录音平台
移动应用
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
印度
语言
多格里
年龄
18-50
特色客户
赋能团队打造世界领先的人工智能产品。
不能找到你想要的?
正在收集所有数据类型的新现成数据集
立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧