丹麦数据集
丹麦数据
一般对话
媒体音频数据
脚本独白
一般对话
媒体音频数据
概述
产品描述
可许可的公共领域音频/视频文件,例如访谈、播客等 – 1 至 5 人。 约音频持续时间(范围)15-60 分钟。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
数据集详细信息
全部小时数
664
采样率
16kHz
音频频道
黑白
录音平台
网络采购
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
丹麦
语言
丹麦语
性别
女369,男864,未知27
使用者数量
1,260
年龄
18 - 50
脚本独白
概述
产品描述
单句录音,往往在 5 到 30 秒范围内,来自丹麦的丹麦语。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
数据集详细信息
全部小时数
2,579
采样率
48kHz
音频频道
黑白
录音平台
移动应用
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
丹麦
语言
丹麦语
性别
女1551,男1233,未知42
使用者数量
2,826
年龄
18 - 50
特色客户
赋能团队打造世界领先的人工智能产品。
不能找到你想要的?
正在收集所有数据类型的新现成数据集
立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧