印地语数据集
हिंदीडेटासेट
一般对话
媒体音频数据
脚本独白
一般对话
概述
选项
印地语 语言数据集
数据集类型
一般对话
产品描述
两个人之间的即兴电话交谈。 约音频持续时间(范围)– 15-60 分钟。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
数据集详细信息
全部小时数
40
采样率
8kHz
音频频道
双重
录音平台
桌面版
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
印度
语言
印地语
性别
女30,男49,未知0
使用者数量
79
年龄
18 - 50
媒体音频数据
概述
产品描述
可许可的公共领域音频/视频文件,例如访谈、播客等 – 1 至 5 人。 约音频持续时间(范围)15-60 分钟。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
数据集详细信息
全部小时数
219
采样率
16kHz
音频频道
黑白
录音平台
网络采购
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
印度
语言
印地语
性别
女83,男309,未知0
使用者数量
392
年龄
18 - 50
脚本独白
数据集详细信息
全部小时数
2,867
采样率
48kHz
音频频道
黑白
录音平台
移动应用
音频格式
WAV。
转录格式
.json
WER(%)
5
数据集人口统计
国家
印度
语言
印地语
性别
女1977,男1864,未知147
使用者数量
3,988
年龄
18 - 50
特色客户
赋能团队打造世界领先的人工智能产品。
不能找到你想要的?
正在收集所有数据类型的新现成数据集
立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧