高质量的音频/语音/语音数据集来训练您的会话 AI 模型 

多种语言的现成语音/语音/音频数据集,可快速启动您的自动语音识别 (ASR) 模型

语音数据集

插入您今天缺少的音频数据目录

详细信息语言数据集采样率数据集类型总音频时数总演讲时数数据集描述音频频道录音平台WER(%)音频格式转录格式用例CTA
发言非裔美国人非裔美国人白话8kHz呼叫中心214211“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言非裔美国人非裔美国人白话16kHz媒体音频159149可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言南非荷兰语南非荷兰语8kHz一般对话368404两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,在非洲说南非荷兰语双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言南非荷兰语南非荷兰语16kHz媒体音频658615可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言阿拉伯语阿拉伯语8kHz一般对话293297两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,来自海湾国家的阿拉伯语双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言波士顿波士顿8kHz呼叫中心177175“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言波士顿波士顿8kHz一般对话3232两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, 双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言波士顿波士顿16kHz媒体音频9393可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言中文英文中文英文8kHz呼叫中心169130“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言中文英文中文英文16kHz媒体音频249236可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言丹麦语丹麦语8kHz一般对话372395两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, 双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言丹麦语丹麦语16kHz媒体音频664603可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言英语英语16kHz媒体音频109可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言英语深南英语深南8kHz呼叫中心151149“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言英语深南英语深南8kHz一般对话5656两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, 双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言英语深南英语深南16kHz媒体音频266248可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言希伯来语希伯来语8kHz一般对话399397两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,以色列希伯来语双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言希伯来语希伯来语16kHz媒体音频427400可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言印度英语印度英语8kHz呼叫中心208185“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言印度英语印度英语16kHz媒体音频216219可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言西班牙裔英语西班牙裔英语8kHz呼叫中心212209“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言西班牙裔英语西班牙裔英语16kHz媒体音频155150可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言印度英语印度英语16kHz媒体音频13787可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言印尼语印尼语8kHz一般对话496598两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,印尼语双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言印尼语印尼语16kHz媒体音频643610可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言爱尔兰语爱尔兰语8kHz一般对话192180两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, 双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言韩语韩语8kHz呼叫中心107103“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言韩语韩语16kHz媒体音频204197可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言马来语马来语8kHz一般对话266302两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,马来西亚马来语双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言马来语马来语16kHz媒体音频344305可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言新西兰英语 新西兰英语 8kHz一般对话148142两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, 双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言新西兰英语 新西兰英语 16kHz媒体音频400400可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言纽约英语纽约英语8kHz呼叫中心103103“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言纽约英语纽约英语8kHz一般对话107106两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, 双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言纽约英语纽约英语16kHz媒体音频140140可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言波兰语波兰语16kHz媒体音频269255可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言苏格兰的苏格兰的8kHz一般对话292267两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, 双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言新加坡英语新加坡英语8kHz呼叫中心218194“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言新加坡英语新加坡英语16kHz媒体音频247240可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言南非英语南非英语8kHz呼叫中心261204“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言南非英语南非英语16kHz媒体音频251245可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言西班牙语西班牙语16kHz媒体音频32可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言斯瓦希里斯瓦希里8kHz呼叫中心184165“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言斯瓦希里斯瓦希里8kHz呼叫中心4644“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言斯瓦希里斯瓦希里16kHz媒体音频203191可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言斯瓦希里斯瓦希里16kHz媒体音频6258可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言瑞典语瑞典语8kHz呼叫中心250224“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言瑞典语瑞典语16kHz媒体音频278255可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言泰卢固语泰卢固语8kHz一般对话553582两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, 双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言泰卢固语泰卢固语16kHz媒体音频648599可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言泰国人泰国人8kHz一般对话183201两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,朋友之间使用的非正式记录双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言泰国人泰国人16kHz媒体音频173167可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言越南语越南语8kHz一般对话295293“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,北部(例如,河内)、中部和南部(例如,胡志明市)。双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言越南语越南语16kHz媒体音频257248可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言威尔士语威尔士语8kHz一般对话278299“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言印度英语印度英语8kHz呼叫中心200200“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言泰卢固语 泰卢固语 NA呼叫中心3030“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言淡米尔文 淡米尔文 NA呼叫中心6060“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言卡纳达语 卡纳达语 NA呼叫中心6060“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言马拉雅拉姆语 马拉雅拉姆语 NA呼叫中心6060“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言孟加拉语 孟加拉语 NA呼叫中心6060“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言古吉拉特语 古吉拉特语 NA呼叫中心6060“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言马拉 马拉 NA呼叫中心6060“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言阿萨姆 阿萨姆 NA呼叫中心6060“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言奥里亚语 奥里亚语 NA呼叫中心6060“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言旁遮普 旁遮普 NA呼叫中心6060“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言泰卢固语 泰卢固语 NA一般对话5050“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言淡米尔文 淡米尔文 NA一般对话100100“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言卡纳达语 卡纳达语 NA一般对话100100“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言马拉雅拉姆语 马拉雅拉姆语 NA一般对话100100“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言孟加拉语 孟加拉语 NA一般对话100100“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言古吉拉特语 古吉拉特语 NA一般对话100100“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言马拉 马拉 NA一般对话100100“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言阿萨姆 阿萨姆 NA一般对话100100“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言奥里亚语 奥里亚语 NA一般对话100100“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言旁遮普 旁遮普 NA一般对话100100“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言泰卢固语 泰卢固语 NA媒体音频2020可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言淡米尔文 淡米尔文 NA媒体音频4040可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言卡纳达语 卡纳达语 NA媒体音频4040可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言马拉雅拉姆语 马拉雅拉姆语 NA媒体音频4040可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言孟加拉语 孟加拉语 NA媒体音频4040可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言古吉拉特语 古吉拉特语 NA媒体音频4040可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言马拉 马拉 NA媒体音频4040可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言阿萨姆 阿萨姆 NA媒体音频4040可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言奥里亚语 奥里亚语 NA媒体音频4040可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言旁遮普旁遮普NA媒体音频4040可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟NA桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言英语美国英语美国48kHz脚本独白54单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言西班牙语 西班牙西班牙语 西班牙48kHz脚本独白108单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言墨西哥人墨西哥人48kHz脚本独白1,4921,228单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言加拿大加拿大48kHz脚本独白1,2221,049单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言NederlandNederland48kHz脚本独白1,2051,021单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言波兰语 波兰波兰语 波兰48kHz脚本独白1,4821,266单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言土耳其土耳其土耳其土耳其48kHz脚本独白2,0271,735单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言中国传统文化中国传统文化48kHz脚本独白1,028891单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言阿拉伯语阿拉伯语48kHz脚本独白1,9471,594单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言丹麦语丹麦语48kHz脚本独白2,5792,041单句录音,通常在 5 到 30 秒范围内,来自丹麦的丹麦语移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言印地语印地语8kHz呼叫中心122131“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言印地语印地语16kHz媒体音频219202可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟桌面版5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言印地语印地语48kHz脚本独白2,8672,105单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言日本语日本语48kHz脚本独白2,3352,029单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言韩语韩语48kHz脚本独白1,9551,548单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言俄语俄语48kHz脚本独白2,3982,046单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言中文(简体)中文(简体)48kHz脚本独白2,7622,181单句录音,通常在 5 到 30 秒范围内移动应用5WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
发言德语德语8kHz呼叫中心640“代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,双重桌面版WAV。.jsonASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模

描述

呼叫中心对话 8khz: 无脚本的合成电话对话:“代理”和“客户”

通用对话 8khz: 2 人之间的即兴电话交谈

媒体和播客 16khz: 公共领域的音频/视频采访、播客等 1-5 人

话语/脚本独白 16khz: 根据提示录制 

联系我们

不能找到你想要的?

正在收集所有数据类型的新现成音频和语音数据集 

立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧

  • 通过注册,我同意 Shaip 隐私政策服务条款 并同意接受来自 Shaip 的 B2B 营销传播。