高质量的音频/语音/语音数据集来训练您的会话 AI 模型
多种语言的现成语音/语音/音频数据集,可快速启动您的自动语音识别 (ASR) 模型
插入您今天缺少的音频数据目录
菜单
详细信息 | 关键字 | 语言数据集 | 采样率 | 数据集类型 | 总音频时数 | 总演讲时数 | 数据集描述 | 音频频道 | 录音平台 | WER(%) | 音频格式 | 转录格式 | 用例 | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
非裔美国人 | 非裔美国人白话 | 8kHz | 呼叫中心 | 214 | 211 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
非裔美国人 | 非裔美国人白话 | 16kHz | 媒体音频 | 159 | 149 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
南非荷兰语 | 南非荷兰语 | 8kHz | 一般对话 | 368 | 404 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,在非洲说南非荷兰语 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
南非荷兰语 | 南非荷兰语 | 16kHz | 媒体音频 | 658 | 615 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
阿拉伯语 | 阿拉伯语 | 8kHz | 一般对话 | 293 | 297 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,来自海湾国家的阿拉伯语 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
波士顿 | 波士顿 | 8kHz | 呼叫中心 | 177 | 175 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
波士顿 | 波士顿 | 8kHz | 一般对话 | 32 | 32 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
波士顿 | 波士顿 | 16kHz | 媒体音频 | 93 | 93 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
中文英文 | 中文英文 | 8kHz | 呼叫中心 | 169 | 130 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
中文英文 | 中文英文 | 16kHz | 媒体音频 | 249 | 236 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
丹麦语 | 丹麦语 | 8kHz | 一般对话 | 372 | 395 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
丹麦语 | 丹麦语 | 16kHz | 媒体音频 | 664 | 603 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
英语 | 英语 | 16kHz | 媒体音频 | 10 | 9 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
英语深南 | 英语深南 | 8kHz | 呼叫中心 | 151 | 149 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
英语深南 | 英语深南 | 8kHz | 一般对话 | 56 | 56 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
英语深南 | 英语深南 | 16kHz | 媒体音频 | 266 | 248 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
希伯来语 | 希伯来语 | 8kHz | 一般对话 | 399 | 397 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,以色列希伯来语 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
希伯来语 | 希伯来语 | 16kHz | 媒体音频 | 427 | 400 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印度英语 | 印度英语 | 8kHz | 呼叫中心 | 208 | 185 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印度英语 | 印度英语 | 16kHz | 媒体音频 | 216 | 219 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
西班牙裔英语 | 西班牙裔英语 | 8kHz | 呼叫中心 | 212 | 209 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
西班牙裔英语 | 西班牙裔英语 | 16kHz | 媒体音频 | 155 | 150 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印度英语 | 印度英语 | 16kHz | 媒体音频 | 137 | 87 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印尼语 | 印尼语 | 8kHz | 一般对话 | 496 | 598 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,印尼语 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印尼语 | 印尼语 | 16kHz | 媒体音频 | 643 | 610 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
爱尔兰语 | 爱尔兰语 | 8kHz | 一般对话 | 192 | 180 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
韩语 | 韩语 | 8kHz | 呼叫中心 | 107 | 103 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
韩语 | 韩语 | 16kHz | 媒体音频 | 204 | 197 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马来语 | 马来语 | 8kHz | 一般对话 | 266 | 302 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,马来西亚马来语 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马来语 | 马来语 | 16kHz | 媒体音频 | 344 | 305 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
新西兰英语 | 新西兰英语 | 8kHz | 一般对话 | 148 | 142 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
新西兰英语 | 新西兰英语 | 16kHz | 媒体音频 | 400 | 400 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
纽约英语 | 纽约英语 | 8kHz | 呼叫中心 | 103 | 103 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
纽约英语 | 纽约英语 | 8kHz | 一般对话 | 107 | 106 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
纽约英语 | 纽约英语 | 16kHz | 媒体音频 | 140 | 140 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
波兰语 | 波兰语 | 16kHz | 媒体音频 | 269 | 255 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
苏格兰的 | 苏格兰的 | 8kHz | 一般对话 | 292 | 267 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
新加坡英语 | 新加坡英语 | 8kHz | 呼叫中心 | 218 | 194 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
新加坡英语 | 新加坡英语 | 16kHz | 媒体音频 | 247 | 240 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
南非英语 | 南非英语 | 8kHz | 呼叫中心 | 261 | 204 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
南非英语 | 南非英语 | 16kHz | 媒体音频 | 251 | 245 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
西班牙语 | 西班牙语 | 16kHz | 媒体音频 | 3 | 2 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
斯瓦希里 | 斯瓦希里 | 8kHz | 呼叫中心 | 184 | 165 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
斯瓦希里 | 斯瓦希里 | 8kHz | 呼叫中心 | 46 | 44 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
斯瓦希里 | 斯瓦希里 | 16kHz | 媒体音频 | 203 | 191 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
斯瓦希里 | 斯瓦希里 | 16kHz | 媒体音频 | 62 | 58 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
瑞典语 | 瑞典语 | 8kHz | 呼叫中心 | 250 | 224 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
瑞典语 | 瑞典语 | 16kHz | 媒体音频 | 278 | 255 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰卢固语 | 泰卢固语 | 8kHz | 一般对话 | 553 | 582 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰卢固语 | 泰卢固语 | 16kHz | 媒体音频 | 648 | 599 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰国人 | 泰国人 | 8kHz | 一般对话 | 183 | 201 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,朋友之间使用的非正式记录 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰国人 | 泰国人 | 16kHz | 媒体音频 | 173 | 167 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
越南语 | 越南语 | 8kHz | 一般对话 | 295 | 293 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,北部(例如,河内)、中部和南部(例如,胡志明市)。 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
越南语 | 越南语 | 16kHz | 媒体音频 | 257 | 248 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
威尔士语 | 威尔士语 | 8kHz | 一般对话 | 278 | 299 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印度英语 | 印度英语 | 8kHz | 呼叫中心 | 200 | 200 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰卢固语 | 泰卢固语 | NA | 呼叫中心 | 30 | 30 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
淡米尔文 | 淡米尔文 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
卡纳达语 | 卡纳达语 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉雅拉姆语 | 马拉雅拉姆语 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
孟加拉语 | 孟加拉语 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
古吉拉特语 | 古吉拉特语 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉 | 马拉 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
阿萨姆 | 阿萨姆 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
奥里亚语 | 奥里亚语 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
旁遮普 | 旁遮普 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰卢固语 | 泰卢固语 | NA | 一般对话 | 50 | 50 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
淡米尔文 | 淡米尔文 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
卡纳达语 | 卡纳达语 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉雅拉姆语 | 马拉雅拉姆语 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
孟加拉语 | 孟加拉语 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
古吉拉特语 | 古吉拉特语 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉 | 马拉 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
阿萨姆 | 阿萨姆 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
奥里亚语 | 奥里亚语 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
旁遮普 | 旁遮普 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰卢固语 | 泰卢固语 | NA | 媒体音频 | 20 | 20 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
淡米尔文 | 淡米尔文 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
卡纳达语 | 卡纳达语 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉雅拉姆语 | 马拉雅拉姆语 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
孟加拉语 | 孟加拉语 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
古吉拉特语 | 古吉拉特语 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉 | 马拉 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
阿萨姆 | 阿萨姆 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
奥里亚语 | 奥里亚语 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
旁遮普 | 旁遮普 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
英语美国 | 英语美国 | 48kHz | 脚本独白 | 5 | 4 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
西班牙语 西班牙 | 西班牙语 西班牙 | 48kHz | 脚本独白 | 10 | 8 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
墨西哥人 | 墨西哥人 | 48kHz | 脚本独白 | 1,492 | 1,228 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
加拿大 | 加拿大 | 48kHz | 脚本独白 | 1,222 | 1,049 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
Nederland | Nederland | 48kHz | 脚本独白 | 1,205 | 1,021 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
波兰语 波兰 | 波兰语 波兰 | 48kHz | 脚本独白 | 1,482 | 1,266 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
土耳其土耳其 | 土耳其土耳其 | 48kHz | 脚本独白 | 2,027 | 1,735 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
中国传统文化 | 中国传统文化 | 48kHz | 脚本独白 | 1,028 | 891 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
阿拉伯语 | 阿拉伯语 | 48kHz | 脚本独白 | 1,947 | 1,594 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
丹麦语 | 丹麦语 | 48kHz | 脚本独白 | 2,579 | 2,041 | 单句录音,通常在 5 到 30 秒范围内,来自丹麦的丹麦语 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印地语 | 印地语 | 8kHz | 呼叫中心 | 122 | 131 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印地语 | 印地语 | 16kHz | 媒体音频 | 219 | 202 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印地语 | 印地语 | 48kHz | 脚本独白 | 2,867 | 2,105 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
日本语 | 日本语 | 48kHz | 脚本独白 | 2,335 | 2,029 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
韩语 | 韩语 | 48kHz | 脚本独白 | 1,955 | 1,548 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
俄语 | 俄语 | 48kHz | 脚本独白 | 2,398 | 2,046 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
中文(简体) | 中文(简体) | 48kHz | 脚本独白 | 2,762 | 2,181 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
德语 | 德语 | 8kHz | 呼叫中心 | 64 | 0 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 |
描述
呼叫中心对话 8khz: 无脚本的合成电话对话:“代理”和“客户”
通用对话 8khz: 2 人之间的即兴电话交谈
媒体和播客 16khz: 公共领域的音频/视频采访、播客等 1-5 人
话语/脚本独白 16khz: 根据提示录制
不能找到你想要的?
正在收集所有数据类型的新现成音频和语音数据集
立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧