智能 AI 的自定义语音/音频数据收集
使用我们的音频和语音数据收集服务,使用高质量的对话数据训练您的 NLP 模型、VA、TTS 原型等
发现没有瓶颈的音频数据管道。
特色客户
为什么自然语言处理需要语音训练数据集?
你有没有注意到你的智能手机 VA,即 Siri、Bixby 或其他任何东西在交互? 他们根据您的要求回答每一个问题并分析和呈现结果的方式!
好吧,尽管这些 VA 引起了我们的兴趣,但这些智能资源和程序需要逐步培训,以便能够准确地做出响应。 这就是为什么您应该考虑将语音/音频和语音数据收集外包给专业的数据收集公司,并验证专业知识的原因。
投资音频数据收集可以让您声称的 NLP 准备好迎合多语言受众。 不仅如此,当由专家处理时,NLP 的语音数据收集甚至会考虑现场收集、语义分析和音频转录。 借助专业的语音数据采集解决方案,您可以:
- 采购高质量的音频数据集以提高准确性
- 目标多样化的场景设置
- 收集多语言人工智能训练数据
- 扩展您的 ML 模型以适应不同的人口统计和垂直行业
用于 NLP 的专业音频/语音数据收集服务
任何科目。 任何场景。
智能 NLP 系统绝不是通用的。 根据程序的功能,您可能需要专注于空间和多语言音频数据服务,这些服务只能由知名的语音/音频数据收集公司提供。 这就是 Shaip 作为高度可靠的数据连接服务提供商进入事物计划的地方,它以为您所谓的智能 AI 承担繁重的工作而自豪。
在 Shaip,我们的主要重点是在尽可能短的时间内为模型提供尽可能多的自定义语音样本。 加入我们,您可以期待:
- NLP 的精选音频/语音数据收集
- 根据特定用例做出响应的定制程序
- 准备好音频数据集挖掘
- 特定于模式的自动化数据处理
- 最高级别的域特异性
- 通过加速的 AI 模型加快上市速度
我们的专长
对齐音频数据以准备智能 NLP 模型
Shaip 提供 100 多种语言的端到端语音/音频数据收集服务,使支持语音的技术能够迎合全球不同的受众群体。 我们可以从事任何范围和规模的项目; 从许可现有的现成音频数据集到管理自定义音频数据收集,再到音频转录和注释。 无论您的语音数据采集项目有多大,我们都可以根据您的需求定制音频采集服务,以构建针对方言、音调和语言的高质量 NLP 数据集。 从我们广泛的语音数据集和音频数据收集资源中进行选择,以实现支持语音的智能设置。
独白演讲集
通过单通道文件处理与独立扬声器有关的基于语音的要求,用于您的 Text-to-Speed 原型和转录特定要求,并使用脚本提示馈送。
对话演讲
购物
通过双通道文件和转录资源设置具有多语言曝光的智能虚拟助手、特定速度的聊天机器人和自动语音识别模型。
声学数据
购物
我们可以通过我们的全球合作伙伴网络专业地录制录音室质量的音频数据,无论是餐厅、办公室或家庭,还是来自各种环境和语言的数据,同时涵盖更广泛的声学范围
自然语言话语集
训练智能商业设置以识别具有相似含义的不同表达的客户短语,从而使 AI 及时更自主
数字/虚拟
助理
通过训练包含人类语音、多语言暴露、上下文分析和 NLU 警告的模型,专注于构建您即将到来的虚拟助手。
自动语音识别 (ASR)
通过访问来自广泛人口统计数据的最先进的多样化语音/音频数据集,提高自动语音识别 (ASR) 系统的准确性。
多语言语音/音频训练数据
我们在全球拥有高技能的语言专家,提供多种语言和方言的多语言音频/语音培训数据,包括阿拉伯语、丹麦语、汉语、南非荷兰语、新加坡、新西兰、希伯来语、印度尼西亚语、爱尔兰语、韩语、马来语、波兰语、苏格兰语、瑞典语、法语、德语、越南语、泰语、意大利语、西班牙语等。
文字转语音
(TTS)
为了提供更好的 TTS 用户体验,开发一个听起来自然的系统至关重要。 在我们全球员工的帮助下构建文本到语音 (TTS) 多语言模型,他们帮助您收集 150 多种语言和方言的语音数据,以增强您的人工智能模型,从车载控制到聊天机器人和学习解决方案优质的音频数据。
选择 Shaip 作为您值得信赖的语音数据收集合作伙伴的原因
员工
专门和训练有素的团队:
- 30,000 多名数据创建、标签和 QA 协作者
- 有资质的项目管理团队
- 经验丰富的产品开发团队
- 人才库采购和入职团队
流程
通过以下方式确保最高的流程效率:
- 稳健的 6 Sigma Stage-Gate 工艺
- 一个由 6 Sigma 黑带组成的专门团队——关键流程负责人和质量合规
- 持续改进和反馈循环
平台
获得专利的平台具有以下优势:
- 基于网络的端到端平台
- 无可挑剔的品质
- 更快的 TAT
- 无缝交付
语言:收集的音频数据集
现成的语音/音频数据集
详细信息 | 关键字 | 语言数据集 | 采样率 | 数据集类型 | 总音频时数 | 总演讲时数 | 数据集描述 | 音频频道 | 录音平台 | WER(%) | 音频格式 | 转录格式 | 用例 | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
非裔美国人 | 非裔美国人白话 | 8kHz | 呼叫中心 | 214 | 211 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
非裔美国人 | 非裔美国人白话 | 16kHz | 媒体音频 | 159 | 149 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
南非荷兰语 | 南非荷兰语 | 8kHz | 一般对话 | 368 | 404 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,在非洲说南非荷兰语 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
南非荷兰语 | 南非荷兰语 | 16kHz | 媒体音频 | 658 | 615 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
阿拉伯语 | 阿拉伯语 | 8kHz | 一般对话 | 293 | 297 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,来自海湾国家的阿拉伯语 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
波士顿 | 波士顿 | 8kHz | 呼叫中心 | 177 | 175 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
波士顿 | 波士顿 | 8kHz | 一般对话 | 32 | 32 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
波士顿 | 波士顿 | 16kHz | 媒体音频 | 93 | 93 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
中文英文 | 中文英文 | 8kHz | 呼叫中心 | 169 | 130 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
中文英文 | 中文英文 | 16kHz | 媒体音频 | 249 | 236 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
丹麦语 | 丹麦语 | 8kHz | 一般对话 | 372 | 395 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
丹麦语 | 丹麦语 | 16kHz | 媒体音频 | 664 | 603 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
英语 | 英语 | 16kHz | 媒体音频 | 10 | 9 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
英语深南 | 英语深南 | 8kHz | 呼叫中心 | 151 | 149 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
英语深南 | 英语深南 | 8kHz | 一般对话 | 56 | 56 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
英语深南 | 英语深南 | 16kHz | 媒体音频 | 266 | 248 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
希伯来语 | 希伯来语 | 8kHz | 一般对话 | 399 | 397 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,以色列希伯来语 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
希伯来语 | 希伯来语 | 16kHz | 媒体音频 | 427 | 400 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印度英语 | 印度英语 | 8kHz | 呼叫中心 | 208 | 185 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印度英语 | 印度英语 | 16kHz | 媒体音频 | 216 | 219 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
西班牙裔英语 | 西班牙裔英语 | 8kHz | 呼叫中心 | 212 | 209 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
西班牙裔英语 | 西班牙裔英语 | 16kHz | 媒体音频 | 155 | 150 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印度英语 | 印度英语 | 16kHz | 媒体音频 | 137 | 87 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印尼语 | 印尼语 | 8kHz | 一般对话 | 496 | 598 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,印尼语 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印尼语 | 印尼语 | 16kHz | 媒体音频 | 643 | 610 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
爱尔兰语 | 爱尔兰语 | 8kHz | 一般对话 | 192 | 180 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
韩语 | 韩语 | 8kHz | 呼叫中心 | 107 | 103 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
韩语 | 韩语 | 16kHz | 媒体音频 | 204 | 197 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马来语 | 马来语 | 8kHz | 一般对话 | 266 | 302 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,马来西亚马来语 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马来语 | 马来语 | 16kHz | 媒体音频 | 344 | 305 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
新西兰英语 | 新西兰英语 | 8kHz | 一般对话 | 148 | 142 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
新西兰英语 | 新西兰英语 | 16kHz | 媒体音频 | 400 | 400 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
纽约英语 | 纽约英语 | 8kHz | 呼叫中心 | 103 | 103 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
纽约英语 | 纽约英语 | 8kHz | 一般对话 | 107 | 106 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
纽约英语 | 纽约英语 | 16kHz | 媒体音频 | 140 | 140 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
波兰语 | 波兰语 | 16kHz | 媒体音频 | 269 | 255 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
苏格兰的 | 苏格兰的 | 8kHz | 一般对话 | 292 | 267 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
新加坡英语 | 新加坡英语 | 8kHz | 呼叫中心 | 218 | 194 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
新加坡英语 | 新加坡英语 | 16kHz | 媒体音频 | 247 | 240 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
南非英语 | 南非英语 | 8kHz | 呼叫中心 | 261 | 204 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
南非英语 | 南非英语 | 16kHz | 媒体音频 | 251 | 245 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
西班牙语 | 西班牙语 | 16kHz | 媒体音频 | 3 | 2 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
斯瓦希里 | 斯瓦希里 | 8kHz | 呼叫中心 | 184 | 165 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
斯瓦希里 | 斯瓦希里 | 8kHz | 呼叫中心 | 46 | 44 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
斯瓦希里 | 斯瓦希里 | 16kHz | 媒体音频 | 203 | 191 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
斯瓦希里 | 斯瓦希里 | 16kHz | 媒体音频 | 62 | 58 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
瑞典语 | 瑞典语 | 8kHz | 呼叫中心 | 250 | 224 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
瑞典语 | 瑞典语 | 16kHz | 媒体音频 | 278 | 255 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰卢固语 | 泰卢固语 | 8kHz | 一般对话 | 553 | 582 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰卢固语 | 泰卢固语 | 16kHz | 媒体音频 | 648 | 599 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰国人 | 泰国人 | 8kHz | 一般对话 | 183 | 201 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,朋友之间使用的非正式记录 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰国人 | 泰国人 | 16kHz | 媒体音频 | 173 | 167 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
越南语 | 越南语 | 8kHz | 一般对话 | 295 | 293 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,北部(例如,河内)、中部和南部(例如,胡志明市)。 | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
越南语 | 越南语 | 16kHz | 媒体音频 | 257 | 248 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
威尔士语 | 威尔士语 | 8kHz | 一般对话 | 278 | 299 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印度英语 | 印度英语 | 8kHz | 呼叫中心 | 200 | 200 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰卢固语 | 泰卢固语 | NA | 呼叫中心 | 30 | 30 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
淡米尔文 | 淡米尔文 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
卡纳达语 | 卡纳达语 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉雅拉姆语 | 马拉雅拉姆语 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
孟加拉语 | 孟加拉语 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
古吉拉特语 | 古吉拉特语 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉 | 马拉 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
阿萨姆 | 阿萨姆 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
奥里亚语 | 奥里亚语 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
旁遮普 | 旁遮普 | NA | 呼叫中心 | 60 | 60 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰卢固语 | 泰卢固语 | NA | 一般对话 | 50 | 50 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
淡米尔文 | 淡米尔文 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
卡纳达语 | 卡纳达语 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉雅拉姆语 | 马拉雅拉姆语 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
孟加拉语 | 孟加拉语 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
古吉拉特语 | 古吉拉特语 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉 | 马拉 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
阿萨姆 | 阿萨姆 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
奥里亚语 | 奥里亚语 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
旁遮普 | 旁遮普 | NA | 一般对话 | 100 | 100 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
泰卢固语 | 泰卢固语 | NA | 媒体音频 | 20 | 20 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
淡米尔文 | 淡米尔文 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
卡纳达语 | 卡纳达语 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉雅拉姆语 | 马拉雅拉姆语 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
孟加拉语 | 孟加拉语 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
古吉拉特语 | 古吉拉特语 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
马拉 | 马拉 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
阿萨姆 | 阿萨姆 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
奥里亚语 | 奥里亚语 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
旁遮普 | 旁遮普 | NA | 媒体音频 | 40 | 40 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | NA | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
英语美国 | 英语美国 | 48kHz | 脚本独白 | 5 | 4 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
西班牙语 西班牙 | 西班牙语 西班牙 | 48kHz | 脚本独白 | 10 | 8 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
墨西哥人 | 墨西哥人 | 48kHz | 脚本独白 | 1,492 | 1,228 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
加拿大 | 加拿大 | 48kHz | 脚本独白 | 1,222 | 1,049 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
Nederland | Nederland | 48kHz | 脚本独白 | 1,205 | 1,021 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
波兰语 波兰 | 波兰语 波兰 | 48kHz | 脚本独白 | 1,482 | 1,266 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
土耳其土耳其 | 土耳其土耳其 | 48kHz | 脚本独白 | 2,027 | 1,735 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
中国传统文化 | 中国传统文化 | 48kHz | 脚本独白 | 1,028 | 891 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
阿拉伯语 | 阿拉伯语 | 48kHz | 脚本独白 | 1,947 | 1,594 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
丹麦语 | 丹麦语 | 48kHz | 脚本独白 | 2,579 | 2,041 | 单句录音,通常在 5 到 30 秒范围内,来自丹麦的丹麦语 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印地语 | 印地语 | 8kHz | 呼叫中心 | 122 | 131 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印地语 | 印地语 | 16kHz | 媒体音频 | 219 | 202 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 单 | 桌面版 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
印地语 | 印地语 | 48kHz | 脚本独白 | 2,867 | 2,105 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
日本语 | 日本语 | 48kHz | 脚本独白 | 2,335 | 2,029 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
韩语 | 韩语 | 48kHz | 脚本独白 | 1,955 | 1,548 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
俄语 | 俄语 | 48kHz | 脚本独白 | 2,398 | 2,046 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
中文(简体) | 中文(简体) | 48kHz | 脚本独白 | 2,762 | 2,181 | 单句录音,通常在 5 到 30 秒范围内 | 单 | 移动应用 | 5 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | |
德语 | 德语 | 8kHz | 呼叫中心 | 64 | 0 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 |
想要构建自己的音频数据集?
与我们的内部语音数据收集专家联系,建立最适合您要求的音频存储库