最值得信赖的 AI 语音数据收集服务
使用我们的音频和语音数据收集服务,使用高质量的对话数据训练您的 NLP 模型、VA、TTS 原型等
发现无瓶颈的音频数据管道
特色客户
专业音频/语音数据采集服务
任何科目。 任何场景。
在 Shaip,我们的专长在于创建专为各种 AI/ML 要求而设计的高质量语音数据集。我们提供广泛的语言和不同环境下的记录,使我们的数据集全面且适应性强。氧我们的重点是在尽可能短的时间内为模型提供最大量的自定义语音数据。 与我们一起,您可以期待:
- 策划高质量的多语言音频/语音数据以提高准确性
- 最高可能水平的领域特异性目标多样化场景 格局
- 扩展您的 ML 模型以适应不同的人口统计和垂直行业
- 录音环境: 工作室品质, 具有水晶般清晰的音频和最小的背景噪音,以及 自然环境,其中录音结合了环境声音来模仿现实世界的情况。
100+
55K +
演讲时间数据
250+
项目
60+
语言(100多种方言)
8 / 16 / 44 / 48 kHz
采样率
我们的专长
对齐音频数据以获得更智能的 NLP 模型
Shaip 提供 100 多种语言的端到端语音/音频数据收集服务,使支持语音的技术能够迎合全球不同的受众群体。 我们可以从事任何范围和规模的项目; 从许可现有的现成音频数据集到管理自定义音频数据收集,再到音频转录和注释。 无论您的语音数据采集项目有多大,我们都可以根据您的需求定制音频采集服务,以构建针对方言、音调和语言的高质量 NLP 数据集。 从我们广泛的语音数据集和音频数据收集资源中进行选择,以实现支持语音的智能设置。
脚本独白和即兴演讲
它专注于处理来自单个说话者的语音。利用脚本提示输入单通道音频文件,确保捕获特定于该人的独特语音模式、语气和细微差别。
脚本对话和即兴演讲
两人互动,通过双通道文件和转录资源复制现实世界的对话和多语言接触的对话。
团体/多方
对话
多人讨论,捕捉群体动态、重叠、语气变化,准确训练语音模型。
唤醒词/关键短语/话语集合
训练人工智能使用多样化、丰富且真实的话语来识别关键短语或唤醒词或具有相似含义的话语,以实现高级自然语言处理和理解。
声学数据
购物
我们可以专业录制工作室品质的音频数据,无论是在餐厅、办公室还是家庭,或者来自各种环境和语言,同时覆盖更广泛的声学范围(综合声音数据集)。
自动语音识别 (ASR)
通过访问来自广泛人口统计数据的最先进的多样化语音/音频数据集,提高自动语音识别 (ASR) 系统的准确性。
多语言语音/音频训练数据
我们遍布全球的熟练语言专业人员提供各种语言和方言的多语言音频/语音数据。这项努力促进了全球沟通并消除了语言障碍,有助于打造更具包容性和更有效的人工智能解决方案。
文字转语音
(语音合成)
在我们全球员工的帮助下构建文本转语音 (TTS) 多语言模型,他们帮助您收集 150 多种语言和方言的语音数据,以增强您的 AI 模型,从车载控制到聊天机器人和学习解决方案,高质量的音频数据。
呼叫中心
对话
代理商与客户之间的真实交流,支持西班牙语、德语、美式英语、孟加拉语、日语、中文、印地语等多种语言。
成功案例
对话式 AI 数据集,包含 3 种语言的超过 8 小时的数据
为了建立一个印度语言的多语言平台,该客户与 Shaip 合作,收集、分割和转录多种印度语言的大型数据集。这将有助于开发有效的语音模型,为客户的创新新平台提供动力。
问题: 以 3,000 种印度语言收集超过 8 小时的音频数据,进行分段和转录以开发自动语音识别。
解决方案: 我们提供数据收集、分段、转录,并提供带有元数据的 JSON 文件。我们为客户的语音技术项目大规模收集了 3000 种印度语言的 8 小时的音频数据。
选择 Shaip 作为您值得信赖的语音数据收集合作伙伴的原因
团队
专门和训练有素的团队:
- 30,000 多名数据创建、标签和 QA 协作者
- 有资质的项目管理团队
- 经验丰富的产品开发团队
- 人才库采购和入职团队
工艺过程
通过以下方式确保最高的流程效率:
- 稳健的 6 Sigma Stage-Gate 工艺
- 一个由 6 Sigma 黑带组成的专门团队——关键流程负责人和质量合规
- 持续改进和反馈循环
平台
获得专利的平台具有以下优势:
- 基于网络的端到端平台
- 无可挑剔的品质
- 更快的 TAT
- 无缝交付
团队
专门和训练有素的团队:
- 30,000 多名数据创建、标签和 QA 协作者
- 有资质的项目管理团队
- 经验丰富的产品开发团队
- 人才库采购和入职团队
工艺过程
通过以下方式确保最高的流程效率:
- 稳健的 6 Sigma Stage-Gate 工艺
- 一个由 6 Sigma 黑带组成的专门团队——关键流程负责人和质量合规
- 持续改进和反馈循环
平台
获得专利的平台具有以下优势:
- 基于网络的端到端平台
- 无可挑剔的品质
- 更快的 TAT
- 无缝交付
现成的语音/音频数据集
更多信息 | 语料库 ID(唯一) | 关键字 | 语言数据集 | 语言代码 | 采样率 | 数据集类型 | 总音频时数 | 简要说明 | 数据集描述 | 音频频道 | 录音平台 | WER(%) | 音频格式 | 转录格式 | 用例 | 使用者数量 | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
纽约英语_GC_8 | 纽约英语 | 纽约英语 | EN_US | 8kHz | 一般对话 | 107 | 纽约英语通用会话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女118,男114,未知0 | 联系我们 | |
俄罗斯人_SM_48 | 俄语 | 俄语 | RU-RU | 48kHz | 脚本独白 | 2,398 | 俄罗斯脚本独白 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1689 男 1937 未知 214 | 联系我们 | |
旁遮普语_MA | 旁遮普 | 旁遮普语(筹备中) | 旁遮普 | 媒体音频 | 40 | 旁遮普语(管道中)媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
旁遮普文_GC | 旁遮普 | 旁遮普语(筹备中) | 旁遮普 | 一般对话 | 100 | 旁遮普语(管道中)一般对话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
旁遮普_CC_8 | 旁遮普 | 旁遮普语(筹备中) | 旁遮普 | 呼叫中心 | 60 | 旁遮普语(准备中)呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
波兰语Poland_SM_48 | 波兰文(波兰) | 波兰文(波兰) | PL-PL | 48kHz | 脚本独白 | 1,482 | Polish Poland - 剧本独白 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1324 男 701 未知 24 | 联系我们 | |
波兰语_MA_16 | 波兰语 | 波兰语 | pl_PL | 16kHz | 媒体音频 | 269 | 波兰媒体音频 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 173 男 354 未知 6 | 联系我们 | |
奥里亚语_MA | 奥里亚语 | 奥里亚语(筹备中) | 或_IN | 媒体音频 | 40 | Oriya(管道中)媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
奥里亚语_GC | 奥里亚语 | 奥里亚语(筹备中) | 或_IN | 一般对话 | 100 | Oriya(管道中)一般对话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
奥里亚语_CC_8 | 奥里亚语 | 奥里亚语(筹备中) | 或_IN | 呼叫中心 | 60 | Oriya(筹备中)呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
新西兰_MA_16 | 新西兰英语 | 新西兰英语 | zh_NZ | 16kHz | 媒体音频 | 400 | 新西兰英语媒体音频 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女367,男678,未知26 | 联系我们 | |
新西兰_GC_8 | 新西兰英语 | 新西兰英语 | zh_NZ | 8kHz | 一般对话 | 148 | 新西兰英语通用会话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女167,男121,未知4 | 联系我们 | |
纽约英语_MA_16 | 纽约英语 | 纽约英语 | EN_US | 16kHz | 媒体音频 | 140 | 纽约英语媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女66,男230,未知11 | 联系我们 | |
苏格兰_GC_8 | 苏格兰语(英语口音) | 苏格兰语(英语口音) | zh_AB | 8kHz | 一般对话 | 292 | 苏格兰通用会话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女285,男260,未知3 | 联系我们 | |
纽约英语_CC_8 | 纽约英语 | 纽约英语 | EN_US | 8kHz | 呼叫中心 | 103 | 纽约英语呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女610,男532,未知0 | 联系我们 | |
荷兰_SM_48 | 荷兰语 | 荷兰语 | EN-GB | 48kHz | 脚本独白 | 1,205 | 荷兰脚本独白 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1285 男 531 未知 3 | 联系我们 | |
墨西哥人_SM_48 | 西班牙语 | 西班牙语 | ES-MX | 48kHz | 脚本独白 | 1,492 | 墨西哥西班牙语脚本独白 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1016 男 1069 未知 95 | 联系我们 | |
马拉地语_MA | 马拉 | 马拉地语(筹备中) | 先生_IN | 媒体音频 | 40 | 马拉地语(筹备中)媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
马拉地语_GC | 马拉 | 马拉地语(筹备中) | 先生_IN | 一般对话 | 100 | 马拉地语(正在筹备中)一般对话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
马拉地语_CC_8 | 马拉 | 马拉地语(筹备中) | 先生_IN | 呼叫中心 | 60 | 马拉地语(准备中)呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
马拉雅拉姆语_MA | 马拉雅拉姆语 | 马拉雅拉姆语(筹备中) | 毫升_IN | 媒体音频 | 40 | Malayalam (In Pipeline) 媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
马拉雅拉姆语_GC | 马拉雅拉姆语 | 马拉雅拉姆语(筹备中) | 毫升_IN | 一般对话 | 100 | 马拉雅拉姆语(正在筹备中)一般对话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
马拉雅拉姆语_CC_8 | 马拉雅拉姆语 | 马拉雅拉姆语(筹备中) | 毫升_IN | 呼叫中心 | 60 | 马拉雅拉姆语(正在筹备中)呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
马来语_MA_16 | 马来语 | 马来语 | ms_我的 | 16kHz | 媒体音频 | 344 | 马来媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 236,男 626,未知 47 | 联系我们 | |
马来语_GC_8 | 马来语 | 马来语 | ms_我的 | 8kHz | 一般对话 | 266 | 马来语通用对话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,马来西亚马来语 | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女316,男176,未知0 | 联系我们 | |
泰卢固语_GC_8 | 泰卢固语 | 泰卢固语 | TE_IN | 8kHz | 一般对话 | 553 | 泰卢固语通用会话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女574,男564,未知0 | 联系我们 | |
英国英语_WW_16 | 英国英语 | 英国英语 | zh_cn | 16kHz | 醒来的话 | 200音箱 | 唤醒词英国英语 | 关键词收集数据
| 1通道 | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 性别:50% 男性,50% 女性,+/- 10%。 | 联系我们 | |
威尔士_GC_8 | 威尔士语(英语口音) | 威尔士语(英语口音) | en_WL | 8kHz | 一般对话 | 278 | 威尔士通用会话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女270,男324,未知0 | 联系我们 | |
越南语_MA_16 | 越南语 | 越南语 | vi_VN | 16kHz | 媒体音频 | 257 | 越南媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女249,男200,未知数45 | 联系我们 | |
越南语_GC_8 | 越南语 | 越南语 | vi_VN | 8kHz | 一般对话 | 295 | 越南语通用会话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟,北部(例如,河内)、中部和南部(例如,胡志明市)。 | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女400,男380,未知数2 | 联系我们 | |
土耳其语 Turkey_SM_48 | 土耳其土耳其 | 土耳其土耳其 | TR-TR | 48kHz | 脚本独白 | 2,027 | 土耳其土耳其 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1561 男 1241 未知 31 | 联系我们 | |
泰语_MA_8 | 泰国人 | 泰国人 | th_TH | 16kHz | 媒体音频 | 173 | 泰媒音频 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女143,男502,未知26 | 联系我们 | |
泰文_GC_8 | 泰国人 | 泰国人 | th_TH | 8kHz | 一般对话 | 183 | 泰语一般会话 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,朋友之间使用的非正式记录 | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女338,男96,未知8 | 联系我们 | |
泰卢固语_MA | 泰卢固语 | 泰卢固语(筹备中) | TE_IN | 媒体音频 | 20 | 泰卢固语(管道中)媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
泰卢固语_GC | 泰卢固语 | 泰卢固语(筹备中) | TE_IN | 一般对话 | 50 | 泰卢固语(正在筹备中)一般对话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
泰卢固语_CC_8 | 泰卢固语 | 泰卢固语(筹备中) | TE_IN | 呼叫中心 | 30 | 泰卢固语(准备中)呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
泰卢固语_MA_16 | 泰卢固语 | 泰卢固语 | TE_IN | 16kHz | 媒体音频 | 648 | 泰卢固媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女207,男963,未知2 | 联系我们 | |
韩国人_SM_48 | 韩语 | 韩语 | KO-KR | 48kHz | 脚本独白 | 1,955 | 韩国脚本独白 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1195 男 1134 未知 122 | 联系我们 | |
泰米尔语_MA | 淡米尔文 | 泰米尔语(筹备中) | 塔_IN | 媒体音频 | 40 | 泰米尔语(筹备中)媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
泰米尔语_GC | 淡米尔文 | 泰米尔语(筹备中) | 塔_IN | 一般对话 | 100 | 泰米尔语(筹备中)一般对话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
泰米尔语_CC_8 | 淡米尔文 | 泰米尔语(筹备中) | 塔_IN | 呼叫中心 | 60 | 泰米尔语(准备中)呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
瑞典语_MA_16 | 瑞典语 | 瑞典语 | sv_SE | 16kHz | 媒体音频 | 278 | 瑞典媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女195,男500,未知21 | 联系我们 | |
瑞典语_CC_8 | 瑞典语 | 瑞典语 | sv_SE | 8kHz | 呼叫中心 | 250 | 瑞典呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女1581,男727,未知2 | 联系我们 | |
斯瓦希里语_MA_16 | 斯瓦希里 | 斯瓦希里 | sw_KE | 16kHz | 媒体音频 | 265 | 斯瓦希里语媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女118,男493,未知25 | 联系我们 | |
斯瓦希里语_CC_8 | 斯瓦希里 | 斯瓦希里 | sw_KE | 8kHz | 呼叫中心 | 230 | 斯瓦希里语呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女611,男833,未知0 | 联系我们 | |
南非英语_MA_16 | 南非英语 | 南非英语 | zh_ZA | 16kHz | 媒体音频 | 251 | 南非英语媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女235,男432,未知36 | 联系我们 | |
南非英语_CC_8 | 南非英语 | 南非英语 | zh_ZA | 8kHz | 呼叫中心 | 261 | 南非英语呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1274 男 935 未知 1 | 联系我们 | |
新加坡_MA_16 | 新加坡英语 | 新加坡英语 | zh_SG | 16kHz | 媒体音频 | 247 | 新加坡媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女160,男455,未知37 | 联系我们 | |
新加坡_CC_8 | 新加坡英语 | 新加坡英语 | zh_SG | 8kHz | 呼叫中心 | 218 | 新加坡呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女2139,男884,未知21 | 联系我们 | |
波士顿_CC_8 | 波士顿英语 | 波士顿英语 | EN_US | 8kHz | 呼叫中心 | 177 | 波士顿呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:605,男性:711,未知:0 | 联系我们 | |
英语深南_CC_8 | 英语深南 | 英语深南 | EN_US | 8kHz | 呼叫中心 | 151 | 英文深南呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女221,男1004,未知7 | 联系我们 | |
丹麦语_SM_48 | 丹麦语 | 丹麦语 | DA-DK | 48kHz | 脚本独白 | 2,579 | 丹麦语剧本独白 | 单句录音,通常在 5 到 30 秒范围内,来自丹麦的丹麦语 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1551 男 1233 未知 42 | 联系我们 | |
丹麦语_MA_16 | 丹麦语 | 丹麦语 | 达_DK | 16kHz | 媒体音频 | 664 | 丹麦媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:369,男性:864,未知:27 | 联系我们 | |
丹麦文_GC_8 | 丹麦语 | 丹麦语 | 达_DK | 8kHz | 一般对话 | 372 | 丹麦语通用会话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:311,男性:417,未知:0 | 联系我们 | |
繁体中文_SM_48 | 中国传统文化 | 中国传统文化 | zh-TW | 48kHz | 脚本独白 | 1,028 | 中国传统文化 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1069 男 262 未知 3 | 联系我们 | |
简体中文_SM_48 | 中文(简体) | 中文(简体) | ZH-CN | 48kHz | 脚本独白 | 2,762 | 中文(简体) | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1920 男 1535 未知 270 | 联系我们 | |
中文_MA_16 | 中文英文 | 中文英文 | EN_US | 16kHz | 媒体音频 | 249 | 中文媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:126 人,男性:346 人,未知:6 人 | 联系我们 | |
中文_CC_8 | 中文英文 | 中文英文 | EN_US | 8kHz | 呼叫中心 | 169 | 中国呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:1790 人,男性:523 人,未知:13 人 | 联系我们 | |
加拿大人_SM_48 | 加拿大法语 | 加拿大法语 | FR-CA | 48kHz | 脚本独白 | 1,222 | 加拿大法语 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 974 男 631 未知 1 | 联系我们 | |
波士顿_MA_16 | 波士顿英语 | 波士顿英语 | EN_US | 16kHz | 媒体音频 | 93 | 波士顿媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:43,男性:181,未知:2 | 联系我们 | |
波士顿_GC_8 | 波士顿英语 | 波士顿英语 | EN_US | 8kHz | 一般对话 | 32 | Boston General Conversation 数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:53,男性:83,未知:0 | 联系我们 | |
英语深南_GC_8 | 英语深南 | 英语深南 | EN_US | 8kHz | 一般对话 | 56 | 英语 Deep South General Conversation 数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 99,男 31,未知 0 | 联系我们 | |
孟加拉语_MA | 孟加拉语 | 孟加拉语(筹备中) | bn_IN | 媒体音频 | 40 | 孟加拉语(管道中)媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
孟加拉语_GC | 孟加拉语 | 孟加拉语(筹备中) | bn_IN | 一般对话 | 100 | 孟加拉语(正在筹备中)一般对话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
孟加拉语_CC_8 | 孟加拉语 | 孟加拉语(筹备中) | bn_IN | 呼叫中心 | 60 | 孟加拉语(准备中)呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
阿萨姆语_MA | 阿萨姆 | 阿萨姆语(筹备中) | 作为_IN | 媒体音频 | 40 | 阿萨姆语(管道中)媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
阿萨姆语_GC | 阿萨姆 | 阿萨姆语(筹备中) | 作为_IN | 一般对话 | 100 | 阿萨姆语(管道中)一般对话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
阿萨姆语_CC_8 | 阿萨姆 | 阿萨姆语(筹备中) | 作为_IN | 呼叫中心 | 60 | 阿萨姆语(正在筹备中)呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
阿拉伯语_SM_48 | 阿拉伯语 | 阿拉伯语 | AR-SA | 48kHz | 脚本独白 | 1,947 | 阿拉伯语脚本独白 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 838 男 1209 未知 78 | 联系我们 | |
阿拉伯语_GC_8 | 阿拉伯语 | 阿拉伯语 | ar_AE | 8kHz | 一般对话 | 292 | 阿拉伯语通用会话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,来自海湾国家的阿拉伯语 | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:171,男性:534,未知:1 | 联系我们 | |
南非荷兰语_MA_16 | 南非荷兰语 | 南非荷兰语 | AF_ZA | 16kHz | 媒体音频 | 658 | 南非荷兰语媒体文件 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:750,男性:1278,未知:52 | 联系我们 | |
南非荷兰语_GC_8 | 南非荷兰语 | 南非荷兰语 | AF_ZA | 8kHz | 一般对话 | 368 | 南非荷兰语通用会话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,在非洲说南非荷兰语 | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:502,男性:390,未知:2 | 联系我们 | |
en_US_MA_16 | 非裔美国人白话 | 非裔美国人白话 | EN_US | 16kHz | 媒体音频 | 154 | 非裔美国人民间媒体数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:151,男性:150,未知:10 | 联系我们 | |
HINGLISH_MA_16 | 印度英语 | 印度英语 | 汞输入 | 16kHz | 媒体音频 | 216 | HINGLISH 媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性 75 人,男性 380 人,未知 0 人 | 联系我们 | |
韩语_MA_16 | 韩语 | 韩语 | ko_KR | 16kHz | 媒体音频 | 204 | 韩国媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 70 男 303,未知 25 | 联系我们 | |
韩文_CC_8 | 韩语 | 韩语 | ko_KR | 8kHz | 呼叫中心 | 107 | 韩国呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女1086,男210,未知4 | 联系我们 | |
卡纳达语_MA | 卡纳达语 | 卡纳达语(筹备中) | kn_IN | 媒体音频 | 40 | 卡纳达语(筹备中)媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
卡纳达语_GC | 卡纳达语 | 卡纳达语(筹备中) | kn_IN | 一般对话 | 100 | 卡纳达语(正在筹备中)一般对话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
卡纳达语_CC_8 | 卡纳达语 | 卡纳达语(筹备中) | kn_IN | 呼叫中心 | 60 | 卡纳达语(筹备中)呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
日本人_SM_48 | 日文 | 日文 | JA-JP | 48kHz | 脚本独白 | 2,335 | 日本脚本独白 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1460 男 1221 未知 194 | 联系我们 | |
爱尔兰人_GC_8 | 爱尔兰语 | 爱尔兰语 | en_IE | 8kHz | 一般对话 | 192 | 爱尔兰语通用会话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 213 男 153 未知 0 | 联系我们 | |
印度尼西亚语_MA_16 | 印尼语 | 印尼语 | id_ID | 16kHz | 媒体音频 | 643 | 印尼媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女746,男1507,未知129 | 联系我们 | |
印度尼西亚语_GC_8 | 印尼语 | 印尼语 | id_ID | 8kHz | 一般对话 | 496 | 印度尼西亚语通用会话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,印尼语 | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女524,男454,未知2 | 联系我们 | |
西班牙裔_MA_16 | 西班牙裔英语 | 西班牙裔英语 | EN_US | 16kHz | 媒体音频 | 155 | 西班牙呼叫媒体音频 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女140,男219,未知5 | 联系我们 | |
西班牙裔_CC_8 | 西班牙裔英语 | 西班牙裔英语 | EN_US | 8kHz | 呼叫中心 | 212 | 西班牙呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女822,男1262,未知0 | 联系我们 | |
en_US_CC_8 | 非裔美国人白话 | 非裔美国人白话 | EN_US | 8kHz | 呼叫中心 | 211 | 非裔美国人方言呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性:612,男性:1242,未知:12 | 联系我们 | |
HINGLISH_CC_8 | 印度英语 | 印度英语 | 汞输入 | 8kHz | 呼叫中心 | 208 | 英语呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女822,男1262,未知0 | 联系我们 | |
印地语_SM_48 | 印地语 | 印地语 | HI-IN | 48kHz | 脚本独白 | 2,867 | 印地语脚本独白 | 单句录音,通常在 5 到 30 秒范围内 | Mono | 移动应用 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 1977 男 1864 未知 147 | 联系我们 | |
印地语_MA_16 | 印地语 | 印地语 | 输入 | 16kHz | 媒体音频 | 219 | 印地语媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女83,男309,未知0 | 联系我们 | |
希伯来语_MA_16 | 希伯来语 | 希伯来语 | 他_IL | 16kHz | 媒体音频 | 427 | 希伯来媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女361,男513,未知13 | 联系我们 | |
希伯来语_一般对话_8 | 希伯来语 | 希伯来语 | 他_IL | 8kHz | 一般对话 | 399 | 希伯来语通用会话数据 | 两个人之间的即兴电话交谈。 大约。 音频时长(范围) - 15-60 分钟,以色列希伯来语 | 双重 | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女414,男399,未知1 | 联系我们 | |
古吉拉特语_MA | 古吉拉特语 | 古吉拉特语(筹备中) | gu_IN | 媒体音频 | 40 | 古吉拉特语(筹备中)媒体音频数据 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
古吉拉特语_GC | 古吉拉特语 | 古吉拉特语(筹备中) | gu_IN | 一般对话 | 100 | 古吉拉特语(正在筹备中)一般对话数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
古吉拉特语_CC_8 | 古吉拉特语 | 古吉拉特语(筹备中) | gu_IN | 呼叫中心 | 60 | 古吉拉特语(准备中)呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | 桌面版 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 联系我们 | ||||
德国_IVR_8 | 德语 | 德语 | 德德 | 8kHz | IVR | 200 | 德国 IVR 数据 | 人对机器。 一种 IVR 类型的流程,其中有 TTS 提示(例如“我可以为您提供什么帮助”),然后是自发的人工响应 | Mono | 桌面版 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 10115 男 8750 未知 0 | 联系我们 | ||
德国_CC_8 | 德语 | 德语 | 德德 | 8kHz | 呼叫中心 | 64 | 德国呼叫中心数据 | “代理”和“客户”之间的无脚本合成电话对话,大约。 音频时长(范围)5-15 分钟, | Mono | 桌面版 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女性 478 男性 1440 未知 0 | 联系我们 | ||
英语 Deep South_MA_16 | 英语深南 | 英语深南 | EN_US | 16kHz | 媒体音频 | 266 | 英文深南传媒音频资料 | 可授权的公共领域音频/视频文件,例如采访、播客等 - 1 到 5 人。 大约。 音频时长(范围)15-60 分钟 | Mono | 网络采购 | 5.0 | WAV。 | .json | ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模 | 女 204,男 356,未知 21 | 联系我们 |
想要构建自己的音频数据集?
与我们的内部语音数据收集专家联系,建立最适合您要求的音频存储库
常见问题
ML 模型的语音数据收集是指收集口语录音的过程。 该集合有助于训练和完善机器学习算法,特别是那些以理解和处理人类声音为中心的算法。
当旨在收集自动语音识别 (ASR) 的音频数据时,您应该首先定义项目的特定需求,包括所需的语言、口音和语音类型。 设置这些参数后,请确保您获得尊重用户隐私的所有必要权限。 然后,使用适当的录音设备或软件捕获清晰的音频样本。 每个录音都应仔细注释其转录或其他相关元数据,并系统存储以便轻松访问。
机器学习中的语音数据集对于训练、测试和验证专门用于识别、转录或解释口语的模型至关重要。 此类数据集为从语音助手和转录服务到语音生物识别技术的无数应用程序铺平了道路。
为了从不同的语言和口音中收集精确的数据,与所需语言背景的母语人士的合作至关重要。 旨在获得多样化且具有代表性的样本,以涵盖广泛的人口统计差异。 在统一环境下使用标准化录音设备,确保音频一致性。 重要的是,用详细的转录和元数据注释每个数据片段,表示特定的语言和口音。