标题(语言)
纽约英语语言数据集
数据集类型
呼叫中心、一般对话、媒体(播客)
国家
United States
描述
该数据集提供多样化的语音和媒体内容,包括非脚本的合成代理与客户对话(5-15 分钟)、人与人之间的电话对话(15-60 分钟)、带有转录的歌唱音频、采访、播客和脚本独白,支持语音和语言技术的训练和评估。
用例
ASR、虚拟助手、聊天机器人、对话式人工智能、语音分析、TTS、语言建模
| 数据集类型 | 采样频率 | 演讲嘉宾 | 频道 | 全部小时数 | 演讲者总数 |
|---|---|---|---|---|---|
| 呼叫中心 | 8kHz | 2音箱 | 双重 | 117:40:09 | 1,388 |
| 一般对话 | 8kHz | 2音箱 | 双重 | 156:42:48 | 510 |
| 音乐 | 16kHz | 单扬声器 | Mono | 135:14:18 | 288 |
赋能团队打造世界领先的人工智能产品。
立即联系我们,让您摆脱音频/语音训练数据收集的后顾之忧
我们使用 Cookie 来改善您在我们网站上的体验。使用我们的网站即表示您同意使用 Cookie。
管理下面的 Cookie 偏好设置:
基本cookie启用基本功能,对于网站的正常运行是必不可少的。
Google Tag Manager 可以简化网站上营销标签的管理,无需更改代码。
统计 Cookie 会匿名收集信息。这些信息有助于我们了解访客如何使用我们的网站。
Google Analytics 是一款强大的工具,可以跟踪和分析网站流量,以便做出明智的营销决策。
服务网址: 政策.google.com (在新窗口中打开)