关键短语/提示音频采集

案例研究:车载语音激活系统的关键短语收集

关键词集合

汽车行业对车载语音激活系统的需求不断增长,重新定义了我们与移动车辆的互动方式。

汽车行业迅速采用了语音激活系统,福特、特斯拉和宝马等主要厂商在其车辆中集成了先进的语音识别功能。 到 2022 年,预计超过 50% 的新车将配备语音识别功能。 这些集成旨在提高安全性,让驾驶员能够心无旁骛地操作导航、娱乐和通信功能。

预计到 1 年,汽车语音识别的市场价值将超过 2023 亿美元,这表明对免提智能车内交互的需求不断增长。

汽车行业

研究表明,到 2022 年,73% 的驾驶员将使用车内语音助手。

2.01年汽车语音识别系统市场规模为2021亿美元,预计到3.51年将达到2027亿美元,复合年增长率约为8.07%。

真实世界的解决方案

为声控系统提供动力的数据

汽车中的声控系统增强了安全性和便利性。 它们允许驾驶员在手不离开方向盘或眼睛不离开路面的情况下访问导航、打电话、发送短信和控制音乐。 通过响应口头命令,这些系统可以减少分心,促进多任务处理,并确保持续专注于驾驶。 

该客户是对话智能领域的全球领导者,提供语音人工智能解决方案,让企业能够为客户提供令人难以置信的对话体验。 他们正在与领先的汽车公司合作,使用品牌关键词训练他们的声控系统,并且需要 Shaip 在音频数据收集方面的专业知识。

现实世界的解决方案
挑战

挑战

  • 众包采购: 在全球范围内招募 2800 多名每种语言的母语人士。
  • 数据采集​​: 在设定的时间范围内以 200 种语言提供超过 12 万条提示。
  • 上下文和意图识别:为了正确理解用户请求,系统需要针对同一关键词的不同变体进行训练。
  • 背景噪声处理: 解决现实世界的背景噪声,以提高 ML 模型的准确性。
  • 减少偏见: 获取来自不同人群的语音样本以确保包容性.
  • 音频规格: 16khz 16bits PCM,单声道,单声道,WAV; 没有处理。
  • 录音环境: 录音应具有干净的音频,没有背景噪音或干扰。 使用正常语音录制的关键短语。
  • 质量检查:  所有语音录音都将接受质量评估和验证,只有经过验证的语音录音才会被交付。 如果 Shaip 不符合商定的质量标准,Shaip 将重新提供数据,无需额外费用

解决方案

Shaip 凭借其在对话式 AI 领域的专业知识,使客户能够:

  • 数据采集​​: 在规定的时间内以 208 种全球语言从 12 位发言者那里收集了 2800k 个关键短语/品牌提示
  • 不同的口音和方言: 从世界各地招募了精通所需口音和方言的专家。
  • 上下文和意图识别:每位发言者的任务是记录 20 种不同变体的关键短语,使 ML 模型能够根据上下文和意图准确掌握用户请求。
  • 背景噪声处理:为了确保原始的音频质量,我们确保在噪音水平低于 40dB 的宁静环境中捕获关键短语,并且没有电视、广播、音乐、语音或街道声音等背景干扰。
  • 减少偏见: 为了最大限度地减少偏见,我们聘请了来自不同地区的个人,并保持了人口代表性的平衡,其中男性占 50%,女性占 50%,年龄组涵盖 18 岁至 60 岁。
  • 录音指南: 关键短语以一致、正常的语音模式捕获,没有任何变化,例如快或慢的节奏。 开头和结尾都有 2 秒的静音,以确保演讲的任何部分都不会被无意剪掉。
  • 录音格式: 音频使用单通道以 16kHz、16 位 PCM 单声道录制,并保存为 WAV 文件格式。 音频保持未经处理,这意味着没有应用压缩、混响或均衡器。
  • 质量: 每个语音录音都经过严格的质量检查和验证。 仅交付通过此评估的录音。 任何未达到商定的质量标准的文件都会被重新记录并提供,且不收取任何额外费用
解决方案
成果

成果

高质量的品牌关键词音频数据或语音提示将使汽车公司及其客户能够:

  1. 品牌和标识: 具有特定品牌短语的语音提示可帮助公司在用户和品牌之间建立直接且难忘的联系,从而增强品牌回忆。
  2. 易于使用: 语音命令使驾驶员可以更轻松地与车辆互动,而无需将手离开方向盘或眼睛离开道路,从而提高道路安全性。
  3. 功能: 语音命令使访问和控制汽车功能更加直观。 无论是导航、媒体播放还是气候控制。
  4. 与其他系统集成: 许多语音激活系统与智能手机、智能家居设备和其他物联网设备集成。 例如,用户可以在接近家时要求他们的汽车打开家里的灯。
  5. 竞争优势:提供先进的语音激活系统可以成为一个卖点和一个差异化因素。 买家在考虑购买新车时会寻找最新的技术。
  6. 面向未来: 随着技术的发展和物联网越来越融入日常生活,拥有强大的声控系统使汽车公司能够更好地适应未来的技术。
  7. 收入机会: 额外的盈利机会,即语音系统提供推荐或集成电子商务体验(如订餐或查找附近的服务),可以提供联营收入。
金色五星级

当我们开始为汽车行业采购语音提示时,面临着很多挑战。 捕捉言语、口音和语气的多样性对于代表我们客户的全球客户至关重要。 Shaip 不仅作为供应商脱颖而出,而且作为真正的合作伙伴。 他们致力于确保来自不同地区的多样化声音值得赞扬。 他们不仅仅是收集声音; 他们掌握了我们项目需求的细微差别,保证了一流的录音。 他们对音频采集标准的完美遵守展示了他们的专业精神和对项目的奉献精神。

加速您的对话式 AI
应用程序开发 100%