唤醒词训练数据收集

使用自定义唤醒词训练数据构建始终倾听的语音应用程序。
唤醒词训练数据-横幅

特色客户

赋能团队打造世界领先的人工智能产品。

Amazon
谷歌
微软
针织

用精准定制的唤醒词搭建您和您的语音产品之间的网关,增强语音助手的词检测能力,帮助您在竞争中保持领先。

语音助手极大地改变了客户与其设备交互的方式。 它们使用户更容易快速有效地探索产品和服务。 但是,语音应用程序在听吗? 为了使这些应用程序处于高驱动状态,它们需要被唤醒并在 WAKE WORDS 的帮助下从被动聆听转变为主动聆听。 “Alexa”和“Hey Siri”是世界上最流行的两个唤醒词。

Statista

到 2024 年,数字语音助手的数量预计将达到 8.4十亿 单位——超过世界人口。 

市场与市场

语音助手应用市场规模预计将从 2.8 年的 2021 亿美元增长到 11.2 年的 2026 亿美元,复合年增长率为 32.4%。 

什么是唤醒词及其示例 

唤醒词是特定的词或短语,例如“Hey Siri”、“Okay Google”和“Alexa”; 旨在激活语音激活设备以在说出时做出响应。 然而,与设备本地集成的始终收听唤醒词可大大缩短响应时间,并提高唤醒词的识别和处理准确性,即使没有互联网连接也是如此。

夏普如何提供帮助?

借助 Shaip 提供的始终聆听唤醒词训练,您的语音助手模型始终被调整为聆听唤醒词,但无需实际记录或将数据传输到云端。 与 Shaip 合作为您提供与专家合作的优势。 凭借我们在开发语音助手培训方面使用 AI 和 ML 技术的丰富经验,我们可以帮助您消除隐私风险、改善用户体验、降低开发成本并增强可扩展性。

文本话语集合

关于如何选择正确的唤醒词/触发词的宝贵提示

选择具有不同声音的单词

不同的音素通常会创建更独特的签名并确保结果的准确性更高。 因此,在您的数据中挑选能产生各种声音的短语。

用你的词利用合适的前缀

通过在唤醒词上加上“Hi”、“Hello”、“Hey”或“OK”等前缀,让唤醒词更有效。 它将保持唤醒词明确并确保在常规语音中使用触发词时不会发生意外匹配。

使用音素来构建你的触发词

让你的唤醒词至少包含六个音素的组合,这些音素很容易被机器识别,也很容易被人类说出。 例如,“Alexa”有六个现象组,而“Ok Google”有八个现象组。

避免使用单个单词

不要错误地使用单个单词作为唤醒词。 唤醒词必须足够长才能区分。

简单而独特的词

确保您创建的触发词必须简单且独特,以便于记忆。

避免长短语

较长的多词唤醒短语很难发音,并使该过程变得不必要地困难。

唤醒词训练数据的局限性

由于使用多种话语而造成的混乱

唤醒词模型通常经过训练以识别否。 不同的话语,以便它可以响应不同的调用。 然而,有太多不同的唤醒词可以简单地激活语音管道,而您不知道用户说的是哪个话语。

由于外部环境,结果不太准确

噪音、距离以及口音和语言的变化等因素使 AI 模型的准确启动词检测变得更加困难和复杂。

为您的品牌建立准确的唤醒词

火车 火车

我们在语音技术方面的经验帮助我们快速开发始终倾听的定制唤醒词和品牌唤醒短语。 通过语音识别与自然语言处理理解相结合,机器学习算法有助于有效地转录语音和执行语音命令。

开发
开发

我们专注于快速开发唤醒词原型,以确保品牌词的定制。 原型作为概念证明,有助于准确的培训、更快的上市时间、加速测试和消除风险。

增长 增长

通过出色的语音助手体验不间断的增长和不受阻碍的客户参与。 我们提供多语言语音识别功能,使应用程序即使在高噪音环境中也能准确识别单词和短语。

快速设计、开发和部署

训练、开发和部署始终聆听的自定义唤醒词不必繁琐且耗时。 借助 Shaip 专业技术专家的正确帮助,您可以有效地简化和缩短产品上市时间。 此外,我们的数据收集、标记和注释经验有助于您在数周内提供唤醒词。

唤醒词训练和部署的特点 

定制品牌唤醒词

定制品牌唤醒词

品牌唤醒词通常与价值和性能相关联。 现在是时候利用自定义品牌唤醒词对您有利的巨大好处了。 拥有您的品牌并开发定制的唤醒词或短语,以最佳方式展示您的品牌。 在 Shaip,我们可以帮助您的客户在每次与他们的语音助手互动时使用您的品牌名称。

命令或短语

超越唤醒词的是短语识别,允许用户使用自然语言来控制他们的语音激活设备。 Shaip 在帮助小型到大型企业开发能够以零延迟和更高准确性处理冗长短语的应用程序方面拥有丰富的经验。

命令或短语识别
嵌入式短语检测

嵌入的单词或短语检测

Shaip 的开发人员通过提供嵌入式关键字或短语检测,帮助品牌为其客户提供增强的语音体验。 我们通过让唤醒词引擎技术在浏览器内而不是在云端处理多个唤醒词来确保隐私、零延迟和高精度。

理解数据多样性的概念

什么是数据多样性?

这是一种收集关键用户数据的方式,例如他们的身份、原籍国、年龄、性别、语言、口音等。数据多样性用于改进面向用户的算法以实现更准确的结果。

数据通常倾向于产生内在的偏见。 因此,当我们从不同来源收集数据时,结果中的偏差会显着降低。 

以下是 Shaip 在构建唤醒词和其他会话命令时解决的一些数据多样性参数。

数据多样性
种族与种族印度教、穆斯林、基督教、南非荷兰语、欧洲人
教育程度本科、研究生、博士、硕士
国家中国、日本、印度、韩国、迪拜、尼日利亚、美国、加拿大
性生活男女混校
年龄10 岁以下、10-15 岁、15-25 岁、25-45 岁、45 岁及以上
选择语言英语、日语、土耳其语、中文、泰语、印地语
环境静音、嘈杂、背景音乐、背景声音或语音、室内、室外、剧院、体育场、自助餐厅、车内、办公室、购物中心、家庭噪音、楼梯、街道/道路、海边(有风)
口音(英语)苏格兰英语、威尔士英语、Hiberno-English、加拿大英语、澳大利亚英语、新西兰英语。
说话风格快速/正常/慢速,高/正常/柔和音量,正式/休闲等。
设备位置手持式、台式机

关键用例

语音搜索

将语音搜索添加到移动应用程序、网站和设备。 在音频、视频和流中查找关键字和短语。

免提搜索

使您的软件能够利用语音命令提供免提搜索结果来完成预期的操作。

语音指令

向设备、移动或 Web 应用程序添加语音命令,以提升客户体验。

语音分析

端到端语音 AI 平台通过智能工具为软件提供动力,以提供卓越的客户体验。

为什么选择

为了有效地部署您的 AI 计划,您将需要大量专门的训练数据集。 Shaip 是市场上为数不多的能够确保大规模提供世界一流、可靠的培训数据符合法规/GDPR 要求的公司之一。

数据收集能力

根据自定义指南创建、管理和收集来自全球 100 多个国家/地区的自定义数据集(文本、语音、图像、视频)。

灵活的劳动力

充分利用我们由 30,000 多名经验丰富且获得认证的贡献者组成的全球员工队伍。 灵活的任务分配和实时劳动力能力、效率和进度监控。

品质

我们的专有平台和熟练的劳动力使用多种质量控制方法来达到或超过为收集 AI 培训数据集而设定的质量标准。

多样、准确、快速

我们的流程通过直接从应用程序和 Web 界面更轻松的任务分发、管理和数据捕获来简化收集流程。

数据保障及安全

通过将隐私作为我们的首要任务来保持完整的数据机密性。 我们确保数据格式受到政策控制和保留。

领域特异性

根据客户数据收集指南从行业特定来源收集的特定领域数据。

使用人工智能通过客户体验提高业务绩效

唤醒词是激活语音系统并将其置于聆听模式以接受用户指示的短语。

调用名称是用于触发软件特定“技能”的关键字。 调用名称也可以是人名或地名,并且可以与动作、命令或问题组合。 所有自定义技能都应该有一个调用名称来启动它。

话语是用户用来向您的语音命令软件发出请求的短语。 该软件从给定的话语中识别出用户的意图,并进一步做出相应的响应。

自然语言处理或 NLP 是人工智能和计算语言学的融合,负责机器和人类自然语言之间的交互。 该软件利用 NLP 算法为您的 AI 模型分析、理解、更改或生成自然语言。

唤醒词、话语、触发词、热词、调用词

 句子是一组表达完整含义或传达整个想法的单词。 一个句子本质上可以是简单的、复杂的或复合的,并且可以以书面或口头形式表达。 

另一方面,话语是一种语言单位,通常不能传达全部含义或思想,并且充满了停顿和沉默。

话语示例: 

  1. “让我向您介绍……这是该地区的统计数据”
  2. “给我看最新的电影……上周上映的。”
  3. “22街的那家店现在开门了吗……银行旁边的那家。”

Alexa 带有几个内置麦克风,它们通过忽略背景噪音来检测和识别唤醒词。 为了防止误报和误报,Alexa 被编程为仅在检测到唤醒词“Alexa”后才开启听力。

唤醒词是任何编程的短语,它会导致语音助手开始收听和处理用户的请求。 任何语音助手都使用人工智能和自然语言处理对现实世界的交互进行培训,其中语音被转换为短语、单词和声音。