收集并转录了超过 22k 小时的音频数据,以训练多语种数字助理。
美国肯塔基州路易斯维尔,1 年 2022 月 XNUMX 日: Shaip 使一家拥有超过 22 小时音频数据的美国跨国计算机技术公司能够用来自全球的 13 多种语言训练他们的多语言数字助理。
在不到八个月的时间内收集、转录和交付了超过 7 万条 30 秒或更短的话语,同时确保在 16kHz 频率的各种录音环境中按年龄、性别、教育和方言健康地组合扬声器。
Shaip 首席执行官 Vatsal Ghiya 说, “夏普是 对话式AI 项目。 我们已经为多家财富 500 强公司提供了 NLP 数据需求。 我们与客户有着相同的愿景,使他们能够使用黄金标准数据改进解决方案,从而解决未来的重要问题。”
他进一步补充说,“对话语培训的需求源于这样一个事实,即并非所有客户在以脚本格式与他们的语音助手互动或提问时都使用相同的单词或短语。 这就是为什么需要根据自发语音数据训练特定语音应用程序的原因。 例如,“最近的医院在哪里?” “找我附近的医院”或“附近有医院吗?” 都表示相同的搜索意图,但措辞不同。 Shaip 可以帮助您识别和表达人们在现实世界场景中与语音助手交互的方式。”
Shaip 的工作范围包括但不限于获取大量用于语音识别的音频训练数据、转录多种语言的录音以及提供包含元数据的相应 JSON 文件。 Shaip 可以大规模收集话语,同时保持为复杂项目训练 ML 模型所需的所需质量水平。
关于夏普
总部位于肯塔基州路易斯维尔, 夏普 是一个完全托管的数据平台,专为希望解决最苛刻的人工智能挑战的公司而设计,以实现更智能、更快和更好的结果。 Shaip 通过无缝扩展我们的人员、平台和流程来帮助公司开发他们的 AI 和 ML 模型,从而支持从数据收集、许可、标签、转录和去识别化等各个方面的 AI 训练数据。 要了解如何让您的数据科学团队和领导者的生活更易于管理,请访问我们的网站 www.shaip.com.
媒体联络
阿努巴夫·萨拉夫
高级经理 - 市场营销
866-426-9412
info@shaip.com
12806 Townepark Way, 路易斯维尔, KY 40243-2311
来源: 夏普