ASR 综合医疗保健对话

通过综合医疗保健对话实现环境技术开发

环境技术

在临床环境中收集和转录超过 2000 小时的音频数据

在对话式人工智能快速发展的领域中,值得注意的应用之一是在医疗保健领域,该领域利用技术来简化提供者与患者之间的互动。 我们的客户是医疗保健技术领域的领先企业,他们向 Shaip 寻求增强其自动语音识别 (ASR) 模型的要求,以更好地理解和转录临床环境中的多方对话。 由于隐私法规的限制,获取现实世界的对话具有挑战性; 因此,我们的想法是在医疗保健提供者和患者之间创建和记录综合而现实的互动。

音量

2,000 小时,或大约 12,000 至 24,000 个体综合相互作用 10 分钟的平均持续时间。

目的

我们的主要目标是生成约 2,000 小时的录音,转化为 12,000 至 24,000 条精心制作的合成互动,体现性别、年龄、口音和医疗角色的多样性。 这个全面且真实的数据集旨在模拟现实世界的临床对话,在严格遵守 HIPAA 等隐私法规的情况下创建。 综合交互作为丰富的数据集,有助于训练和完善客户的 ASR 模型,显着提高其在临床环境中处理现实世界对话的能力。

 

目标

挑战

法规符合

确保遵守 HIPAA 等隐私法,同时创建现实且综合的医疗保健交互可能具有挑战性。

法律合规

数据真实性和多样性

制作准确模仿现实世界临床对话的综合交互,同时涵盖广泛的场景、口音、年龄和医疗角色,需要细致的方法和深厚的领域知识。

数据真实性和多样性

品质保证

要实现高水平的转录准确性,例如目标 95% 的单词准确率 (WER) 和 90% 的标签准确率 (TER),需要严格的质量保证流程。

技术能力

确保技术基础设施(包括记录和转录平台)能够处理大量数据并保持质量是一项重大挑战。

资源招募与培训

招募具有医学背景的人员进行角色扮演,并确保他们遵循现实场景,同时保持自然的对话流程可能非常具有挑战性。 此外,培训转录员遵守严格的质量指南需要大量的努力和专业知识。

方法/解决方案

音频采集和转录

  • 场景创建: 开发反映成人家庭医疗实践中遇到的常见非紧急情况的现实场景,例如高血压、糖尿病和疼痛管理。
  • 角色扮演: 招募具有医学背景的人员扮演医疗保健提供者和患者的角色,遵循提供的场景并模拟现实世界的临床对话。
  • 记录: 利用 Shaip Work 移动应用程序捕获音频,确保参与者在性别、年龄、口音和专业背景方面具有多样化的代表性。

验证和转录

  • 执行验证脚本以确保音频文件的准确性和质量。
  • 转录在 Bhasha 平台上进行,遵循提供的具体指南,并确保逐字文本转录和精确的分类。
  • 带注释的元数据,包括说话者 ID、年龄、性别、母语和医疗培训/经验,这对于客户的模型培训目的至关重要。

品质保证

  • CQA 和 PMO 进行的全面质量检查确保了 95% 的单词准确率 (WER) 和 90% 的标签准确率 (TER) 的转录质量目标。

资料传送

  • 以清晰、有组织的方式构建数据并分批交付,以及详细的批次注释和培养目录。
  • 确保所有数据(包括音频文件、转录和元数据)均按照客户的规范进行准确标记和格式化。

反馈与迭代

与客户建立强大的反馈循环,以识别任何缺陷,确保进行纠正并提供完整、准确的数据集。

主要成就

  • 成功收集和转录 2000 小时的综合医疗保健互动。
  • 快速准确的转录以及极高的准确率,为客户增强 ASR 模型的目标做出了重大贡献。
  • 展示了 Shaip 处理大型、复杂项目的能力,以及对质量和准确性一丝不苟的态度。

成果

Shaip 精心执行的项目产生了丰富的数据集,为增强客户的 ASR 模型做出了重大贡献。 综合交互创建了临床对话的真实表现,帮助客户为医疗保健环境实现更强大、更可靠的语音服务。 通过结构化且协调良好的方法,Shaip 确保在规定的时间内成功交付复杂的项目,巩固了其在管理医疗保健领域大型对话式人工智能项目方面的专业知识。

我们与 Shaip 的合作极大地推进了我们在医疗保健领域的环境技术和对话式人工智能项目。 他们在创建和转录合成医疗保健对话方面的专业知识提供了坚实的基础,展示了合成数据在克服监管挑战方面的潜力。 与 Shaip 一起,我们克服了这些障碍,现在距离实现直观医疗保健解决方案的愿景又近了一步。

金色五星级

加速您的医疗保健人工智能
应用程序开发 100%