符合 HIPAA 标准的医生听写音频数据,用于医疗保健 AI

使用符合隐私和 HIPAA 法规的现成医生口述音频数据加速医疗保健 AI 创新。

医生听写音频数据集

高质量医疗音频数据集,助力打造更智能的 AI 模型

我们去识别化的医疗保健数据集包含来自 31 个不同专业的音频文件,由医生精心录制。这些录音详细描述了患者的临床状况和护理计划,这些内容源自医院和临床环境中真实的医患互动。该数据集完全符合隐私法规,是训练高级医疗保健 AI 模型的理想选择。

按性别划分的医疗音频数据
其他面条 患者音频文件(播放时间以小时为单位) 音频文件总数
合计257,9775,172,766
(男)58,8502,444,910
(女)113,4061,290,900
未知85,7211,436,956
按专业划分的医疗音频数据
其他面条 患者音频文件(播放时间以小时为单位) 音频文件总数
合计257,9775,172,766
事故和紧急情况9359
过敏和免疫学115222202
麻醉学67722280
麻醉药19
亚太广播电台1631693
心脏病675041566721
心胸17122
心胸外科110
临床血液学02
结肠和直肠手术7162
结直肠外科医生45984
重症监护药2204328
牙医165
皮肤科77123014
营养师44736
急救药物4911112518
内分泌2057052
耳鼻喉科7010175477
家庭医学1767106733
胃肠病学145840365
一般用药1405757
一般做法411318
普通外科203871744
妇科3269103370
手外科245
血液学2588125
Hospitalist5931142529
传染病49314001
内科15410445591
介入心脏病学151143035
母胎医学511355
新生儿104524760
肾脏病学73520334
神经内科226963774
神经外科46211990
核医学223
妇产科3562122303
肿瘤科及癌症293882996
眼科131641047
验光331066
骨科5665164483
耳鼻喉科3433100811
病理1664097
小儿肺病学440
儿科专科35682
小儿外科223
儿科8779271
物理医学与康复134723523
物理治疗师1141713
医师助理。638
足科手术424
足疗47312296
基层医疗65120120
精神病212060381
肺病129035290
放射肿瘤学2396558
放射线学334599641
风湿病2938729
重症监护病房125
言语病理学328
外科肿瘤科2175758
胸外科1073336
移植手术611535
泌尿外科317096934
上消化道手术458
血管外科19156
血管/一般9268
伤口护理15211
按设备分类的医疗音频数据
其他面条 患者音频文件(播放时间以小时为单位) 音频文件总数
合计257,9775,172,766
苹果手机66632,382
数字录音机1,65922,377
混合型69,8181,408,679
智能手机51,5331,306,405
语音麦克风10,329257,730
电话听写120,8672,071,557
未知3,10473,636

我们处理所有类型的数据许可,即文本、音频、视频或图像。 数据集由用于 ML 的医学数据集组成:医师听写数据集、医师临床笔记、医学对话数据集、医学转录数据集、医患对话、医学文本数据、医学图像 - CT 扫描、MRI、超声(收集的基础定制要求) .

赛普联系我们

不能找到你想要的?

正在收集所有数据类型的新的现成医疗数据集

立即联系我们,免除您的医疗培训数据收集后顾之忧

  • 此字段是为了进行验证,并应保持不变。
  • 通过注册,我同意 Shaip 隐私政策 以及 服务条款 并同意接受来自 Shaip 的 B2B 营销传播。

医生口述音频数据包括医生在会诊或医院就诊期间描述患者的临床状况、治疗计划或病史的音频文件。

这些数据对于训练语音识别、自然语言处理 (NLP) 和临床文档自动化领域的 AI 模型至关重要。它有助于构建用于转录、分析和改进医疗文档工作流程的系统。

该数据集涵盖来自 257,977 个医学专科的 31 小时真实医生口述记录。音频使用各种设备录制,包括电话、数字录音机、智能手机和语音麦克风。

是的,所有音频文件都经过去识别处理,删除个人身份信息 (PII),确保患者的隐私。

是的,数据集遵守 HIPAA 和安全港指南以及其他全球隐私标准。

是的,可以根据项目要求针对特定专业、人口统计或记录设备类型定制数据集。

当然。这些数据集非常庞大,包含数百万个音频文件,因此适合小型和大型 AI/ML 项目。

医疗音频数据和相应的记录以标准格式提供,可以无缝集成到语音识别和自然语言处理 (NLP) 模型中。

音频数据经过严格的质量检查,并由领域专家验证注释以确保准确性和可靠性。

费用取决于数据量、定制化程度和项​​目范围等因素。请您填写“联系我们”表格,告知您的具体需求,以便我们为您提供最优报价。

交付时间表根据项目的规模和复杂性而有所不同,但其结构是为了有效地满足最后期限。

这些数据集增强了人工智能在自动化临床文档、提高转录准确性以及帮助医疗保健提供者做出更好决策方面的能力。