适用于 AI 和 ML 项目的病历转录数据集
现成的病历转录数据集可快速启动您的医疗保健人工智能项目。
插入您今天缺少的数据源
使用黄金标准医学转录数据集训练医疗 AI
使用一流的训练数据准确训练您的医疗 AI 模型。 转录病历数据是指医患对话的转录、医疗报告的转录以及医疗评估的转录。它有助于记录患者的病史,以便日后就诊,并作为医生的参考依据。我们现成的数据目录让您轻松获取值得信赖的医疗培训数据。
现成的转录医疗记录:
我们的医疗记录转录数据集旨在帮助医疗保健组织和人工智能开发人员:
- 训练 NLP 系统 临床文本分析.
- 构建 预测性医疗保健人工智能 楷模。
- 提高效率 医疗文件 通过自动化。
我们的数据集的主要特点:
- 转录 257,977 小时的真实医生口述 来自 31 个专业的医疗保健语音模型训练
- 各种转录的医疗记录 - 手术报告, 出院总结, 咨询记录、入院记录、急诊记录、诊所记录等等。
- PII 编辑音频和文字记录遵循 安全港指南 符合 HIPAA
| 其他 | 大约病历数量 | 大约字符数 |
|---|---|---|
| 疼痛医学 | 11 | 35,515 |
| 足科手术 | 24 | 1,08,258 |
| 整形外科 – 专业 | 183 | 6,04,359 |
| 医师助理。 | 38 | 1,27,349 |
| 物理治疗师 | 1,713 | 46,81,870 |
| 物理医学与康复 | 23,523 | 5,77,01,697 |
| 儿科 | 9,271 | 4,26,54,058 |
| 小儿外科 | 23 | 90,525 |
| 儿科专科 | 682 | 20,63,509 |
| 小儿肺病学 | 40 | 1,58,625 |
| 小儿牙科 | 420 | 8,99,253 |
| 病理 | 43,462 | 2,76,60,828 |
| 聚苯胺 | 1,45,960 | 44,53,32,915 |
| 足疗 | 12,056 | 3,91,63,411 |
| 疼痛治疗 | 30 | 62,650 |
| 耳鼻喉科 | 19,548 | 3,95,00,098 |
| 骨科 | 5,566 | 1,36,79,541 |
| 骨科 | 1,45,053 | 27,75,08,345 |
| 骨科与运动医学 | 3,165 | 1,43,93,798 |
| 口腔外科 | 13 | 32,527 |
| 口腔颌面外科 | 8 | 18,733 |
| 眼科 | 19,299 | 4,48,44,680 |
| 手术护理 | 5 | 13,637 |
| 肿瘤科及癌症 | 82,300 | 29,63,70,809 |
| 职业理疗师 | 68 | 2,38,853 |
| 手术 | 2,36,788 | 64,27,35,680 |
| 伤口护理 | 211 | 5,82,123 |
| 血管/一般 | 268 | 4,11,007 |
| 血管外科 | 156 | 6,74,129 |
| 泌尿外科 | 96,934 | 13,55,27,616 |
| 上消化道手术 | 58 | 1,80,361 |
| 不明 | 7,48,054 | 1,69,50,98,900 |
| 创伤和骨科 | 1,308 | 53,08,512 |
| 移植 | 32 | 1,28,670 |
| 胸外科 | 37 | 1,53,325 |
| 胸科医学 | 27 | 1,64,106 |
| 外科专科 | 290 | 10,14,789 |
| 外科医师助理 | 3 | 4,315 |
| 职业医学 | 763 | 34,76,696 |
| 运动药物 | 49 | 1,48,200 |
| 言语治疗 | 327 | 9,81,803 |
| 风湿病 | 124 | 4,32,080 |
| 住院医师 | 641 | 19,90,867 |
| 康复训练 | 30,078 | 9,61,87,590 |
| 放射线学 | 6,30,983 | 64,19,87,812 |
| 与肺部有关的 | 64,368 | 15,66,29,273 |
| 心理治疗(专业) | 229 | 29,61,345 |
| 精神病 | 70,269 | 35,10,76,474 |
| 初级保健就读 | 7 | 27,134 |
| 预防医学 | 191 | 4,35,298 |
| 牙科 | 1,233 | 29,74,753 |
| 常规 | 313 | 13,77,179 |
| 胃肠病学 | 62,158 | 12,79,38,968 |
| 家庭实践 | 2,498 | 69,42,820 |
| 家庭护士执业者 | 9,018 | 1,86,24,462 |
| 家庭医学科 | 2,63,480 | 53,40,93,592 |
| 内分泌 | 3,212 | 91,07,557 |
| 急诊室专家 | 378 | 12,72,557 |
| 紧急灾难 | 62,256 | 16,24,31,343 |
| ED医师助理 | 70 | 31,316 |
| 耳鼻喉 | 658 | 20,74,977 |
| 诊断放射学 | 7,591 | 72,68,441 |
| 皮肤科 | 3,474 | 62,28,845 |
| 一般牙科诊所 | 25 | 99,740 |
| 重症监护 | 9,645 | 3,42,13,951 |
| 临床生理学 | 160 | 10,03,807 |
| 临床血液学 | 2 | 7,546 |
| 心胸外科 | 10 | 55,321 |
| 心胸 | 122 | 7,06,280 |
| 心脏病 | 15,66,721 | 3,20,98,50,575 |
| 亚太广播电台 | 1,693 | 54,36,558 |
| 麻醉药 | 9 | 21,300 |
| 麻醉学 | 22,280 | 4,80,25,191 |
| 过敏和免疫学 | 22,202 | 48,273,220 |
| 事故和紧急情况 | 359 | 723,866 |
| IH-工业健康 | 945 | 27,57,753 |
| 产科/妇科 | 42,739 | 11,41,18,874 |
| 执业护士 - 家庭 | 113 | 2,81,032 |
| 护士执业 | 432 | 27,19,033 |
| 神经外科 | 755 | 31,46,223 |
| 神经内科 | 17,786 | 4,90,64,199 |
| 神经/脑外伤 | 1,157 | 51,42,035 |
| 肾脏病学 | 39,821 | 10,14,22,013 |
| 药物 | 122 | 3,68,833 |
| 医学肿瘤学 | 67 | 4,87,088 |
| 内科、肺科、重症医学、睡眠医学 | 102 | 2,10,331 |
| 内科和肾内科 | 111 | 5,19,283 |
| 内科 | 6,23,072 | 1,74,14,86,763 |
合计 | 5,172,766 | 11,331,920,127 |
| Hospitalist | 1,493 | 44,03,854 |
| 临终关怀和姑息医学 | 41 | 2,10,206 |
| 他 | 19 | 7,869 |
| 血液学 – 肿瘤学 | 394 | 11,20,038 |
| 妇科 | 25 | 98,953 |
| GI | 550 | 18,71,706 |
| 老年医学 | 5,323 | 1,57,49,785 |
| 普通外科 | 2,220 | 89,65,239 |
| 普通外科医生 | 893 | 14,11,292 |
| 普通精神病学 | 36 | 1,18,388 |
| 一般用药 | 327 | 11,91,224 |
我们处理所有类型的数据许可,即文本、音频、视频或图像。 数据集由用于 ML 的医学数据集组成:医师听写数据集、医师临床笔记、医学对话数据集、医学转录数据集、医患对话、医学文本数据、医学图像 - CT 扫描、MRI、超声(收集的基础定制要求) .
不能找到你想要的?
正在收集所有数据类型的新的现成医疗数据集
立即联系我们,免除您的医疗培训数据收集后顾之忧
常见问题
1. 什么是转录病历?
这些是医疗对话、报告和评估的文本版本,例如医患互动和诊断记录,用于记录和分析。
2. 为什么它们对 AI/ML 项目很重要?
他们提供结构化数据来训练临床 NLP、诊断自动化、预测分析和决策支持的 AI 模型,从而改善医疗保健结果。
3. 有哪些类型的记录?
该数据集包括手术报告、出院总结、会诊记录、入院记录、放射学报告等,涵盖多个医学专业。
4. 转录的记录是否经过去识别化处理?
是的,所有记录都经过去身份识别处理,删除个人身份信息 (PII),确保患者隐私并符合法律标准。
5. 这些记录是否符合 HIPAA 等法规?
是的,所有数据集均遵守 HIPAA 和其他全球隐私法规,确保医疗数据的安全和合乎道德的处理。
6. 数据集可以定制吗?
是的,数据集可以根据特定项目需求进行定制,例如选择某些专业、人口统计或记录类型。
7.数据质量如何保证?
转录数据经过严格的质量检查,包括专家的注释和验证,以确保高准确性和一致性。
8. 转录的医疗记录如何改善医疗保健 AI 解决方案?
这些记录使人工智能系统能够分析医学文本、自动化文档、提高诊断准确性并支持决策,从而带来更好的患者治疗结果和更高效的医疗保健流程。
9. 转录的医疗记录数据集的费用是多少?
定价取决于数据集大小、定制化程度和项目范围等因素。请填写“联系我们”表格,告知您的具体需求,以便我们为您提供最优报价。
10. 这些数据集的交付时间表是什么?
交付时间表根据项目规模和复杂性而有所不同,但旨在有效地满足商定的期限。