适用于 AI 和 ML 项目的病历转录数据集

现成的病历转录数据集可快速启动您的医疗保健人工智能项目。

医疗记录转录数据集

插入您今天缺少的数据源

使用黄金标准医学转录数据集训练医疗 AI

使用一流的训练数据准确训练您的医疗 AI 模型。 转录病历数据是指医患对话的转录、医疗报告的转录以及医疗评估的转录。它有助于记录患者的病史,以便日后就诊,并作为医生的参考依据。我们现成的数据目录让您轻松获取值得信赖的医疗培训数据。

现成的转录医疗记录:

我们的医疗记录转录数据集旨在帮助医疗保健组织和人工智能开发人员:

  • 训练 NLP 系统 临床文本分析.
  • 构建 预测性医疗保健人工智能 楷模。
  • 提高效率 医疗文件 通过自动化。

我们的数据集的主要特点:

  • 转录 257,977 小时的真实医生口述 来自 31 个专业的医疗保健语音模型训练
  • 各种转录的医疗记录 - 手术报告, 出院总结, 咨询记录、入院记录、急诊记录、诊所记录等等。
  • PII 编辑音频和文字记录遵循 安全港指南 符合 HIPAA
其他大约病历数量大约字符数
疼痛医学1135,515
足科手术241,08,258
整形外科 – 专业1836,04,359
医师助理。381,27,349
物理治疗师1,71346,81,870
物理医学与康复23,5235,77,01,697
儿科9,2714,26,54,058
小儿外科2390,525
儿科专科68220,63,509
小儿肺病学401,58,625
小儿牙科4208,99,253
病理43,4622,76,60,828
聚苯胺1,45,96044,53,32,915
足疗12,0563,91,63,411
疼痛治疗3062,650
耳鼻喉科19,5483,95,00,098
骨科5,5661,36,79,541
骨科1,45,05327,75,08,345
骨科与运动医学3,1651,43,93,798
口腔外科1332,527
口腔颌面外科818,733
眼科19,2994,48,44,680
手术护理513,637
肿瘤科及癌症82,30029,63,70,809
职业理疗师682,38,853
手术2,36,78864,27,35,680
伤口护理2115,82,123
血管/一般2684,11,007
血管外科1566,74,129
泌尿外科96,93413,55,27,616
上消化道手术581,80,361
不明7,48,0541,69,50,98,900
创伤和骨科1,30853,08,512
移植321,28,670
胸外科371,53,325
胸科医学271,64,106
外科专科29010,14,789
外科医师助理34,315
职业医学76334,76,696
运动药物491,48,200
言语治疗3279,81,803
风湿病1244,32,080
住院医师64119,90,867
康复训练30,0789,61,87,590
放射线学6,30,98364,19,87,812
与肺部有关的64,36815,66,29,273
心理治疗(专业)22929,61,345
精神病70,26935,10,76,474
初级保健就读727,134
预防医学1914,35,298
牙科1,23329,74,753
常规31313,77,179
胃肠病学62,15812,79,38,968
家庭实践2,49869,42,820
家庭护士执业者9,0181,86,24,462
家庭医学科2,63,48053,40,93,592
内分泌3,21291,07,557
急诊室专家37812,72,557
紧急灾难62,25616,24,31,343
ED医师助理7031,316
耳鼻喉65820,74,977
诊断放射学7,59172,68,441
皮肤科3,47462,28,845
一般牙科诊所2599,740
重症监护9,6453,42,13,951
临床生理学16010,03,807
临床血液学27,546
心胸外科1055,321
心胸1227,06,280
心脏病15,66,7213,20,98,50,575
亚太广播电台1,69354,36,558
麻醉药921,300
麻醉学22,2804,80,25,191
过敏和免疫学22,20248,273,220
事故和紧急情况359723,866
IH-工业健康94527,57,753
产科/妇科42,73911,41,18,874
执业护士 - 家庭1132,81,032
护士执业43227,19,033
神经外科75531,46,223
神经内科17,7864,90,64,199
神经/脑外伤1,15751,42,035
肾脏病学39,82110,14,22,013
药物1223,68,833
医学肿瘤学674,87,088
内科、肺科、重症医学、睡眠医学1022,10,331
内科和肾内科1115,19,283
内科6,23,0721,74,14,86,763

合计

5,172,76611,331,920,127
Hospitalist1,49344,03,854
临终关怀和姑息医学412,10,206
197,869
血液学 – 肿瘤学39411,20,038
妇科2598,953
GI55018,71,706
老年医学5,3231,57,49,785
普通外科2,22089,65,239
普通外科医生89314,11,292
普通精神病学361,18,388
一般用药32711,91,224

我们处理所有类型的数据许可,即文本、音频、视频或图像。 数据集由用于 ML 的医学数据集组成:医师听写数据集、医师临床笔记、医学对话数据集、医学转录数据集、医患对话、医学文本数据、医学图像 - CT 扫描、MRI、超声(收集的基础定制要求) .

赛普联系我们

不能找到你想要的?

正在收集所有数据类型的新的现成医疗数据集 

立即联系我们,免除您的医疗培训数据收集后顾之忧

  • 通过注册,我同意 Shaip 隐私政策服务条款 并同意接受来自 Shaip 的 B2B 营销传播。

这些是医疗对话、报告和评估的文本版本,例如医患互动和诊断记录,用于记录和分析。

他们提供结构化数据来训练临床 NLP、诊断自动化、预测分析和决策支持的 AI 模型,从而改善医疗保健结果。

该数据集包括手术报告、出院总结、会诊记录、入院记录、放射学报告等,涵盖多个医学专业。

是的,所有记录都经过去身份识别处理,删除个人身份信息 (PII),确保患者隐私并符合法律标准。

是的,所有数据集均遵守 HIPAA 和其他全球隐私法规,确保医疗数据的安全和合乎道德的处理。

是的,数据集可以根据特定项目需求进行定制,例如选择某些专业、人口统计或记录类型。

转录数据经过严格的质量检查,包括专家的注释和验证,以确保高准确性和一致性。

这些记录使人工智能系统能够分析医学文本、自动化文档、提高诊断准确性并支持决策,从而带来更好的患者治疗结果和更高效的医疗保健流程。

定价取决于数据集大小、定制化程度和项​​目范围等因素。请填写“联系我们”表格,告知您的具体需求,以便我们为您提供最优报价。

交付时间表根据项目规模和复杂性而有所不同,但旨在有效地满足商定的期限。