数据源采集
连接全国主流三甲医院,获取高可信度多中心原始数据,支持单病种及多学科交叉研究。

从采集、清洗到标注,为您提供一站式专业支持
连接全国主流三甲医院,获取高可信度多中心原始数据,支持单病种及多学科交叉研究。
基于 NLP、CV 等 AI 技术进行自动化脱敏、标准映射与质量评估,确保数据高度结构化。
执业医师团队入驻,针对影像病灶、组织切片、文本实体提供高一致性的专家级标注。
辅助真实世界研究(RWE)开展,提供统计建模、疗效分析及投稿级别的数据支撑包。
已由医学委员会审核通过的高质量公共或专有数据集
本数据集整合来自国内12家三甲医院心血管内科的住院及门诊电子病历数据,覆盖2015年至2024年间的冠心病、心力衰竭、心房颤动等主要心血管疾病患者,总记录规模超过18万例,包含结构化EMR、实验室检验、心脏超声、冠脉造影报告及长期随访信息。数据经脱敏、ICD-10标准化及NLP结构化处理,适用于临床特征分析、风险预测模型构建及真实世界研究。
本数据集基于国内6家三甲医院血液科急性淋巴细胞白血病患者的电子病历与随访记录构建,纳入2014年1月至2022年12月初诊的8500例患者,整合人口学信息、诊断信息(ICD-10编码C91.0)、实验室检验、化疗方案、微小残留病监测及生存结局等数据,经脱敏与结构化处理,中位随访4.2年,可用于临床预后研究、风险分层模型开发及AI辅助诊疗决策支持。
本数据集基于神经内科专病数据库与运动障碍门诊系统构建,纳入2014—2025年帕金森患者约2.4万人,包含UPDRS评分、运动监测、脑MRI、药物使用及认知评估等数据。数据经脱敏处理与时间标准化,可用于疾病分期分析、运动功能预测及神经退行性疾病AI模型训练。
本数据集来源于内分泌科与肾内科联合专病数据库,收录2015—2025年糖尿病肾病患者约4.7万人,涵盖电子病历、尿蛋白检测、肾功能指标、用药方案及并发症记录。数据采用SNOMED CT与ICD编码统一治理,并完成病历结构化处理,可用于肾功能进展预测、并发症分析及AI辅助评估研究。
数据集来自5家呼吸专科医院2016—2024年诊断的特发性肺纤维化患者3,100例,包含薄层HRCT影像、肺功能参数(FVC、DLCO)、六分钟步行试验及抗纤维化药物治疗记录。影像由放射科医师进行网格状病变及蜂窝影标注,可支持影像组学分析、疾病进展预测及药物疗效评估。
本数据集整合记忆门诊、神经影像中心及社区认知筛查项目数据,纳入2013—2025年阿尔兹海默症及轻度认知障碍患者约1.9万人,涵盖认知量表、脑MRI、PET影像、生物标志物及用药记录。数据经统一结构化与脱敏治理,可用于疾病早筛、认知退化预测及影像AI训练研究。