使用 PyHealth 的 Dataset → Task → Model → Trainer → Metrics 框架,在电子健康记录、信号和影像数据上构建端到端的临床深度学习流水线。
PyHealth 是一个面向临床深度学习的 Python 工具包,围绕模块化的五阶段流水线构建:Dataset → Task → Model → Trainer → Metrics。安装此技能,可为您的 AI 助手赋予 PyHealth API 的专家级知识,涵盖 EHR 数据集(MIMIC-III/IV、eICU、OMOP)、临床预测任务、模型架构以及医疗编码工具。这是从原始临床数据到训练完成、经过评估的模型最快捷的方式,无需编写繁琐的样板代码。
PyHealth Clinical ML 强制执行一套清晰的 数据集 → 任务 → 模型 → 训练器 → 评估指标 模式,其中每个阶段都具有稳定的接口。本技能将引导你正确完成每个阶段,包括 BaseDataset 与 SampleDataset 之间的关键区别。
涵盖 MIMIC-III/IV、eICU、OMOP-CDM、EHRShot、SleepEDF、SHHS、ISRUC、ChestX-ray14、COVID19-CXR、TUEV 和 TUAB。包含关于本地 CSV 根目录、合成演示存储桶以及持久化缓存的使用指导。
提供以下任务的定义:死亡率预测、再入院预测、住院时长预测、药物推荐、睡眠分期、ICD编码、脑电图事件检测以及去标识化——每项任务均与对应的数据集类相匹配。
帮助您选择和配置 Transformer、RETAIN、GAMENet、SafeDrug、MICRON、StageNet、AdaCare、CNN、RNN 和 MLP 模型,包括各模型专属参数以及每种任务类型所对应的正确 monitor 指标。
支持在 ICD-9-CM、ICD-10-CM、ATC、NDC、RxNorm 和 CCS 编码系统之间进行查找与交叉映射——对于队列构建和药物相关任务至关重要。
通过 split_by_patient 强制执行患者级别的数据集划分,防止同一患者同时出现在训练集和测试集中——这是临床机器学习中一种常见且难以察觉的错误。
加载 MIMIC-III 或 MIMIC-IV 数据集,应用对应的死亡率预测任务,并训练 Transformer 或 RETAIN 模型——该技能涵盖每个步骤,包括正确的数据集划分策略和评估指标选择,由 PyHealth Clinical ML 提供支持。
在 MIMIC-III 处方数据上使用 GAMENet、SafeDrug 或 MICRON,结合 pr_auc_samples 和 jaccard_samples 等多标签评估指标,实现安全、准确的药物组合预测。
使用 StageNet 或 CNN 架构,在 SleepEDF 或 SHHS 数据集上构建睡眠分期流水线,并提供信号特定数据集加载及多分类指标配置的指导,由 PyHealth Clinical ML 提供支持。
使用 PyHealth Clinical ML 内置的代码工具函数,将 NDC 代码交叉映射到 ATC 层级,或将 ICD-9 诊断代码转换为 ICD-10,用于队列构建,无需编写自定义查找表。
uv add pyhealth==1.16)uv(uv add pyhealth);也支持 pipnpx clawhub@latest install pyhealth登录后撰写评价
暂无评价。来分享你的使用体验吧!