🔬

PyHealth Clinical ML

Name: PyHealth Clinical ML
Author: K-Dense-AI

使用 PyHealth 的 Dataset → Task → Model → Trainer → Metrics 框架，在电子健康记录、信号和影像数据上构建端到端的临床深度学习流水线。

作者 K-Dense-AIv1.0.0

Data & Analytics

正在连接 VM...

npx clawhub@latest install pyhealth

2.3kStar 数

356下载次数

0当前安装数

v1.0.0版本

查看源码

概述

PyHealth 是一个面向临床深度学习的 Python 工具包，围绕模块化的五阶段流水线构建：Dataset → Task → Model → Trainer → Metrics。安装此技能，可为您的 AI 助手赋予 PyHealth API 的专家级知识，涵盖 EHR 数据集（MIMIC-III/IV、eICU、OMOP）、临床预测任务、模型架构以及医疗编码工具。这是从原始临床数据到训练完成、经过评估的模型最快捷的方式，无需编写繁琐的样板代码。

PyHealth Clinical ML 适用场景

适合使用

您正在使用 MIMIC-III/IV、eICU、OMOP-CDM 或 EHRShot 等 EHR 数据集，并希望训练临床预测模型。
您需要预测临床结果，例如院内死亡率、30 天再入院率、住院时长或药物推荐。
您正在使用 PyHealth Clinical ML 构建涉及生理信号（SleepEDF、SHHS、ISRUC）或医学影像（ChestX-ray14、COVID19-CXR）的流水线。
您需要查找或交叉映射医疗代码，例如 ICD-9-CM、ICD-10-CM、ATC、NDC、RxNorm 或 CCS。

不适合使用

您正在进行没有临床结构的通用表格机器学习——标准的 scikit-learn 或 PyTorch 工作流更为合适。
您的数据不符合 Dataset → Task → Model → Trainer → Metrics 模式，并且您需要从头开始构建完全自定义的训练循环。

核心功能

5阶段模块化流水线

PyHealth Clinical ML 强制执行一套清晰的数据集 → 任务 → 模型 → 训练器 → 评估指标模式，其中每个阶段都具有稳定的接口。本技能将引导你正确完成每个阶段，包括 BaseDataset 与 SampleDataset 之间的关键区别。

广泛的数据集支持

涵盖 MIMIC-III/IV、eICU、OMOP-CDM、EHRShot、SleepEDF、SHHS、ISRUC、ChestX-ray14、COVID19-CXR、TUEV 和 TUAB。包含关于本地 CSV 根目录、合成演示存储桶以及持久化缓存的使用指导。

临床任务库

提供以下任务的定义：死亡率预测、再入院预测、住院时长预测、药物推荐、睡眠分期、ICD编码、脑电图事件检测以及去标识化——每项任务均与对应的数据集类相匹配。

模型架构指导

帮助您选择和配置 Transformer、RETAIN、GAMENet、SafeDrug、MICRON、StageNet、AdaCare、CNN、RNN 和 MLP 模型，包括各模型专属参数以及每种任务类型所对应的正确 monitor 指标。

医疗编码工具

支持在 ICD-9-CM、ICD-10-CM、ATC、NDC、RxNorm 和 CCS 编码系统之间进行查找与交叉映射——对于队列构建和药物相关任务至关重要。

数据泄漏预防

通过 split_by_patient 强制执行患者级别的数据集划分，防止同一患者同时出现在训练集和测试集中——这是临床机器学习中一种常见且难以察觉的错误。

使用场景

院内死亡率预测

加载 MIMIC-III 或 MIMIC-IV 数据集，应用对应的死亡率预测任务，并训练 Transformer 或 RETAIN 模型——该技能涵盖每个步骤，包括正确的数据集划分策略和评估指标选择，由 PyHealth Clinical ML 提供支持。

药物推荐流程

在 MIMIC-III 处方数据上使用 GAMENet、SafeDrug 或 MICRON，结合 pr_auc_samples 和 jaccard_samples 等多标签评估指标，实现安全、准确的药物组合预测。

基于EEG/PSG数据的睡眠分期

使用 StageNet 或 CNN 架构，在 SleepEDF 或 SHHS 数据集上构建睡眠分期流水线，并提供信号特定数据集加载及多分类指标配置的指导，由 PyHealth Clinical ML 提供支持。

用于队列研究的医疗代码映射

使用 PyHealth Clinical ML 内置的代码工具函数，将 NDC 代码交叉映射到 ATC 层级，或将 ICD-9 诊断代码转换为 ICD-10，用于队列构建，无需编写自定义查找表。

系统要求

Python：PyHealth 2.0 需要 ≥ 3.12 且 < 3.14；PyHealth 1.x 需要 ≥ 3.9（uv add pyhealth==1.16）
包管理器：推荐使用 uv（uv add pyhealth）；也支持 pip
PyTorch：作为依赖项自动引入
MIMIC 数据访问：访问真实的 MIMIC-III/IV 数据需要 PhysioNet 资质认证；演示用途可使用无需认证的合成 MIMIC-III 数据集
GPU（可选）：较大模型推荐使用兼容 CUDA 的 GPU；也支持 CPU 训练

安装方式

在终端中运行

npx clawhub@latest install pyhealth

或

点击本页顶部的安装按钮即可一键设置

正在连接 VM...

npx clawhub@latest install pyhealth

2.3kStar 数

356下载次数

0当前安装数

v1.0.0版本

查看源码

评价

0 条评价

登录后撰写评价

暂无评价。来分享你的使用体验吧！