🔬

PyHealth Clinical ML

Name: PyHealth Clinical ML
Author: K-Dense-AI

PyHealthの Dataset → Task → Model → Trainer → Metrics フレームワークを使用して、EHR、シグナル、イメージングデータに対するエンドツーエンドの臨床深層学習パイプラインを構築します。

K-Dense-AI作v1.0.0

Data & Analytics

VMに接続中...

npx clawhub@latest install pyhealth

2.3kスター数

356ダウンロード数

0現在のインストール数

v1.0.0バージョン

ソースコードを見る

Overview

PyHealth は、モジュール式の5段階パイプライン（Dataset → Task → Model → Trainer → Metrics）を中心に構築された、臨床ディープラーニング向け Python ツールキットです。このスキルをインストールすると、AI アシスタントに PyHealth Clinical ML の API に関する専門家レベルの知識が付与され、EHR データセット（MIMIC-III/IV、eICU、OMOP）、臨床予測タスク、モデルアーキテクチャ、医療コードユーティリティをカバーします。生の臨床データからトレーニング済み・評価済みモデルまで、定型的なコードを書かずに最短で到達できる方法です。

When to Use PyHealth Clinical ML

Best Fit

MIMIC-III/IV、eICU、OMOP-CDM、EHRShot などの EHR データセットを扱い、臨床予測モデルをトレーニングしたい場合。
院内死亡率、30日再入院、在院日数、薬剤推薦などの臨床アウトカムを予測する必要がある場合。
PyHealth を使用して、生理信号（SleepEDF、SHHS、ISRUC）や医療画像（ChestX-ray14、COVID19-CXR）を含むパイプラインを構築している場合。
ICD-9-CM、ICD-10-CM、ATC、NDC、RxNorm、CCS などの医療コードを調べたり、相互マッピングする必要がある場合。

When Not to Use

臨床構造を持たない一般的な表形式のMLを行っている場合 — 標準的なscikit-learnまたはPyTorchのワークフローの方が適切です。
データがDataset → Task → Model → Trainer → Metricsのパターンに合わず、完全にカスタムなトレーニングループをゼロから必要とする場合。

主な機能

5段階モジュラーパイプライン

PyHealth Clinical ML は、Dataset → Task → Model → Trainer → Metrics という明確なパターンを採用しており、各ステージには安定したインターフェースが定義されています。このスキルでは、BaseDataset と SampleDataset の重要な違いを含め、各ステージを正しく理解・活用する方法をご案内します。

幅広いデータセットのサポート

MIMIC-III/IV、eICU、OMOP-CDM、EHRShot、SleepEDF、SHHS、ISRUC、ChestX-ray14、COVID19-CXR、TUEV、およびTUABに対応しています。ローカルCSVルート、合成デモバケット、および永続的なキャッシュに関するガイダンスも含まれています。

臨床タスクライブラリ

死亡率予測、再入院、在院日数、薬剤推薦、睡眠ステージング、ICDコーディング、EEGイベント検出、および匿名化に関するタスク定義を提供します。各タスクは対応する正しいデータセットクラスに紐付けられています。

モデルアーキテクチャガイダンス

Transformer、RETAIN、GAMENet、SafeDrug、MICRON、StageNet、AdaCare、CNN、RNN、MLPモデルの選択と設定をサポートします。各タスクタイプに応じたモデル固有の引数や、適切なmonitorメトリクスの設定方法も含まれます。

医療コードユーティリティ

ICD-9-CM、ICD-10-CM、ATC、NDC、RxNorm、CCSの各コードシステムにわたる検索およびクロスマッピングをサポートします。コホート構築や薬剤関連タスクに不可欠な機能です。

データ漏洩の防止

split_by_patient を使用して患者レベルの分割を強制し、同一患者がトレーニングセットとテストセットの両方に出現することを防ぎます。これは、臨床MLにおいてよく見られる、気づきにくいエラーです。

ユースケース

院内死亡率予測

MIMIC-IIIまたはMIMIC-IVを読み込み、対応する死亡率タスクを適用して、TransformerまたはRETAINモデルをトレーニングします — このスキルでは、適切な分割戦略とメトリクスの選択を含む、すべてのステップを順を追って説明します。

薬剤推薦パイプライン

MIMIC-IIIの処方データに対してGAMENet、SafeDrug、またはMICRONを使用し、pr_auc_samplesやjaccard_samplesなどのマルチラベル指標を活用することで、安全かつ正確な薬剤セット予測を実現します。これらの手法はPyHealth Clinical MLによって提供されています。

SleepEDF または SHHS での睡眠段階分類

PyHealth Clinical ML を使用して、SleepEDF または SHHS データセット上で StageNet または CNN アーキテクチャによる睡眠段階分類パイプラインを構築します。信号固有のデータセット読み込みおよび多クラスメトリクスの設定についてのガイダンスも含まれています。

医療コードマッピングによるコホート研究

PyHealth Clinical MLに組み込まれたコードユーティリティ関数を使用して、NDCコードをATCレベルにクロスマッピングしたり、ICD-9診断をICD-10に変換したりして、カスタムのルックアップテーブルを作成することなくコホートを構築できます。

動作要件

Python: PyHealth 2.0には≥ 3.12かつ< 3.14、PyHealth 1.xには≥ 3.9 (uv add pyhealth==1.16)
パッケージマネージャー: uvを推奨 (uv add pyhealth)；pipも対応
PyTorch: 依存関係として自動的に導入される
MIMICデータへのアクセス: 実際のMIMIC-III/IVデータにはPhysioNetの資格認定が必要；資格認定なしのデモ用に合成MIMIC-IIIバケットが利用可能
GPU（オプション）: 大規模モデルにはCUDA対応GPUを推奨；CPUトレーニングも対応

インストール方法

ターミナルで実行

npx clawhub@latest install pyhealth

または

このページ上部のインストールボタンをクリックするとワンクリックでセットアップできます

VMに接続中...

npx clawhub@latest install pyhealth

2.3kスター数

356ダウンロード数

0現在のインストール数

v1.0.0バージョン

ソースコードを見る

レビュー

0件のレビュー

レビューを書くにはログイン

まだレビューはありません。最初の体験をシェアしましょう！