PyHealthの Dataset → Task → Model → Trainer → Metrics フレームワークを使用して、EHR、シグナル、イメージングデータに対するエンドツーエンドの臨床深層学習パイプラインを構築します。
PyHealth は、モジュール式の5段階パイプライン(Dataset → Task → Model → Trainer → Metrics)を中心に構築された、臨床ディープラーニング向け Python ツールキットです。このスキルをインストールすると、AI アシスタントに PyHealth Clinical ML の API に関する専門家レベルの知識が付与され、EHR データセット(MIMIC-III/IV、eICU、OMOP)、臨床予測タスク、モデルアーキテクチャ、医療コードユーティリティをカバーします。生の臨床データからトレーニング済み・評価済みモデルまで、定型的なコードを書かずに最短で到達できる方法です。
PyHealth Clinical ML は、Dataset → Task → Model → Trainer → Metrics という明確なパターンを採用しており、各ステージには安定したインターフェースが定義されています。このスキルでは、BaseDataset と SampleDataset の重要な違いを含め、各ステージを正しく理解・活用する方法をご案内します。
MIMIC-III/IV、eICU、OMOP-CDM、EHRShot、SleepEDF、SHHS、ISRUC、ChestX-ray14、COVID19-CXR、TUEV、およびTUABに対応しています。ローカルCSVルート、合成デモバケット、および永続的なキャッシュに関するガイダンスも含まれています。
死亡率予測、再入院、在院日数、薬剤推薦、睡眠ステージング、ICDコーディング、EEGイベント検出、および匿名化に関するタスク定義を提供します。各タスクは対応する正しいデータセットクラスに紐付けられています。
Transformer、RETAIN、GAMENet、SafeDrug、MICRON、StageNet、AdaCare、CNN、RNN、MLPモデルの選択と設定をサポートします。各タスクタイプに応じたモデル固有の引数や、適切なmonitorメトリクスの設定方法も含まれます。
ICD-9-CM、ICD-10-CM、ATC、NDC、RxNorm、CCSの各コードシステムにわたる検索およびクロスマッピングをサポートします。コホート構築や薬剤関連タスクに不可欠な機能です。
split_by_patient を使用して患者レベルの分割を強制し、同一患者がトレーニングセットとテストセットの両方に出現することを防ぎます。これは、臨床MLにおいてよく見られる、気づきにくいエラーです。
MIMIC-IIIまたはMIMIC-IVを読み込み、対応する死亡率タスクを適用して、TransformerまたはRETAINモデルをトレーニングします — このスキルでは、適切な分割戦略とメトリクスの選択を含む、すべてのステップを順を追って説明します。
MIMIC-IIIの処方データに対してGAMENet、SafeDrug、またはMICRONを使用し、pr_auc_samplesやjaccard_samplesなどのマルチラベル指標を活用することで、安全かつ正確な薬剤セット予測を実現します。これらの手法はPyHealth Clinical MLによって提供されています。
PyHealth Clinical ML を使用して、SleepEDF または SHHS データセット上で StageNet または CNN アーキテクチャによる睡眠段階分類パイプラインを構築します。信号固有のデータセット読み込みおよび多クラスメトリクスの設定についてのガイダンスも含まれています。
PyHealth Clinical MLに組み込まれたコードユーティリティ関数を使用して、NDCコードをATCレベルにクロスマッピングしたり、ICD-9診断をICD-10に変換したりして、カスタムのルックアップテーブルを作成することなくコホートを構築できます。
uv add pyhealth==1.16)uvを推奨 (uv add pyhealth);pipも対応npx clawhub@latest install pyhealthレビューを書くにはログイン
まだレビューはありません。最初の体験をシェアしましょう!