自動スコア - 柳州プラスチック射出有限公司

BMC Medical Research Methodology volume 22、記事番号: 286 (2022) この記事を引用

1439 アクセス

1 引用

1 オルトメトリック

メトリクスの詳細

リスク予測モデルは、リスクの層別化とリソースの割り当てに役立つ臨床意思決定に役立つツールであり、患者のより良い医療につながる可能性があります。 AutoScore は、バイナリ結果を求める機械学習ベースの自動臨床スコア生成ツールです。この研究は、AutoScore フレームワークを拡張して、通常の結果に対する解釈可能なリスク予測ツールを提供することを目的としています。

AutoScore-Ordinal フレームワークは、変数ランキング、変数変換、スコア導出 (比例オッズモデルから)、モデル選択、スコア微調整、モデル評価を含む、元の AutoScore アルゴリズムと同じ 6 つのモジュールを使用して生成されます。 AutoScore-Ordinal のパフォーマンスを説明するために、このメソッドは 2008 年から 2017 年にかけてシンガポール総合病院の救急部門からの電子医療記録データに対して実施されました。モデルはデータの 70% でトレーニングされ、10% で検証され、残りのデータでテストされました。 20%。

この研究には445,989例の入院患者が含まれており、経常転帰の分布は80.7%が30日再入院なしで生存、12.5%が30日再入院で生存、6.8%が入院中または退院後30日までに死亡した。柔軟な変数選択手順によって特定された 8 つの予測変数のセットを 2 つ使用して、2 つのポイントベースのリスク予測モデルが開発されました。 2 つのモデルは、受信機動作特性曲線下平均面積 (0.758 および 0.793) および一般化 c 指数 (0.737 および 0.760) によって測定される、かなり良好なパフォーマンスを示し、代替モデルと同等でした。

AutoScore-Ordinal は、順序結果のリスク予測モデルの開発と検証のための自動化された使いやすいフレームワークを提供し、高次元データから潜在的な予測因子を系統的に特定できます。

査読レポート

リスク予測モデルは、臨床医が患者データに基づいて医療結果の確率を推定するのに役立つ数式です。このようなモデルには、臨床上の疑問に応じて、疾患の存在 (診断モデル) または特定の結果が発生する (予後モデル) を予測するために使用できる整数ポイントスコアが含まれます。複数の予測子の組み合わせ (異なる予測子の異なる重み) が多変数モデルに組み込まれ、リスクスコアが計算されます [1、2、3]。一部のリスク予測モデルは、日常的な臨床現場で使用されています。これには、Framingham Risk Score [4]、Ottawa Ankle Rules [5]、Nottingham Prognostic Index [6]、Gail モデル [7]、Euro-SCORE [8]、修正版などがあります。早期警告スコア (MEWS) [9、10] および簡易急性生理学スコア [11]。

医療情報技術、特に電子医療記録 (EHR) の使用は過去 10 年間で増加しており、ビッグデータ研究の機会が提供されています。 EHR データには、リスクモデル開発のための独自のデータソースとなり得る詳細な患者情報と臨床転帰変数が含まれています [12、13]。従来の回帰分析を使用してリスクモデルを構築する場合、EHR データ内の多数の変数の可用性が数学的課題になる可能性があります。代替アプローチとしての機械学習 (ML) は、数学的アルゴリズムを適用してこのようなビッグデータを処理し、新しいリスク予測モデルをもたらします。従来の変数選択アプローチ (後方消去、前方選択、事前に指定された停止ルールを使用した段階的選択など) では、EHR データのコンテキストで変数の異なるサブセットが生成される可能性があり、一部の臨床領域では臨床知識が常に利用できるとは限りません。教師あり学習には強力な特徴選択手法が利用できます。教師あり学習は、EHR データを扱う際のリスクモデル開発において非常に重要な側面です [13、14]。

AutoScore [15] は、解釈可能な臨床スコアリングモデルを開発する、使いやすい機械学習ベースの自動臨床スコアジェネレーターです。 EHR データを使用した実証実験において、AutoScore は、より少ない変数を使用することにより、リスクモデル開発のためのいくつかの従来の方法と同等の予測パフォーマンスを達成するスコアリングモデルを生成しました [15]。 AutoScore フレームワークの利点は、ML 技術を使用した効率的な変数選択と、単純な回帰モデルのアクセスしやすさと解釈しやすさの組み合わせです。これはさまざまな臨床設定で簡単に使用でき、その適用性は多数の変数 (EHR データなど) で示されています [15]。最近のいくつかの研究では、このフレームワークを使用して、さまざまな臨床領域におけるリスク予測モデルを開発しています[16、17、18、19、20]。

文献にあるほとんどのリスク予測モデルは、多変数ロジスティック回帰モデルまたは ML 技術を使用して 2 値の結果を予測するために開発されました。 AutoScore フレームワークとは別に、ML アプリケーションには、心血管疾患のリスクを予測するための Naive Bayes (NB)、XGBoost、k 近傍 (K-NN)、多層パーセプトロン、サポートベクターマシン (SVM)、および CatBoost の使用が含まれます [21] ]、2 型糖尿病患者における糖尿病性網膜症の発症リスクに関するランダムフォレスト (RF)、XGBoost、ロジスティック回帰、SVM および K-NN [22]、NB を使用した脳卒中リスク予測モデル、デシジョンツリーおよび RF モデル [ 23]、XGBoost ベースの脳梗塞リスク予測モデル [24]、および交差検証された弾性正則化ロジスティック回帰法、ブースティング線形回帰、RF およびアンサンブルモデル[25]。

多くの臨床順序結果変数が存在し、例えば救急科 (ED) トリアージの横断研究 [26] や卵巣がんの後ろ向きコホート研究などでは、簡略化するためにそれらは二分化 (有利と不利) されたり、順序のないカテゴリーに縮小されたりすることがよくあります。患者[27]。それにもかかわらず、そのような再分類は臨床的および統計的に関連する情報の損失をもたらし、境界線の患者（転帰の 2 つのレベルのいずれかに容易に分類できる症例）には困難が伴う可能性があることを無視すべきではありません。順序変数の分析は、対応する再分類された二値変数と比較して統計的検出力が高いことに注意する必要があります。これは、シミュレーションと臨床試験における実証研究の両方で実証されています[28、29、30、31、32]。文献では、順序分析によってより小さな治療効果サイズが検出できるため、二分法ではなく順序尺度の結果を使用することも推奨されています[29、33、34、35]。

文献では、順序結果変数がいくつかの臨床領域で議論されており、その目的は関連性の探索または予測のいずれかでした。大規模な国際研究 (6 か国の 26 病院を含む) では、順序ロジスティック回帰を実施して、複合順序結果変数 (1 = 生存、長期入院 [LOS] なし、再入院なし、2 = 生存、長期入院 [LOS] なし、再入院なしと定義) を研究しました。再入院; 3 = 生存、長期入院なし、再入院; 4 = 生存、長期入院、再入院; 5 = 死亡)、病院レベルでの複合順序転帰の異なるレベル間の相関関係が報告されている[36]。 435 人の患者を対象とした後ろ向きコホート研究において、残存腫瘍サイズ（残存腫瘍なし、残存腫瘍 1 cm 未満、残存腫瘍 1 cm 以上と定義）の二次的順序結果に関する、卵巣がんに特異的な予測フレームワークを開発するために、複数のバイオマーカーを使用した ML 法が実施されました。残存腫瘍）、予測精度と AUC について議論されました [27]。統計的手法と ML 手法は、文献における順序結果に使用されています。たとえば、乳児の中耳機能不全診断における比例オッズモデル (POM) [37] や冠動脈疾患研究 [38]、前述の卵巣における順序 RF などです。がん研究[27]、9つのメンタルヘルスと自殺関連のサブレディットにわたる研究における順序損失を伴う多層パーセプトロン[39]、パーキンソン病患者における順序二値分解を伴う3D畳み込みニューラルネットワークモデル[40]。ただし、これらの ML アプローチを使用すると、解釈可能性 (このような複雑な出力とその仕組みを簡単に理解できない場合があり、医療分野では推奨されません [41]) とアクセシビリティが欠如していますが、透過的な POM はそうではありません。リアルタイムの意思決定のため、診療所で解釈可能なリスクスコアリングシステムとして簡単に使用できます。

複雑なデータ (EHR など) を扱う臨床研究に簡単に適用できる順序分析を使用したモデル開発に関する文献は不足しています。この研究の主な目的は、元の AutoScore フレームワークを拡張して、通常の結果に対するリスク予測モデルを簡単に開発および検証するためのツールを提供することでした。したがって、現在の研究の主な貢献は、順序ブロックを含めただけではなく、新しい方法論的な作業と順序結果に適したモデルのパフォーマンス測定の改訂につながる、元の AutoScore フレームワークへのいくつかの変更でもあります。説明の目的で、救急部門からの EHR データ (現実世界のデータとして) を使用してリスク予測モデルが開発および検証されました。通常の転帰には 3 つのカテゴリー (退院後 30 日以内に再入院せずに生存している、再入院しても生存している) が含まれています。退院後 30 日以内で入院患者死亡、または退院後 30 日以内）。

このセクションでは、提案されている AutoScore-Ordinal フレームワークを構成する 6 つのモジュールについて説明します。モジュール 1 (図 1 を参照) では、データはまず、予測モデルをトレーニングするためのトレーニングセット、ハイパーパラメーター (変数の数、連続変数を分類するためのカットオフ値など) を選択するための検証セット、および選択した最終モデルを評価するためのテストセット。通常、3 つのデータセットには、それぞれ完全なデータセットの 70%、10%、20% が含まれます。変数は、マルチクラス分類の RF [42] に対する重要性に基づいてランク付けされ (つまり、カテゴリーの順序は無視されます)、デフォルトのツリー数 100 のトレーニングセットでトレーニングされます。

AutoScore-Ordinal ワークフローの視覚的な図。オリジナルの AutoScore フレームワークから変更された青色のハイライトモジュール [15]

解釈を簡素化し、予測変数と結果の間に起こり得る非線形関係を説明するために、すべての連続変数はモジュール 2 に分類されます (図 1 を参照)。このプロセスを自動化するために、AutoScore-Ordinal は、カットオフ値として 5、20、80、95 パーセンタイル (トレーニングセットに基づく) を使用して各連続変数を分類しますが、一部のカットオフは変数の分布が大きく偏っている場合のスパース性の問題を回避するために削除されました。これらの (ある程度任意の) カットオフ値は、その後のスコア開発のための適切な初期設定を提供し、モジュール 5 (以下の詳細を参照) でユーザーが微調整できます。

モジュール 3 (図 1 を参照) では、変数に関連付けられた重みが、比例オッズモデル (POM) [43、44] とも呼ばれるロジットリンクを含む累積リンクモデル [43] を使用して開発されます。順序結果の研究で最も広く使用されている回帰モデルであり、複雑な (画像など) データを処理するために深層学習アプローチと統合されています [45]。スカラー Y が J カテゴリ (整数 1、…、J で示される) の順序結果を表し、列ベクトル x が変数 (連続変数はモジュール 2 で簡単に分類される) を表すものとします。 POM は、j 番目の順序カテゴリに関連付けられた累積確率のロジットの線形モデル、つまり、pj = P(Y ≤ j)、j = 1、…、J − 1 を仮定します。

スカラー項 θj はカテゴリ固有の切片項であり、θ1 < θ2 < … < θJ − 1 であり、任意の j < k について pj < pk が保証されます。 β は、予測子に対応する回帰係数のベクトルです。 β の前の負の符号は、McCullagh [43, 44] が使用した表記法に従っており、β の正の値は x と Y の間の正の関連性を示します。つまり、x の増加により、より高いカテゴリーを観測する確率が増加します。したがって、xTβ の増加は常に、より高い結果カテゴリーを観察する確率の増加と関連しており、xTβ に基づいて予測スコアを構築できるようになります。順序結果を処理するためのもう 1 つの一般的なアプローチは順序バイナリ分解ですが、これは順序結果を別個のモデルの複数のバイナリラベルとしてモデル化するため [46]、各順序カテゴリに属するリスクの共通スコアを導き出すことが困難になります。

トレーニングされた β 値の単純なスケーリングと丸めは、混乱を招く解釈を伴う負の値と正の値にわたるスコアリングモデルを生成する可能性があります。たとえば、任意のゼロスコアがリスクがないと誤解される可能性があります。したがって、β のすべての要素が正となり、β が β の最小値に関して正規化されるように、各変数の参照カテゴリを再定義した後に POM が再適合されます。モジュール 2 ではすべての連続変数が簡単に分類されるため、これらの正規化された係数は、部分スコアと呼ばれる、変数のカテゴリに関連付けられたスコアとして解釈できます。部分スコア (参照カテゴリの場合は 0、それ以外の場合は 1 以上) は、個人の変数の値に対応するすべての部分スコアの合計である最終予測スコアの計算を簡略化するために正の整数に丸められます。解釈を容易にするために、達成可能な最大合計スコアが意味のある値 (たとえば、100) になるように、すべての部分スコアが再スケール (その後四捨五入) されることがよくあります。

最終モデルのパフォーマンスを評価するために、J カテゴリによる結果 Y の予測は、Y ≤ j 対 Y > j の J − 1 バイナリ分類と、これらのバイナリにわたる受信者動作特性曲線下平均面積 (AUC) に分割されます。分類 (以下、mAUC と呼びます) は、Y を予測するための全体的なパフォーマンスを評価するために使用されます。これは、順序予測を評価するための平均二分化 c インデックスに相当します [47、48]。モジュール 4 では、すべての候補変数が含まれるまで (モジュール 1 の変数ランキングに基づいて) 毎回 1 つの変数を追加することでスコアリングモデルが拡張され、変数の数が増加するにつれて mAUC (検証セットで評価) が向上します。は倹約プロットを使用して検査されます。変数の最終リストは、変数を追加する利点が小さい場合に選択されることが多く、そのような小さな利点は、目視検査 (倹約プロットを見ることによる) と臨床知識 (および変数を手動で削除/含める) によって評価できます。次に、モジュール 4 で選択した連続変数のカットオフ値を、モジュール 5 で有利に解釈できるように、たとえば任意に定義した分位ベースの間隔の代わりに 10 歳の年齢グループを使用して微調整できます。最終モデルは、mAUC と Harrell の一般化 c インデックス [47、49、50] を使用してモジュール 6 のテストセットで評価されます。これは、一致するペアの割合に基づいています (つまり、予測と観察された結果が同じランキングを生成する場合)考えられるすべての観測値のペアのうち、同順位の順位を含む観測値のペアの場合。 mAUC と一般化 c-index の両方について、値 0.5 はランダムなパフォーマンスを示し、値 1 は完全な予測パフォーマンスを示します。テストセットからの mAUC と一般化 c インデックスは、バイアス補正された 95% ブートストラップ信頼区間 (CI) で報告されます [51]。

私たちが提案した AutoScore-Ordinal フレームワークを実証および検証するために、医療 AI の評価のためのチェックリストに準拠した臨床研究にそれを適用しました [52]。私たちは AutoScore-Ordinal を使用して、2008 年から 2017 年にシンガポール総合病院の救急科 (ED) を訪れ、その後入院した患者から収集したデータを使用して、入院患者退院後の再入院と死亡 (複合転帰) を予測しました [53, 54]。完全なコホートには、449,593 件の ED 発症症例に関するデータが含まれていました。患者の人口統計、ED の投与、入院、ED における臨床検査とバイタルサイン、病歴、併存疾患に関する情報は、病院の電子医療記録システムから抽出されました [16]。 18歳未満の患者は除外したため、最終サンプルは445,989件の入院患者となった。

われわれは、退院後 30 日以内に再入院せず生存、退院後 30 日以内に再入院あり生存、入院患者または退院後 30 日以内に死亡の 3 つのカテゴリーで複合順序アウトカムを構築しました。 445,989例のうち、359,961人（80.7％）が第1の転帰カテゴリー（すなわち、30日の再入院なしで生存）に属し、55,552人（12.5％）が第2のカテゴリー（すなわち、30日の再入院で生存）に属し、30,476人が(6.8%) は 3 番目のカテゴリー (つまり、入院患者または退院後 30 日までに死亡) に属しました。

データセット (結果カテゴリによって階層化) を、モデルをトレーニングするための 70% (n = 312,193) ケースのトレーニングセットと、AutoScore に必要なモデルの微調整を実行するための 10% (n = 44,599) ケースの検証セットにランダムに分割しました。順序、および最終予測モデルのパフォーマンスを評価するための 20% (n = 89,197) ケースのテストセット。各ケースについて、前回の入院患者の在院日数 (LOS) を抽出しました (欠損値は 0 日として処理されました)。バイタルサインまたは臨床検査の欠損値は、検証セットの中央値を使用して補完されました。

AutoScore-Ordinal を使用して構築された予測モデルと、RF (ツリー 100 個) および LASSO または段階的変数選択手法を使用した POM を比較しました。各モデルについて、テストセットのブートストラップサンプルから mAUC と一般化 c インデックスの 95% CI を計算しました (ブートストラップサンプルの数はデモの目的で 100 として選択されており、AutoScore アルゴリズムで変更できます)。一般化 c インデックスは、AutoScore で生成されたモデルの合計スコア、POM の切片項を除く線形予測子、および RF の予測結果カテゴリに基づいて計算されました。

すべての分析は R バージョン 4.0.5 で実装されました [55]。私たちが提案する AutoScore-Ordinal は R パッケージとして実装されており、https://github.com/nliulab/AutoScore-Ordinal から入手できます。 POM は、パッケージ ordinal [56] の clm 関数を使用して実装されました。パッケージ MASS [57] の stepAIC 関数は POM の段階的な変数選択を実行するために使用され、パッケージ ordinalNet [58] の ordinalNet 関数は LASSO アプローチを実装するために使用されました。 RFは、randomForestパッケージ[59]のrandomForest関数を使用して実装されました。バイアス補正されたブートストラップ CI は、パッケージ coxed [60] の bca 関数を使用して実装されました。一般化された c-index は、パッケージ Hmisc [61] の rcorrcens 関数を使用して実装されました。

全コホートの特徴を表 1 にまとめます。3 つの結果カテゴリーの症例では、すべての変数において統計的な差異が示されたため、POM に基づいたスパース予測モデルを開発することは自明ではありません。

節約プロット (図 2 を参照) は、最初の 8 つの変数の合理的なモデルを示唆しています: ED LOS、クレアチニン、ED 搭乗時間、前年の来院回数、年齢、最高血圧 (SBP)、重炭酸塩および脈拍。 41 変数すべてを使用したスコアリングモデルよりわずか 7.9% 低い mAUC に達しました。このモデルをモデル 1 と呼びます。倹約プロットを使用して変数を選択する場合、研究者は重要度の降順で変数を連続的に選択するという制限はありません。たとえば、8 つの変数を含む代替モデル (つまり、モデル 2) を構築しました。ここでは、mAUC にほとんど影響を及ぼさない 3 番目の変数 (つまり、ED 搭乗時間) をモデル 1 から除外し、14 番目の変数 (つまり、履歴) を追加しました。過去 5 年間の転移がんの割合（患者または同伴者、家族、親族に質問することで簡単に収集できます）、予測モデルに入ると mAUC が約 4% 増加しました。

検証セットの平均曲線下面積 (mAUC) による倹約プロット

2 つのモデルで選択されたすべての変数は連続的であり、解釈可能性を向上させるために分類ステップでそれらのカットオフ値を微調整しました。両方のモデルの微調整後のスコア表を表 2 に示し、結果の予測モデルのパフォーマンス (テストセットで評価) を表 3 に報告しました。モデル 1 の mAUC は 0.758 (95% CI: 0.754) でした。 -0.762)、ED 搭乗時間を除外し、転移がんを追加することにより、モデル 2 の mAUC は 0.793 (95% CI: 0.789 ～ 0.796) に改善されました。

AutoScore によって生成されたスコア (モデル 1 および 2 から) は、トレーニングセット内で観察された割合に基づいて、さまざまな結果カテゴリに分類される可能性にマッピングできます。たとえば、図 3 では、仮想の新規患者のリスク予測にモデル 2 を使用する様子を示しています。この新規患者に対して測定された 8 つの変数の値を使用して、臨床医はスコア表の関連する行を簡単に確認し、部分スコアを合計することができます。この患者の合計スコアを計算し、ルックアップテーブル内の 3 つの結果カテゴリに対応する予測確率を読み取ります。このような予測確率は、電卓を使用して POM から計算することも、指定されたソフトウェアコマンドを使用して RF から返すこともできますが、AutoScore で生成されたモデルのチェックリスト形式のスコアリングテーブルとそれに付随する予測確率のルックアップテーブルの方が、臨床現場での使用がはるかに簡単です。。

AutoScore によって生成されたモデル 2 のスコアおよびルックアップテーブルと、仮想の新患に対する使用例

図 4 に視覚的に示したモデル 1 と 2 のキャリブレーションパフォーマンスを評価します。具体的には、図 3 のルックアップテーブルで定義されたスコア間隔に基づいて被験者をグループ化し、観察された各結果カテゴリに属するリスクをプロットしました。予測されたリスクに対するテストセット (ルックアップテーブルに基づく)。モデル 1 と 2 はどちらも、対角線に近い点で示されるように、観測レベルと同様の予測リスクを生成しました。スコアの増加 (図 4 の明るい色で視覚的に示されている) は、一般に、結果においてより高いカテゴリに属する可能性の増加を反映していますが、モデル 2 は、モデル 1 と比較して、異なる予測スコアを与えられた場合に異なる結果カテゴリを区別する能力が向上しています。 (対角線に沿ったドットの広がりによって示されます)。

(A) モデル 1 および (B) モデル 2 の校正パフォーマンス

AutoScore で生成された予測モデルは、同じ変数を使用した POM と同等の mAUC を示しました (表 3 を参照。POM1 と POM2 はそれぞれモデル 1 とモデル 2 に対応します)。モデル 1 と同じ変数を使用した RF (表 3 の RF1 を参照) は、モデル 1 よりも高い mAUC を示しましたが、モデル 2 と比較すると、mAUC の点で対応する RF (表 3 の RF2 を参照) の利点はそれほど顕著ではありません。。 AutoScore で生成されたモデルは、対応する POM よりもわずかに高い一般化 c-index を持ち、両方とも対応する RF よりも高かった。特に、RF の一般化 c-index は、RF のパフォーマンスを評価する際に数値スコアの代わりに予測ラベルを使用したため、対応する AutoScore 生成モデルまたは POM よりもはるかに低かった。

従来のモデル構築方法を使用してスパース POM を構築する場合、AIC を使用した段階的アルゴリズムは、ヌルモデル (つまり、変数なし) から開始するときに機能せず、完全なモデル (つまり、41 個すべてを含む) から開始するときに最終的に 35 個の変数を選択することになりました。変数)。 35 モデルを含むこの POM は、高い mAUC と一般化された c-index を持っていましたが (表 3 の POM (段階的) を参照)、実際の設定で使用するのは困難です。 LASSO アプローチでは、他の変数よりもパフォーマンスがはるかに低い 10 個の変数 (つまり、ED LOS、性別、ED トリアージコード、過去 1 年間の ICU 滞在総数、入院タイプ、SpO2、SBP、重炭酸塩、ナトリウム、および合併症を伴う糖尿病) を選択しました。モデル (表 3 の POM (LASSO) を参照)。

この研究では、順序結果に対して AutoScore フレームワークを使用してスコアリングシステムが開発されました。このアルゴリズムは、リスク予測モデルと救急部門からの EHR データへのその適用について議論するケーススタディに適用されました。通常の転帰には 3 つのカテゴリー (退院後 30 日以内に再入院せずに生存、30 日以内に再入院して生存) が含まれます。退院後入院患者または退院後 30 日以内に死亡した場合）。モデルはデータの 70% (n = 312,193) を使用して開発されました。データの 10% のサブセット (n = 44,599) で検証され、必要なモデルの微調整が実行されます。 20% のセットでテストされました (n = 89,197)。 AutoScore-Ordinal モデルのパフォーマンスは、mAUC および一般化 c-index を介して 100 個のブートストラップサンプルを使用して、POM および RF を含む代替モデルと比較してチェックされました。 AutoScore-Ordinal では、8 つの変数を使用した 2 つの実行可能なスコアリングモデルが特定され、どちらも同じ変数を使用する POM および RF よりもわずかに優れたパフォーマンスを示しました。 AutoScore-Ordinal モデルの新規性は、使いやすい機械学習ベースの自動臨床スコア生成機能であり、解釈可能な臨床スコアリングモデルを開発し、臨床経路のさまざまな段階での臨床意思決定に役立つツールとなります。

臨床現場における予測モデルは、臨床実践のさまざまな段階での臨床意思決定に情報を提供する便利なツールです [62、63]。予測モデルを設計、実施、構築するために、リスク予測モデルの開発、検証、更新を含む基本概念が TRIPOD (個人の予後または診断のための多変数予測モデルの透明性報告) ステートメント [64] で議論されています。新しいリスクモデルは、モデルの予測能力 (例: キャリブレーションや識別) を定量化するために常に検証される必要があります。これは、内部 (ブートストラッピング、相互検証など) または外部 (独立したコホートなど) の検証を通じて対処できます。 [64]。

文献で開発されたモデルのほとんどは、機械学習技術を使用しているものの、解釈可能性とアクセシビリティに欠けています [26、27、39]。対照的に、ポイントベースのリスク予測モデルによる AutoScore-Ordinal は、さまざまな臨床設定で簡単に実装でき、順序結果を扱う際の解釈可能性のギャップを埋めます。オリジナルの AutoScore フレームワーク [15] の利点は、AutoScore-Ordinal フレームワークにも当てはまります。 AutoScore-Ordinal は、順序結果の分析に適しており、臨床および疫学研究で広く使用されている POM に基づいて構築されています。従来の POM の使用と比較して、AutoScore-Ordinal は機械学習手法を利用して、優れた予測パフォーマンスを備えた疎な予測モデルを構築しますが、段階的な変数選択や LASSO などの従来のアプローチはうまく機能しない可能性があります。 AutoScore-Ordinal は、臨床現場で簡単に実装できるチェックリストスタイルのスコアリングモデルを作成します。臨床研究では、歪度や多峰性分布などのさまざまな理由により、量的データが順序変数として分類されることがあります。このようなシナリオでは、二分化は理想的ではない可能性があり、臨床的および統計的に関連する情報が失われる可能性があります。 AutoScore-Ordinal フレームワークを利用して、そのような順序結果変数を処理することもできます。

AutoScore-Ordinal は、倹約プロットに基づいた効率的で簡単かつ柔軟な変数選択手順を提供します。これは、モデル内の変数数の増加に伴うモデルのパフォーマンスの向上を視覚的に示します。研究者は直感的に、満足のいくモデルのパフォーマンスに対応する上位のいくつかの変数を選択でき、追加の変数を含めると小さな (例: < 1%) 改善が得られ、この例ではモデル 1 が得られます。さらに、AutoScore-Ordinal を使用すると、研究者はモデルのパフォーマンスへの寄与 (モデル 2 など) や実際的な影響に基づいて、最終変数に変数を手動で追加または削除できます。現在の AutoScore-Ordinal 実装では、臨床アプリケーションで広く使用されている POM (より一般的には、ロジットリンクを備えた累積リンクモデル) が使用されていますが、他のリンク関数 (プロビット、相補ログ-ログなど) と併用することもできます。モデルの適合性を向上させるために若干の変更を加えます。研究者は、最終モデルに含める変数を決定するときに、複数の節約プロットを描画して、データに最も適したリンク関数を選択したい場合があります。

このデータ例では、AutoScore-Ordinal のモジュール 1 で変数をランク付けするとき、およびそれを予測モデルとして使用するときに、100 個のツリーで RF をトレーニングしました。研究者は、一般的なアプリケーションでのパフォーマンスを向上させるためにツリーの数を増やしたい場合があります。たとえば、500 個のツリーが一般的な選択です [65]。ケーススタディのサンプルサイズが大きいため、500 個のツリーを使用して RF をトレーニングするとメモリが不足し、変数をランク付けして順序結果を予測する場合、200 個のツリーを使用した RF では同等の結果が生成されました。

名前が示すように、POM は比例オッズを仮定します。つまり、結果に対する各変数の影響は、結果カテゴリ全体で同じであると仮定します。トレーニングセットの一変数 POM 分析 (連続変数の分類なし) では、比例オッズ仮定はすべての変数に対して拒否されました (有意水準 5%)。今後の研究では、結果として得られるスコアリングモデルの解釈を大幅に複雑にすることなく、必要に応じてこの仮定を緩和する方法を調査する必要があります。それにもかかわらず、AutoScore-Ordinal を使用して構築された 2 つの予測モデルは、かなりうまく機能しました。パフォーマンス評価のために、バイナリ予測および生存予測のメトリクスと同様の定義と簡単な解釈を持つ 2 つのメトリクス (つまり、mAUC と一般化 c-index) を検討しました [47、48、50]。将来の研究では、他の性能メトリクス、例えば、受信機動作特性曲面下の体積（より一般的には多様体下のハイパーボリューム）[66]、および順序予測のための順序cインデックス[47]、またはMインデックス[67]を考慮する可能性がある。カテゴリの順序を明示的に考慮せずに、複数クラスの結果に対する多項目識別指数 [68, 69]。

私たちのデータ例は、私たちが提案する AutoScore-Ordinal フレームワークの使用法を説明することを目的としています。予測パフォーマンスは改善できます。たとえば、モデル 2 のパフォーマンスはモデル 1 よりも優れていましたが、カテゴリ 2 は他の 2 つのカテゴリによって支配されているため、このカテゴリへの新しいケースを予測できない可能性が高くなります (図 2 のルックアップテーブルを参照)。 3)。 AutoScore-Ordinal は、外部妥当性を確立するために、異なるサンプルサイズとさまざまな数の変数を使用して他の臨床領域に適用する必要があります。 AutoScore-Ordinal 由来のスコアリングモデルを臨床現場に適用する前に、パフォーマンスを向上させるには、追加の関連変数の組み込み、欠損値の代替代入、パッケージ内の相互検証機能など、さらなる調査が必要です。文献 [70、71、72、73] に見られるように、もう 1 つの将来の研究の方向性は、臨床医が簡単にアクセスできるモバイルアプリケーションとして AutoScore-Ordinal パッケージを統合することです。それにもかかわらず、AutoScore-Ordinal は、通常の臨床結果に対する解釈可能なスコアリングモデルを開発するための、強力で柔軟で使いやすいフレームワークを提供します。

リスク予測モデルとしての AutoScore-Ordinal は、順序結果変数用に開発されました。説明の目的で、このフレームワークは救急部門からの EHR データを使用して実装および検証されました。通常の転帰には 3 つのカテゴリー (退院後 30 日以内に再入院せずに生存している、退院後 30 日以内に再入院して生存している、および死亡した入院患者、または退院後30日以内）。効率的で柔軟な変数選択手順が説明され、モデルは代替モデルと比較して同等の適合度を示しました。 AutoScore-Ordinal によって生成されたポイントベースのリスク予測モデルは、さまざまな臨床設定で簡単に実装および解釈できます。

この研究のデータセットは一般に公開されていませんが、合理的な要求に応じて責任著者から入手できます。

ムーンズ KGM、ロイストン P、ヴェルゴーウェ Y、グロッビー DE、アルトマン DG。予後と予後の研究: 何を、なぜ、どのように? BMJ。 2009;338:b375。

論文 PubMed Google Scholar

シュタイアーベルク EW。臨床予測モデル: 開発、検証、更新への実用的なアプローチ。ニューヨーク：スプリンガー。 2009年。

Google Scholar を予約する

Wasson JH、Sox HC、Neff RK、Goldman L. 臨床予測ルール - アプリケーションと方法論の標準。 N 英語 J 医学 1985;313(13):793–9。

論文 CAS PubMed Google Scholar

アンダーソンKM、オデルPM、ウィルソンPW、カネルWB。心血管疾患のリスクプロファイル。アムハート J. 1991;121(1 Pt 2):293–8。

論文 CAS PubMed Google Scholar

スティール IG、グリーンバーグ GH、マックナイト RD、ナイル RC、マクダウェル I、ワーシントン JR。急性足首損傷における X 線撮影の使用に関する臨床決定ルールを開発する研究。アン・エマーグ・メッド。 1992;21(4):384–90。

論文 CAS PubMed Google Scholar

ヘイビトル JL、ブレイミー RW、エルストン CW、ジョンソン J、ドイル PJ、キャンベル FC 他原発性乳がんの予後指標。 Br J がん。 1982;45(3):361–6。

論文 CAS PubMed PubMed Central Google Scholar

ゲイル MH、ブリントン LA、バイアー DP、コール DK、グリーン SB、シャラー C 他毎年検査を受けている白人女性について、乳がんを発症する個別の確率を予測します。国立がん研究所 1989;81(24):1879–86。

論文 CAS PubMed Google Scholar

Nashef SA、Roques F、Michel P、Gauducheau E、Lemeshow S、Salamon R。心臓手術リスク評価のための欧州システム (EuroSCORE)。 Eur J 心臓胸部外科 1999;16(1):9–13。

論文 CAS PubMed Google Scholar

Stenhouse C、Coates S、Tivey M、Allsop P、Parker T。一般外科病棟で重篤な疾患を発症している患者の早期発見を支援する、修正された早期警告スコアの前向き評価。 Br J アネス。 2000;84(5):663P。

記事 Google Scholar

Subbe CP、Kruger M、Rutherford P、Gemmel L. 医療入院における修正された早期警告スコアの検証。 QJM。 2001;94(10):521–6。

論文 CAS PubMed Google Scholar

Le Gall JR、Loirat P、Alperovitch A、Glaser P、Granthil C、Mathieu D、他。 ICU患者の簡略化された急性生理学スコア。クリティカルケアメッド。 1984;12(11):975–7。

論文 PubMed Google Scholar

Wang LE、Shaw PA、Mathelier HM、Kimmel SE、French B. 電子医療記録のデータを使用したリスク予測モデルの評価。アン・アプリケーション統計 2016;10(1):286–304。

論文 CAS PubMed PubMed Central Google Scholar

Weiskopf NG、Weng C. 電子医療記録データの品質評価の方法と側面: 臨床研究での再利用を可能にする。 J Am Med Assoc に通知します。 2013;20(1):144–51。

記事 PubMed PubMed Central Google Scholar

Heinze G、Wallisch C、Dunkler D. 変数の選択 - 現役統計学者のためのレビューと推奨事項。 Biom J. 2018;60(3):431–49。

記事 PubMed PubMed Central Google Scholar

Xie F、Chakraborty B、Ong MEH、Goldstein BA、Liu N. AutoScore: 機械学習ベースの自動臨床スコア生成ツールと、電子医療記録を使用した死亡率予測へのそのアプリケーション。 JMIR 医学情報。 2020;8(10):e21798。

記事 PubMed PubMed Central Google Scholar

Xie F、Ong MEH、Liew JNMH、Tan KBK、Ho AFW、Nadarajan GD 他緊急入院後の死亡率を推定するための、解釈可能な機械学習トリアージツールの開発と評価。 JAMAネットオープン。 2021;4(8):e2118467。

記事 PubMed PubMed Central Google Scholar

ウォン XY、アン YK、リー K、チン YH、ラム SSW、タン KBK 他解釈可能な機械学習フレームワークを使用した、院外心停止における自然循環復帰後の生存を予測するための SARICA スコアの開発と検証。蘇生。 2022;170:126–33。

論文 PubMed Google Scholar

Petersen KK、Lipton RB、Grober E、Davatzikos C、Sperling RA、Ezzati A. 認知障害のない高齢者におけるアミロイド陽性の予測。神経科。 2022;98(24):e2425–35。

記事 PubMed PubMed Central Google Scholar

Liu N、Liu M、Chen X、Ning Y、Lee JW、Siddiqui FJ 他機械学習を使用した、院外心停止患者に対する解釈可能な病院前自然循環復帰 (P-ROSC) スコアの開発と検証: 遡及研究。 e臨床医学。 2022;48:101422。

記事 PubMed PubMed Central Google Scholar

Ang Y、Li S、Ong MEH、Xie F、Teo SH、Choong L 他救急部門における急性腎障害の早期発見のための、解釈可能な臨床スコアの開発と検証。 Sci Rep. 2022;12(1):1–8。

記事 Google Scholar

Kangarathinam K、Sankaran D、Manikandan R。ハイブリッドデータセットを使用した心血管疾患の機械学習ベースのリスク予測モデル。データ知識工学 2022;140:102042。

記事 Google Scholar

Zhao Y、Li X、Li S、Dong M、Yu H、Zhang M 他機械学習技術を使用して、2 型糖尿病患者における糖尿病性網膜症の発症リスクのリスク予測モデルを開発する: コホート研究。フロントエンドクリノール（ローザンヌ）。 2022;13:885。

Google スカラー

Adi NS、Farhany R、Gina R、Napitupulu H. 機械学習を使用した脳卒中リスク予測モデル。開催地: 2021 年人工知能とビッグデータ分析に関する国際会議。 2021.p. 56-60。

Google Scholar の章

Li X、Wang Y、Xu J. 脳梗塞の機械学習ベースのリスク予測モデルの開発とノモグラムモデルとの比較。 J 影響障害。 2022;314:341–8。

論文 PubMed Google Scholar

Pera M、Gibert J、Gimeno M、Garsot E、Eizaguirre E、Miró M、他。がんによる胃切除後の 90 日死亡率の機械学習リスク予測モデル。アン・サーグ。 2022;276:776–83。

論文 PubMed Google Scholar

Jiang H、Mao H、Lu H、Lin P、Garry W、Lu H 他心血管疾患が疑われる患者に対する救急部門のトリアージにおける意思決定をサポートする機械学習ベースのモデル。 Int J Med Inform。 2021;145:104326。

論文 PubMed Google Scholar

川上英、田畑淳、矢内原直、石川哲、古関和、飯田裕、他血液バイオマーカーに基づく上皮性卵巣癌の術前診断および予後予測への人工知能の応用。臨床がん研究所 2019;25(10):3006–15。

論文 CAS PubMed Google Scholar

Valenta Z、Pitha J、Poledne R. 比例オッズロジスティック回帰 - 臨床結果を二分する際の限られた不確実性に対処する効果的な手段。統計医学。 2006;25(24):4227–34。

論文 PubMed Google Scholar

Roozenbeek B、Lingsma HF、Perel P、Edwards P、Roberts I、Murray GD、他。臨床試験における順序解析の付加価値: 外傷性脳損傷の例。クリティカルケア。 2011;15(3):R127。

記事 PubMed PubMed Central Google Scholar

McHugh GS、Butcher I、Steyerberg EW、Marmarou A、Lu J、Lingsma HF、他。外傷性脳損傷におけるランダム化比較試験における順序結果データの分析アプローチを評価するシミュレーション研究: IMPACT プロジェクトの結果。クリントライアル。 2010;7(1):44–57。

論文 PubMed Google Scholar

セイバーJL。新しいエンドポイント分析技術と、急性脳卒中試験における結果スケールの全範囲にわたる解釈の変化。脳卒中。 2007;38(11):3055–62。

論文 PubMed Google Scholar

マチャドSG、マレーGD、ティーズデールGM。頭部損傷における神経保護剤の臨床試験のデザインの評価。欧州脳損傷コンソーシアム。 J 神経外傷。 1999;16(12):1131–8。

論文 CAS PubMed Google Scholar

Ceyisakar IE、van Leeuwen N、Dippel DW、Steyerberg EW、Lingsma HF。通常の転帰分析により、転帰における病院間の差異の検出が向上します。 BMC Med Res Methodol。 2021;21(4):4。

Google Scholar を予約する

Uryniak T、Chan ISF、Fedorov VV、Jiang Q、Oppenheimer L、Snapinn SM、他。レスポンダー分析 - PhRMA ポジションペーパー。 Stat Biopharm Res. 2011;3(3):476–87。

記事 Google Scholar

Altman DG、Royston P. 連続変数を二分するコスト。 BMJ。 2006;332(7549):1080。

記事 PubMed PubMed Central Google Scholar

リングスマ HF、ボトル A、ミドルトン S、キエビット J、シュタイアーバーグ EW、マランヴァンデミーン PJ。病院の転帰の評価: 大規模な国際行政データベースにおける在院期間、再入院、死亡率の関係。 BMC 保健サービス研究所 2018;18(1):116。

記事 PubMed PubMed Central Google Scholar

マイヤーズ J、ケイ J、アイタール S、アイタール V、ドリスコル C、カーン A、他広帯域吸光度を使用した生後 10 ～ 16 か月の乳児の中耳機能不全の診断: 順序予測モデル。 Jスピーチラングヒアレス。 2019;62(8):2906–17。

論文 PubMed Google Scholar

Edlinger M、Dörler J、Ulmer H、Wanitschek M、Steyerberg EW、Alber HF、他。 CARDIGAN コホートにおける非閉塞性冠動脈および多血管疾患の診断の順序予測モデル。 Int J カーディオール。 2018;267:8–12。

論文 PubMed Google Scholar

ソーニー R、ジョシ H、ガンジー S、ジン D、シャー RR。深層敵対学習によるソーシャルメディア上の堅牢な自殺リスク評価。 J Am Med Assoc に通知します。 2021;28(7):1497–506。

記事 PubMed PubMed Central Google Scholar

Barbero-Gómez J、Gutiérrez PA、Vargas VM、Vallejo-Casas JA、Hervás-Martínez C. パーキンソン病患者の神経損傷を評価するための通常の CNN アプローチ。エキスパートシステムアプリケーション 2021;182:115271。

記事 Google Scholar

Rudin C. 一か八かの意思決定のためのブラックボックス機械学習モデルの説明をやめ、代わりに解釈可能なモデルを使用してください。ナット・マッハ・インテル。 2019;1(5):206–15。

記事 PubMed PubMed Central Google Scholar

ブライマン L. ランダムフォレスト。マッハラーニング。 2001;45(1):5–32。

記事 Google Scholar

マッカ P、ネルダー JA。一般化された線形モデル。第2版ロンドン：チャップマンとホール/CRC。 1989年。

Google Scholar を予約する

McCullagh P. 順序データの回帰モデル。 JR Stat Soc Ser B. 1980;42(2):109–42。

Google スカラー

Rosati R、Romeo L、Vargas VM、Gutiérrez PA、Hervás-Martínez C、Frontoni E. 美的品質管理分類のための新しい深い順序分類アプローチ。ニューラルコンピューティングアプリケーション。 2022;34(14):11625–39。

記事 Google Scholar

Wang L、Zhu D. 異種データの順序回帰問題への取り組み: スパースおよびディープマルチタスク学習アプローチ。データ最小知識ディスク。 2021;35(3):1134。

記事 Google Scholar

ファンカルスター B、ファンベル V、ヴェルゴーウェ Y、シュタイアーバーグ EW。順序結果に対する予測モデルの識別能力: 既存の測定値と新しい測定値の間の関係。 Biom J. 2012;54(5):674–85。

論文 PubMed Google Scholar

Waegeman W、de Baets B、Boullart L. 順序回帰学習における ROC 分析。パターン認識レター。 2008;29(1):1–9。

記事 Google Scholar

ハレル FE、カリフ RM、プライアー DB、リー KL、ロザティ RA。医療検査の歩留まりを評価する。ジャム。 1982;247(18):2543–6。

論文 PubMed Google Scholar

ハレルFEJ。回帰モデリング戦略: 線形モデル、ロジスティック回帰および順序回帰、生存分析への応用。第2版ニューヨーク：スプリンガー。 2015. (統計における Springer シリーズ)

Google Scholar を予約する

DiCiccio TJ、Efron B. ブートストラップ信頼区間。統計科学。 1996;11(3):189–228。

記事 Google Scholar

Cabitza F、Campagner A. 医療情報学において、もみ殻と小麦を分ける必要性: 医療 AI 研究の (自己) 評価のための包括的なチェックリストの導入。 Int J Med Inform。 2021;153:104510。

論文 PubMed Google Scholar

Xie F、Liu N、Wu SX、Ang Y、Low LL、Ho AFW 他シンガポールの緊急入院後の入院患者の死亡率を予測するための新しいモデル: 遡及的観察研究。 BMJオープン。 2019;9(9):e031382。

記事 PubMed PubMed Central Google Scholar

Liu N、Xie F、Siddiqui FJ、Wah Ho AF、Chakraborty B、Nadarajan GD、他救急部門での臨床意思決定のための大規模な電子医療記録と解釈可能な機械学習の活用: システム開発と検証のプロトコル。 JMIR 解像度プロトコル 2022;11(3):e34201。

Rコアチーム。 R: 統計コンピューティングのための言語および環境。 R 統計コンピューティング財団、オーストリア、ウィーン。 2020. https://cran.r-project.org から入手可能

クリステンセンRHB。 ordinal---順序データの回帰モデル。 R パッケージバージョン 2018.4–19。 2018。http://www.cran.r-project.org/package=ordinal/ から入手可能です。

ヴェナブルズ WN、リプリー BD。現代応用統計学 S. 第 4 版ニューヨーク：スプリンガー。 2002年。

Google Scholar を予約する

ワームMJ、ラトウズPJ、ハンロンBM。正規化順序回帰と ordinalNet R パッケージ。統計ソフトウェアのジャーナル。 2017;99(6):1–42。

Google スカラー

Liaw A、Wiener M。randomForest による分類と回帰。 Rニュース。 2002;2(3):18–22。

Google スカラー

クロプコJ、ハーデンJJ。 coxed: コックス比例ハザードモデルの期間ベースの関心量。 2020。https://CRAN.R-project.org/package=coxed から入手できます。

Harrell Jr F. その他: ハレルその他; 2021. https://CRAN.R-project.org/package=Hmisc から入手可能です。

ゴフ DCJ、ロイド・ジョーンズ DM、ベネット G、コーディ S、ダゴスティーノ RB、ギボンズ R、他心血管リスクの評価に関する 2013 ACC/AHA ガイドライン: 診療ガイドラインに関する米国心臓病学会/米国心臓協会特別委員会の報告書。循環。 2014;129(25 補足 2):S49–73。

PubMed Google Scholar

Rabar S、Lau R、O'Flynn N、Li L、Barry P. 脆弱性骨折のリスク評価: NICE ガイダンスの要約。 BMJ。 2012;345:e3698。

論文 PubMed Google Scholar

コリンズGS、ライツマJB、アルトマンDG、ムーンズKGM。個人の予後または診断のための多変数予測モデルの透明性のあるレポート (TRIPOD): TRIPOD ステートメント。 BMJ。 2015;350:g7594。

論文 PubMed Google Scholar

プロブスト P、アラバマ州ブーレスティス。ランダムフォレスト内の木の数を調整するかどうか。 J マッハ学習研究所 2018;18:1–18。

Google スカラー

スカーフィールドBK。信号検出可能性の理論における複数イベントの強制選択タスク。 J 数学心理学。 1996;40(3):253–69。

論文 CAS PubMed Google Scholar

ハンドDJ、RJまで。複数のクラス分類問題に対する ROC 曲線下の領域の単純な一般化。マッハラーニング。 2001;45(2):171–86。

記事 Google Scholar

ファンカルスター B、ファンベル V、ヴェルゴーウェ Y、ティマーマン D、ファンハッフェル S、シュタイアーバーグ EW。 c 統計を名目上の多分結果への拡張: 多分性識別指数。統計医学。 2012;31(23):2610–26。

論文 PubMed Google Scholar

Dover DC、Islam S、Westerhout CM、Moore LE、Kaul P、Savu A. 多妻差別指数の計算。統計医学。 2021;40(16):3667–81。

論文 PubMed Google Scholar

Guo X、Khalid MA、Domingos I、Michala AL、Adriko M、Rowel C、他。ローカル意思決定支援のためのディープラーニングとセキュリティのためのブロックチェーン技術を使用した、マラリア検出のためのスマートフォンベースの DNA 診断。ナットエレクトロン。 2021;4(8):615–24。

記事 CAS Google Scholar

クリッタナウォン C、ロジャース AJ、ジョンソン KW、ワン Z、トゥラキア MP、ハルペリン JL、他。スケーラブルな心血管管理のための新しいモニタリングデバイスと機械学習テクノロジーの統合。ナット牧師カーディオール。 2020;18(2):75–91。

記事 PubMed PubMed Central Google Scholar

Wu Y、Yao X、Vespasiani G、Nicolucci A、Dong Y、Kwong J 他糖尿病の自己管理をサポートするモバイルアプリベースの介入: 血糖効果に関連する機能を特定するためのランダム化比較試験の系統的レビュー。 JMIR Mヘルス Uヘルス。 2017;5(3):e6522。

記事 Google Scholar

フェッリ A、ロザティ R、ベルナルディーニ M、ガブリエリ L、カサッチャ S、ロメオ L、他電子医療記録とスマートフォンデータを介したライフスタイルの測定を活用した、機械学習ベースの消費者ヘルスケアプラットフォームの設計に向けて。参加場所: 2019 IEEE 23rd International Symposium on Consumer Technologies (ISCT); 2019.p. 37〜40。

Google Scholar の章

リファレンスをダウンロードする

なし。

この研究は、シンガポールのデューク NUS 医科大学の支援を受けました。 YN は、Tan Sri Khoo Teck Puat 財団からの Khoo Postdoctoral Fellowship Award (プロジェクト番号 Duke-NUS-KPFA/2021/0051) によって支援されています。資金提供者は、研究の設計、データの収集と分析、出版の決定、原稿の準備には何の役割もありませんでした。

Seyed Ehsan Saffari と Yilin Ning も同様にこの作業に貢献しました。

デューク NUS メディカルスクール、定量医学センター、シンガポール、シンガポール

セイエド・イーサン・サファリ、イーリン・ニン、フォン・シー、ビバス・チャクラボルティ、ロジャー・ヴォーン、ナン・リウ

医療サービスおよびシステム研究プログラム、デューク NUS メディカルスクール、シンガポール、シンガポール

セイエド・イーサン・サファリ、フォン・シー、ビバス・チャクラボルティ、ロジャー・ヴォーン、マーカス・エン・ホック・オン、ナン・リウ

米国ノースカロライナ州ダーラムのデューク大学生物統計および生物情報学部

ビバス・チャクラボルティ

シンガポール国立大学統計データサイエンス学部、シンガポール、シンガポール

ビバス・チャクラボルティ

エラスムス MC 大学医療センター、脳神経外科、ロッテルダム、オランダ

ヴィクトル・ヴォロヴィチ

オランダ、ロッテルダム、エラスムス MC 公衆衛生局

ヴィクトル・ヴォロヴィチ

シンガポール総合病院救急科、シンガポール、シンガポール

マーカス・エン・ホック・オン

SingHealth AI オフィス、シンガポールヘルスサービス、シンガポール、シンガポール

ナン・リウ

シンガポール国立大学データサイエンス研究所、シンガポール、シンガポール

ナン・リウ

PubMed Google Scholar でこの著者を検索することもできます

NL: 研究の構想と設計、監督と指導。 ES、YN、FX: モデル開発、最初のドラフト作成。 ES と YN: データ分析。 ES、YN、FX、BC、VV、RV、MO、NL: 結果の解釈、アルゴリズムの改善、原稿の重要な改訂に多大な貢献をしました。すべての著者は結果を検討し、原稿の最終版を読んで承認しました。

ナン・リウへの通信。

この研究はシンガポール保健サービスの集中治験審査委員会（CIRB 2021/2122）によって承認され、EHRデータ収集に対する同意の放棄が認められました。すべての方法は、関連するガイドラインおよび規制に従って実行されました。

適用できない。

なし。

シュプリンガーネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープンアクセスこの記事はクリエイティブコモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブコモンズライセンスへのリンクを提供し、変更が加えられたかどうかを示します。この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブコモンズライセンスに含まれています。素材が記事のクリエイティブコモンズライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。データのクレジットラインに別途記載がない限り、クリエイティブコモンズパブリックドメインの献身的権利放棄 (http://creativecommons.org/publicdomain/zero/1.0/) は、この記事で利用できるデータに適用されます。

転載と許可

Saffari、SE、Ning、Y.、Xie、F. 他。 AutoScore-Ordinal: 順序結果のスコアリングモデルを生成するための解釈可能な機械学習フレームワーク。 BMC Med Res Methodol 22、286 (2022)。 https://doi.org/10.1186/s12874-022-01770-y

引用をダウンロード

受信日: 2022 年 5 月 24 日

受理日: 2022 年 10 月 25 日

公開日: 2022 年 11 月 4 日

DOI: https://doi.org/10.1186/s12874-022-01770-y

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供