この記事では以下の論文について解説します。
研究の目的
猫の慢性腎不全のリスクを予測する機械学習モデルを作成する。
方法
・日々の診療から得られた電子カルテのデータを利用する。
・電子カルテデータには、106,251の猫が含まれている。
・1995年の1月1日から2017年の12月31日までの電子カルテデータを利用した。
・最初の67%のデータは予測モデルを作成するために使用した。
・残った33%のデータはモデルのパフォーマンス向上に使用した。
予測モデル
・最終的なモデルは4つの特徴を用いたRNNモデルになった。
・4つの特徴は、「BUN」、「Cre」、「USG」そして「年齢」。
・RNNモデルは高いクロスエントロピースコアを示した。
・隠れ層は2層で、それぞれ3列および7列である。
・エポック数は16で学習した。
慢性腎不全のステージによる分類
この研究では、慢性腎不全のステージ毎に、データをT0〜T2の3つのグループに分類した。
慢性腎不全グループ
・電子カルテで腎不全と診断されている。
・最初の診断から30日以上経過しているデータは除外されている。

・T0は初めて慢性腎不全が診断された日の年齢を表す。
おそらく腎不全であるグループ
・このグループは診察では腎不全と診断されていない。
・このグループは腎不全を疑う以下の項目のうち、少なくとも2つの項目を満たしている。
- 血中クレアチニンが基準値以上。
- USGが基準値以下。
- 「慢性腎不全」、「高窒素血症」、「腎不全治療用フードの名称」がカルテに記載されている。

・T0は最終来院日での年齢を表す。
腎不全ではないグループ
・このグループは前出の2グループに含まれない症例。
・そして少なくとも2年分のデータが存在している。

・T0は最終来院日から2年前の年齢を表す。
結果
腎不全診断時点でのモデルの予測精度
・実際に腎不全が診断された時点でのモデルの予測精度を表す。
・感度は90.7%。
・特異度は98.9%。

腎不全診断から1年前時点での診断精度
・実際に腎不全が診断された時から1年前時点でのモデルの予測精度を表す。
・感度は63.0%。
・特異度は99%。

腎不全診断から2年前時点での診断精度
・実際に腎不全が診断された時から2年前時点でのモデルの予測精度を表す。
・感度は44.2%。
・特異度は99%。

「年齢」、「Cre」、「BUN」、「USG」の分布
・慢性腎不全グループの猫は高齢である。
・そして、腎不全でないグループに比べて、クレアチニンが高値、USGが低値である。
・これらの結果は「IRISの診断基準」に合致する。

各グループ間の違い
・腎不全グループと「おそらく腎不全」グループでは診断前に幾つかの大きな変化が見られる。


単一の検査値は診断に不十分
・腎不全グループと「腎不全でないグループ」の間で、
・「BUN」、「Cre」、「USG」の数値は重なりあっている。


モデルの予測精度の分布
・慢性腎不全の診断予測値が0.5を超えた場合、将来の腎不全リスクが高い。
・0.5以下の場合は将来の慢性腎不全リスクが低い。

予測モデルの感度と来院回数
・診断前に少なくとも2回の来院があると、感度は90%まで上昇する。

合併症と偽陽性
・偽陽性の症例の中で、明らかに4つの合併症が大きな比率を占めていた。

コメント