機械学習技術の社会実装(荒木雅弘 准教授、田中一晶 准教授) 

2020年10月

機械学習技術の社会実装
~運送業における医療情報を基にした重症化発症モデルの構築に関する研究~

概要

・日本システム技術株式会社およびSGホールディングスグループ健康保険組合との共同研究として、健康保険組合員の健康診断結果および医療機関を受診した際に発行されるレセプト情報を基にして、将来の生活習慣病の発症予測を行う手法の開発に取り組んだ。
・2018年度は、レセプトの情報から発症予測を行うモデルの開発、および、健診結果から発症予測を行うモデルの開発を行った。

問題点

・レセプト情報は、通常の機械学習用データと多くの点で異なっており、扱いが難しい。

□予測に使えるレセプトの枚数が人によって異なる(可変長データ)
□摘要項目(診療行為や医薬品名)を表の項目としたとき、表の大半は空白
□摘要項目は文字列なので、何らかの方法で数値に置き換えなければならない
□正例(重症化した人)数が負例数に比べて極端に少ない(unbalancedデータ)

提案手法1

・特定の組合員に対して履歴が残るすべてのレセプトを結合して文書とみなし(図1)、発症予測問題を文書分類とみなしてニューラルネットワークとアンサンブル学習によって分類を行う手法(図2)を開発した。

提案手法2

・健診結果からの発症予測についてアンサンブル学習を適用し、ベースライン手法として現在広く行われている各健診項目に閾値を設定し論理和をとる方法と比較した(図3)。
・適切な機械学習技術を導入することにより、ベースライン手法と同程度のrecallを保ったまま、precisionを向上できることが分かった。

研究者プロフィール

荒木雅弘 准教授

あらき まさひろ

田中一晶 准教授

たなか かずあき

主な発表論文・関連特許

レセプトデータを用いた生活習慣病の発症予測

著者名 : 八重樫文絵, 荒木雅弘, 岡夏樹, 新谷元司, 吉川昌孝
掲載誌名 : 人工知能学会全国大会論文集
出版年月 : 2019年
巻・号・頁 : 1H3-J-13-05

https://confit.atlas.jp/guide/event-img/jsai2019/1H3-J-13-05/public/pdf?type=in(外部サイト)

健診データを用いた生活習慣病の発症予測

著者名 : 恒川充, 岡夏樹, 荒木雅弘, 新谷元司, 吉川昌孝
掲載誌名 : Journal of Bioscience and Bioengineering
出版年月 : 2019年
巻・号・頁 : SIG-AIMED-007-10

Prediction of Onset of Lifestyle-Related Diseases Using Regular Health Checkup Data. In: Ohsawa Y. et al. (eds) Advances in Artificial Intelligence

著者名 : Tsunekawa M., Oka N., Araki M., Shintani M., Yoshikawa M., Tanigawa T
掲載誌名 : Advances in Intelligent Systems and Computing
出版年月 : 2020年
巻・号・頁 : vol 1128. Springer, Cham pp. 14-26, DOI

https://doi.org/10.1007/978-3-030-39878-1_2(外部サイト)