2020年10月
機械学習技術の社会実装
~運送業における医療情報を基にした重症化発症モデルの構築に関する研究~
概要
・日本システム技術株式会社およびSGホールディングスグループ健康保険組合との共同研究として、健康保険組合員の健康診断結果および医療機関を受診した際に発行されるレセプト情報を基にして、将来の生活習慣病の発症予測を行う手法の開発に取り組んだ。
・2018年度は、レセプトの情報から発症予測を行うモデルの開発、および、健診結果から発症予測を行うモデルの開発を行った。
問題点
・レセプト情報は、通常の機械学習用データと多くの点で異なっており、扱いが難しい。
□予測に使えるレセプトの枚数が人によって異なる(可変長データ)
□摘要項目(診療行為や医薬品名)を表の項目としたとき、表の大半は空白
□摘要項目は文字列なので、何らかの方法で数値に置き換えなければならない
□正例(重症化した人)数が負例数に比べて極端に少ない(unbalancedデータ)
提案手法1
・特定の組合員に対して履歴が残るすべてのレセプトを結合して文書とみなし(図1)、発症予測問題を文書分類とみなしてニューラルネットワークとアンサンブル学習によって分類を行う手法(図2)を開発した。
提案手法2
・健診結果からの発症予測についてアンサンブル学習を適用し、ベースライン手法として現在広く行われている各健診項目に閾値を設定し論理和をとる方法と比較した(図3)。
・適切な機械学習技術を導入することにより、ベースライン手法と同程度のrecallを保ったまま、precisionを向上できることが分かった。
研究者プロフィール
- 紹介教員を見る
研究者ハンドブック
- 紹介教員を見る
研究者ハンドブック
主な発表論文・関連特許
レセプトデータを用いた生活習慣病の発症予測
著者名 : 八重樫文絵, 荒木雅弘, 岡夏樹, 新谷元司, 吉川昌孝
掲載誌名 : 人工知能学会全国大会論文集
出版年月 : 2019年
巻・号・頁 : 1H3-J-13-05
https://confit.atlas.jp/guide/event-img/jsai2019/1H3-J-13-05/public/pdf?type=in(外部サイト)
健診データを用いた生活習慣病の発症予測
著者名 : 恒川充, 岡夏樹, 荒木雅弘, 新谷元司, 吉川昌孝
掲載誌名 : Journal of Bioscience and Bioengineering
出版年月 : 2019年
巻・号・頁 : SIG-AIMED-007-10
Prediction of Onset of Lifestyle-Related Diseases Using Regular Health Checkup Data. In: Ohsawa Y. et al. (eds) Advances in Artificial Intelligence
著者名 : Tsunekawa M., Oka N., Araki M., Shintani M., Yoshikawa M., Tanigawa T
掲載誌名 : Advances in Intelligent Systems and Computing
出版年月 : 2020年
巻・号・頁 : vol 1128. Springer, Cham pp. 14-26, DOI
https://doi.org/10.1007/978-3-030-39878-1_2(外部サイト)
- 産学連携や研究支援に興味がある方(産学公連携推進センターHP)
- 紹介教員にメッセージを送りたい方(メッセージフォーム)
- 大学や学生を支援したい方(基金事業)
- 受験を考えている方(入試情報)
- 大学全体について知りたい方(京都工芸繊維大学HP)