医療・健康分野データサイエンスに挑むための5つの課題

 医療・健康分野のビッグデータの活用により、近未来においては、医療や創薬の在りようが大きくパラダイムシフトし、発展していくだろうと期待されています。
 しかし現状においては、そうした期待とは裏腹に、企業や個人がデータサイエンスを用いて医療や創薬の分野における技術革新などを推進していくためには、いくつかの課題があり、まずはその課題を超えていく必要があります。逆に言えば、その課題を解決できれば、データサイエンスが医療・健康分野において大きく貢献することが可能になるのです。
 そこで本稿では、医療・健康分野においてデータサイエンスに挑むための5つの課題を提示し、それぞれの課題に対する解決策を提案していくことにします。

医療・健康データサイエンスの課題①:未整備かつ扱いが厳重なデータ

 医療・健康分野に限ったことではありませんが、データサイエンスにおいては、その取り扱うデータが一定以上の品質を保持していること、そしてデータそのものが取り扱いやすいものであることはとても重要です。

 しかし、医療分野のデータにおいては、品質と取り扱いやすさという点で、大きく2つの課題を抱えています。

1つはデータの品質に関連する収集・保有における課題です。

 日本の各地域では情報連携や、レセプト等のデータベース整備が進んでいます。しかし、健康・医療・介護に関するさまざまなデータがばらばらのデータベースとして存在し、しかもデータベースごとに縦割りで管理・運用されており、データを活用できる主体も限られています。そのため現時点では、国民一人ひとりの健康・医療・介護のデータを連結し、ある個人について経年的な変化を把握するようなことができないのです。これはデータサイエンスの適用にとっては大きな痛手です。新薬等の研究開発等につなげるためにデータサイエンスを適用しようにも、データ利活用基盤がないのです。このあたりの議論は、以下の記事にも詳しいので、興味のある方はご一読いただければ幸いです。

2つめは取扱い、つまり利活用における課題です。

 データには「一次データ」「二次データ」の2種類が存在します。特定の目的のために収集されるデータを一次データと呼び、(自分を含め)誰かがある目的に利用するために集めたデータを他の目的で利用する場合のデータを二次データと呼びます。

 データサイエンスの適用対象となるデータは多くの場合、二次データになります。しかしながら、二次データ(=本来、データサイエンスを目的にしていないデータ)を利用して、ある目的に向けてデータサイエンスで分析を行おうとしても、そもそも、その目的にかなったデータ品質が確保されておらず、適切に利活用できない場合も多々あります。例えばデータサイエンスの一手法である「AIによる画像解析」は、人間には判別できないレベルのノイズデータが入っただけで判定を誤ることがあります。そのため、使用するデータが一定レベルの品質を保持していることが大切です。また、やむなく品質の劣るデータを利用しようとすれば、ノイズの除去などの追加作業が必要になるなど、円滑な利活用の妨げとなることもあるのです。それほどにデータの質は大切になってきます。データの質が確保できないと、データサイエンスによって生み出されたAIが、そこで求められる説明可能性や透明性への要求に応えることができなくなってしまうのです。
 私たちがデータサイエンスに挑もうとするならば、別々に集められたデータが集約されているデータ基盤と、さらにデータサイエンスの適用に耐えうるだけの品質をもったデータが必要となるのです。

課題①の解決案:クオリティデータ収集とデータ利活用基盤の構築

 こうした課題に対して、一企業、あるいは一個人で解決できることは多くはありません。そのため、国や地方自治体など公的な機関が中心になって、さまざまな取組みが進められています。
 その一例が、地域医療連携ネットワークの高度化(クラウド化)です。地域医療情報連携ネットワークとは、各医療機関が患者の同意のもとで患者の電子カルテ(Electronic Health Record:EHR)を登録・閲覧できるシステムです。これがきちんと機能していれば、例えば同じネットワーク内にあるA医院、B医院の両方に通っている患者さんがいた場合に、A医院の医師がB医院のカルテを、あるいは逆に、B医院の医師がA医院のカルテを参照できるようになります。これにより、患者さんに提供できる医療の質を高めることが可能になります。2017年時点で、全国に約270の地域医療情報連携ネットワークが存在しますが、データの入力が進まない(多くは情報閲覧だけに留まっている)こと、運用コストが大きいこと等から、参加する施設や患者さんが伸び悩み、活用が十分に進んでいませんでした。

 そして、そうした状況を受けて、総務省が主体となり平成28年度補正予算(20億円)を活用し、クラウドを活用して全国の地域医療情報連携ネットワークを束ねた情報基盤を整備する事業に対する補助が実施されていました。この事業(平成28年度第2次補正予算「クラウド型EHR高度化事業」)の成果は、総務省により、以下のサイトにてまとめられています。興味のある方は参照してください。 

参照 : 平成28年度第2次補正予算「クラウド型EHR高度化事業」の成果

 また医療等データの利活用として、患者が自らの医療・健康情報を収集し一元的に保存するしくみであるPHR(Personal Health Record)の導入もなされており、さらにPHRや電子カルテについては、情報の品質向上に向けて標準化が進められています。

 我々のような、データサイエンスで医療・健康領域に価値を提供していきたいと考えている立場の企業、個人としては、これらの取組みを踏まえておき、また、最新の情報をフォローし続ける必要があります。データ収集、データ基盤の構築状況を注視し、それを参照・活用できるように常に準備を進めておくことが、データサイエンスによる価値創出の機会獲得につながるのです。

医療・健康データサイエンスの課題②:法による規制

 医療分野でのデータ活用の普及に伴い、データの取扱いに関して、法による新たな規制の制定や厳重化が進められています。例えば、法規制による匿名化などがありますが、これらによりデータ活用に制約がかかる可能性があります。

 具体的な事例としては、2020年の個人情報保護法改正で新たに「仮名加工情報※1」が定義されました。(※1他の情報と照合しない限り特定の個人を識別することができないように個人情報を加工して得られる個人に関する情報)
また、それ以前の個人情報保護法の改正においては、病歴等が「要配慮個人情報」に位置づけられ、いわゆるオプトアウトによる第三者提供が禁止されるとともに、要配慮個人情報を含め、特定の個人が識別できないように加工された匿名加工情報の利活用に関する仕組みが設けられていました。

 個人情報保護法はたびたび改正されています。医療データは概ね、重大な個人情報になりますので、個人情報保護法をはじめ、新しく制定された法規制や法改正を正確にタイムリーに把握することが求められます。それをせずに不用意にデータを扱い、それが結果的に法違反だということになれば、社会的信用の既存など大きな損害を被ることにもなりかねないのです。

課題②の解決案:医療情報を取り扱う際の安全管理・信頼性向上

 データサイエンスに取り組み、医療情報などを扱う企業・個人としては、これらの法による規制に適切に対応する必要があります。

 経済産業省が「医療情報システムのセキュリティに関するガイドライン」として、法令遵守のためのガイドラインをまとめています。医療データサイエンスに取り組む企業は、このガイドラインを企業内に周知する事が必要ですし、データサイエンスにたずさわるメンバーはこれを正しく理解することが重要です。

 このガイドラインはWeb上でも公開されていますので、定期的にキャッチアップすることができます。

参照 : 医療情報システムの安全管理に関するガイドライン 第 5 版

 また、オプトアウトによる第三者提供が禁止されたことに伴い、オプトイン式で個人情報を集め、それを取り扱うケースが増えることでしょう。その際には、個人情報保護法における「適切な利用目的」の明確化を図ることが重要です。政府としては、仮名加工情報をより活用できるように法整備をする方針でいますので、企業としては自分たちが取り扱う対象や利用目的等を検討したり、データフローやデータ活用の透明性を高める施策を推進したりするなど、データ管理者・利用者に対する信頼性の向上を図る必要があります。

医療・健康データサイエンスの課題③:データサイエンス遂行可能な人材の不足

 IT人材の不足は、現状の約17万人から2030年には約79万人に拡大すると予測され、今後ますます深刻化すると言われています。

 上図は経済産業省の「IT 人材需給に関する調査」報告書に掲載されているIT系人材の推移予想です。需要の伸びによって必要とされる人数に違いがでるので、伸びが高い・中程度、低いの3段階のシミュレーションが行われていますが、真ん中でみても2030年には45万人の人材不足が予想されています。特に、データサイエンス、AI等を使いこなして第4次産業革命に対応した新しいビジネスの担い手となる先端IT人材の育成の必要性が取り上げられています。とにかくデータサイエンスによる挑戦をするために必要な人材が、全国的に不足しているのです。もちろん医療・健康分野も例外ではありません。

 医療データを巡っては、2018年5月に次世代医療基盤法が施行され、患者が拒否しなければ、国から認定された事業者(認定匿名加工医療情報作成事業者)が医療機関のデータを収集して匿名化し、大学や製薬会社などに提供できるようになりました。このあたりの動きは、以下の記事に詳しいので、興味のある方は是非ご一読ください。

 一ついえることは、制度が整ったとしても、そもそも医療データの収集や匿名化、ビッグデータ分析ができる人材の不足が指摘されており、医療データに精通し、そのデータを適切に扱える人材の育成が急務となっているということです。逆に言えば、今の時代は、データサイエンスに取り組むチャンスの時代だということです。今からデータサイエンスに取り組む企業が、医療・健康分野に大きな貢献を果たす可能性は極めて大きいのです。

課題③の解決案:「医療データ人材」の育成と育成の仕組みづくり

 これらの人材不足について、政府も手をこまねいているわけではありません。文部科学省、各大学機関、経済産業省が主体となり、その育成の仕組みづくりが始まっています。

 具体的な事例としては、経済産業省の「第四次産業革命スキル習得講座認定制度」です。これは、“IT・データを中心とした将来の成長が強く見込まれ、雇用創出に貢献する分野において、社会人が高度な専門性を身に付けキャリアアップを図る、専門的・実践的な教育訓練講座を経済産業大臣が認定する制度”です。当社のグループ会社であるD4cアカデミーも第四次産業革命スキル習得講座を運用している会社です。講座の詳細については、以下をご覧ください。

データサイエンスアカデミー|データ分析のスペシャリスト育成
データサイエンスアカデミーは、データサイエンティストやデータ分析担当者を育成するスクールです。いつでも学べるWEB講義とどこでも学べる週1回の演習で、データサイエンスを効率的に習得できます。

 また、文部科学省では大学などがビッグデータを分析することで、年齢や性別、症状に応じて最も効果的な治療方法や薬の研究が進む可能性があるとみて、2019年6月、東京大学を中心とする4大学、京都大学を中心とする11大学の2グループを「医療データ人材」の育成拠点に選定しました。2019年度中にカリキュラムの開発、教員の確保などの準備を進め、2020年度にそれぞれで育成コースを新設しています。

 では、これからデータサイエンスに挑む企業としては何をすればいいのでしょうか? 医療分野にも詳しく、かつデータサイエンスもできる人材を集めなければ、当該分野で価値を創出することはできません。データサイエンスにも医療分野にも詳しい人間をどうやって集めるべきでしょうか。アプローチは3つしかありません。「採用する」「育てる」「外部から招く」です。

 まずは「採用する」です。しかし、この人材不足のなか、データサイエンスの経験者で、かつ医療分野にも詳しいという人材がおいそれと見つかるわけではありません。そこで、データサイエンス・医療に精通した経験者の採用は諦め、政府の人材育成プログラム等によって育てられた若手を積極的に採用していく方法が考えられます。医療に詳しい人材はなかなか見つからないかもしれませんが、一通り、データサイエンスを学んだという人材ならば(政府もそういう人を育てていますので)採用できる可能性は高くなります。

 次に「育てる」です。データサイエンスのことはわからなくても、医療について詳しい人材ならば社内にいるという企業はあります。そこで、そういう社員に教育を施して、データサイエンスができるようにすればいいのです。幸いにして、法人向けに教育プログラムを提供する会社は、少数ではあるものの存在します。当社もそういう会社の1つです。

【法人向け】D4cアカデミー|データサイエンス人材の育成研修・コンサルティング
【法人向け】D4cアカデミー|データサイエンス人材の育成研修・コンサルティング


 しかし、若手のデータサイエンティストにせよ、社内メンバーから選抜して教育した人材にせよ、経験不足は否めません。少なくとも、採用してきた、あるいは、育ててきた人材が独り立ちするまでに、経験者と一緒に学ばせる必要があります。

 そのためには“経験者”が必要で、その経験者を獲得する方策が「外部から招く」です。外部から、多くの経験をしてきたプロフェッショナルを招き、自社の若手と一緒に仕事をさせることで、データサイエンス業務を進めつつ、若手を育てるのです。手前味噌ながら、当社自体がそうした仕組みで人材の育成を実践しているプロフェッショナルの会社であると自負しています。

株式会社データフォーシーズ
企業に、そしてインターネット上に氾濫する膨大な溢れるデータからビジネスに有用な知見を抽出する。顧客のふるまいを確率的に推計し市場動向と自社業績を見通す。事業のリスクを最小化しリターンを最大化。我々データフォーシーズは「ビジネスを加速する」ことを使命としてクライアント企業を支援する、データ解析のスペシャリスト集団です。

医療・健康データサイエンスの課題④:経営陣のコミットメント

 医療・健康に限ったことではありませんが、データサイエンスに挑む上で、経営陣のコミットメントを組織全体へ浸透させていくことは重要です。これは昨今のDX(デジタルトランスフォーメーション)推進にも通じるところがあります。

 企業には、経営者(トップ)~ミドルマネジメント~若手まで多くの階層の社員がおり、それぞれの立場によって、視座も異なります(経営的温度差ともいわれます)。

 企業のトップは企業の存続に責任を持つ立場であり、長期的な視点が欠かせません。そのため、昨今注目されている「データサイエンス」や「DX」の長期的な経営インパクトを考慮し、これらに着手しなかった場合のリスクに対する危機感を高めています。

 また、若手といわれる20代~30代の社員も、もともとデジタルリテラシーが高く、かつ終身雇用制度を前提としていないこともあり、自身のキャリアを積むためにもデータサイエンスのような新しい動きに積極的に関わりたいという意識が高い傾向があるといえます。加速度的に変化していく時代に適応し、個人として生き残っていくためには、当然のマインドだといえるでしょう。

 しかし一方で、ミドルマネジメント層の場合は、トップや若手に比して、こうした新しい動きに消極的なことが多いといわれます。中には「自分の仕事を増やしたくない」という理由で、ミドルマネジメント層がイノベーションの芽を潰してしまった事例などもあるそうです。そのため、「ミドルマネジメントは危機感が弱い」「挑戦する事に対して億劫になっている」という論調が飛び出ることがありますが、それは違います。実は、今、現在進行形のビジネスに対して、最も現場感をもち、その推進に対して最も強い責任感で挑んでいるのは、他ならぬミドルマネジメント層でしょう。現在進行形のビジネスに強い責任感でコミットしているからこそ、中長期的な活動であり、また多くのリソースを必要とするデータサイエンスやDXのような不確かなものに慎重なのです。

 トップとしては、このような各層の意識や考え方などを理解した上で、ミドルマネジメント層を動かすために、トップとして、どのようなコミットメントを発信すべきかが課題となっているのです。

課題④の解決案: 全社戦略・変革プラン全体像の明示化と組織人事のデザイン

 トップがコミットメントを表明する際、まず大事になるのが前述の各層の意識や考え方を理解することです。ミドルマネジメント、若手、それぞれが各自の置かれた立場と責任の中で、必死にやっていることをまずは理解してください。

 その理解に基づき、データサイエンスやDXを進める上では、それがどんな価値を生み出すのかというビジョンを明確に示すことが不可欠です。単に既存の業務の改善や効率化にとどまらず、データサイエンスやDXによって可能となる価値創出や、それによる事業成長の道筋などを明確なビジョンとしてまとめることが必要なのです。

 ただやみくもに「データサイエンスやDXをやろう(やれ)」と号令をかけるのではなく、データサイエンスやDXを重要な全社戦略のひとつとして位置づけ、変革のビックピクチャー(変革プランの全体像)を描き、明確なビジョンとして全社へ展開することが重要です。

 そして、明確なビジョンとして表明され、全社戦略のひとつとして位置づけられたデータサイエンスやDXへの取組みを具現化するための、組織の整備や権限移譲・人材のアサイン・予算配分・プロジェクトおよび人材評価のあり方などを計画立案し、事業計画、組織図・体制図をそのエビデンスとして提示していくことが肝要です。

医療・健康データサイエンスの課題⑤:データからの価値創出方法

 医療・健康分野においてもモビリティ、コネクティビティ、オートメーション、ビッグデータ、クラウドサービス、IoTなどの普及によって、新たな技術開発、データ活用が可能となっています。そのため、この領域でデータサイエンスやAI、ビッグデータを如何に活用し、高い価値を創出するためにはどの様な方法を取るかが大きな課題となっています。

 ビッグデータやデータサイエンス、AIといった一見新しい技術領域では、誰もがこれまでにない斬新なビジネスモデルや収益源、サービスを創出することを期待します。しかし現実には、うまくいくケースはごくわずかで、期待はずれに終わることが多いのも事実です。期待外れに終わってしまうケースというのは往々にして目的が不明確で、非効率な計画を実施したものです。ですから、データサイエンスやDXを推進する上では、如何にデータから価値を創出し期待される成果を出していくかを明確にすることが極めて重要なのです。

課題⑤の解決案:戦略的アプローチによるデータ価値創出

 データから価値を創出するためには戦略的アプローチがひとつの解決策になると考えられます。データを扱う場合、現在どれだけデータを保有しているか、データの出どころはどこでどのように使えるかを最初に考えがちです。しかし、まず行うべきは、そのデータサイエンスの取組みにおいて、大きな価値を創出できそうなのは何かを明らかにすることです。そして、その価値創出を実現するにはどのようなデータ資産が必要かを突き詰めることです。データの真の価値を理解し、その使い方を戦略的に考えるための努力を惜しまないことで、コストに見合った成果を期待できるのです。

 また、そのような戦略的アプローチを推進し、新たな高い価値を創出するためには、既存組織、文化、風土のままでは難しい場合が多いようです。そのため、組織文化やその風土までを改革することが必要であり、IT投資の考え方、システムの作り方、人財の確保・育成、組織の見直し等を進めることが必要になります。

 データサイエンスやDXはITとビジネスモデルが密接に融合しているため、IT側にはビジネスの知識が、業務側にはIT技術の知識やそれを使ってビジネスを作り出す能力が、それぞれ必要です。その前提に立った組織改革、見直し等を含めた取組みがあってこそ、データからの価値創出につなげることができるのです

まとめ

 人々の健康、長寿に貢献し、健康長寿社会を実現する上で、データサイエンスが果たすことのできる役割は多様です。しかし、その役割を着実に遂行するためには、解決しなければならない課題があることもまた明白です。本稿では、医療・健康分野でデータサイエンスに挑むための課題を5つ取り上げ、それぞれについての解決の方向性なども示しました。

 今後、時代の変遷とともに、データ活用の在りようやさまざまな技術革新なども進み、新たな課題の発生や、既知の課題が変容することもあることでしょう。

 しかし、そうした課題に果敢に挑戦し、克服し、人々のQOL(quality of life)に資することが、データサイエンスに取り組む者の使命であることには変わりがありません。

タイトルとURLをコピーしました