記事を検索する
注目のキーワード

データサイエンティスト育成を急ぐ国と企業 背景にある切迫した事情

2022年03月31日更新

DX(デジタルトランスフォーメーション)が国の方針となっている今、DXを推進する人材の採用と育成が急務になっています。ディープラーニングやAIがキーワードになっている現代では、システムエンジニアやプログラマーといった従来のIT人材とは異なり、収集された膨大な量のデータから最適解を導き出すことのできる「データサイエンティスト」に注目が集まっています。

大手ITベンダーのNECが、2021年10月にデータサイエンティストを育成するプログラムを発表したほか、各企業や大学でもデータサイエンティストを育成する動きが出てきました。AIを使い膨大な量のデータである「ビッグデータ」から、これまでは不可能と考えられていた速度で答えを導き出せれば、創薬などさまざまな分野でイノベーションが起こせると考えられています。

ところが、こうしたスキルを持つ人材が不足しているといいます。宇宙科学分野で最高峰であるはずの組織の米航空宇宙局(NASA)でさえ、優秀な人材確保には苦労しているといいますから、その不足ぶりは顕著です。この記事では、データサイエンティストが強く求められる理由を探りながら、今後のDX推進の方向性を考えます。

データサイエンティストはなぜ求められるのか?

まず、なぜデータサイエンティストが求められるようになったのか、その理由を探ります。現状は、AIを使った開発やビッグデータ分析を受託する企業、製薬会社、大手企業、Webサービス提供事業者など、さまざまな業種がデータサイエンティストを必要としています。

AIを使った開発とビッグデータ分析の分野

コンピュータに学習させるディープラーニングの登場に加え、IoT(Internet of Things)でこれまで見えなかったもの、人間の勘でしかとらえられなかったものまで電子データにされ、可視化が進みました。クラウドシフトによりデータ連係や共有化が容易になり、これまで不可能と思われていた大量データを分析する需要が生まれたのです。

「ビッグデータを効率的に収集してAIに学ばせる」ことで、何十年も時間をかけなければわからなかったことが短時間でわかるようになる可能性があります。AIはプログラムがあってもデータがなければ役に立ちません。またデータとAIがあったとしても分析手法を思いつかなければ、結果は出ません。

ここで、ビッグデータの取り扱いができて、AI開発もできるデータサイエンティストが強く求められることとなります。複雑化する社会環境の中、従来扱っていたような単純なデータ群からは従来通りの答えしか導き出せません。これからはビッグデータをAIによって多面的に解析し、違う切り口で最適な答えを導き出す必要があります。

そのためにも、データサイエンティストの存在は必須なのです。

経験豊富なデータサイエンティストは少ない

これまでも言われ続けてきたことですが、IT業界はいつも人材不足です。人材がいないことより、進化が早すぎて人材育成が追い付いてこないのが現実でしょう。また、エンジニアには自分の極めたい分野というものがありますし、すべての分野に精通する技術者など見つかるはずもありません。

このようにして絶対数の限られたIT技術者の中で、企業が求める人材とのマッチングは簡単にはいきません。特に近年になって急にその需要が増えたデータサイエンティストは「ITの知識を携えた科学者」ということになり、極めて少数です。需要と供給のミスマッチでなんと数万人が不足しているといわれているほどです。

ゆえに、企業間での獲得競争は熾烈(しれつ)を極めており、ヘッドハンティングはもとより、グーグルがデータサイエンティストコミュニティKaggleを買収したように、企業ごと買い取るほどの勢いです。もともと大学に育成機関もあまりないため、基本的に新卒のデータサイエンティストはいません。企業の中で経験を積んできたこれらデータサイエンティストたちを奪い合う状態です。

国が考える今後のIT人材
国が考える今後のIT人材(経済産業省資料から)

国も、データサイエンティスト育成に本腰を入れています。経済産業省が作成した「AI・データサイエンス人材育成に向けたデータ提供に関する実務ガイド」によると、経済産業省は、AIの社会実装、AI・データサイエンスを利用した企業等の課題の解決を進めるため、データを用いて課題を解決する人材を育成する「AI Quest(課題解決型AI人材育成事業)」に取り組んでいます。

この取り組みは、企業が抱える課題をよく理解し、必要かつ適切なAIの導入・実装を行うことができる人材の育成には、企業の課題とそれに関連するデータを用いた実践的な学習が有効であるとの考え方に基づくもので、教材とする目的で加工・整備したデータとは別に、欠損値などの処理が行われる前のデータを用いた実践的な教育方法の重要性が指摘されています。

また、文部科学省は、数理・データサイエンス・AIは、専門分野を志す学生にとどまらず、一般の学生が今後の社会で活躍するために必要な基盤となるスキルであるとして、数理・データサイエンス・AI教育の全国展開をより一層加速させるため、新たな協力校と特定分野協力校を募集しています。その中で、あらゆる分野において、数理・データサイエンス・AIを理解し、データの利活用を進めることができる人材が育てるため、特に、特定分野協力校には、それぞれの専門分野におけるデータの収集と、関連教育の教材の整備を求めています。

特に求められる数理統計・ITなどの高度な知識を持った人材

急速に進んだIT化によって、このようにデータサイエンティストの需要が生まれています。IT化が急速に進んでも、AIを活用してビッグデータを解析できるデータサイエンティストの育成は、学校ではこれまで行われてきませんでした。

現在、いくつかの大学で学部を新設するなどデータサイエンティストの育成を試みるところが現れてきています。平成30年度は横浜市立大と広島大、令和元年に中央大や兵庫県立大、2年度は長崎大や福知山公立大、3年度は立正大や南山大、4年度もいくつかの大学がデータサイエンスを学べる学部を新設する予定です。それでも、歴史的に日本の大学の学部の人数は少なく、米国などのように何万人というレベルで育成するようなシステムはありません。仮にそこを卒業した学生を、企業が一人前に育成するにしても、企業内に育成プログラムがそろっていない状態です。

役に立てるデータサイエンティストになるには数理統計やITなどの高度な知識が必要です。通常のITエンジニアのようにはいかないわけで、この問題が深刻であることが分かります。データサイエンティストの不足は、ここ数年で解決できるような問題ではなさそうです。

データサイエンティストを欲しがる業種とは

データサイエンティストを必要としているのはIT業界だけとも思われがちですが、そうではありません。AIによるデータ分析は世の中のほぼすべての分野の産業が必要としています。

以下に代表的なものをいくつか挙げて紹介します。

金融・保険

日本のネットワークはインターネットが普及する以前から銀行が普及させたものであり、銀行のシステムはIT産業のけん引役でした。金融業界には古くからコンピュータシステムを運用してきた下地があります。

その金融サービスは今、大変革の時期を迎えています。AIの学習により、マネーロンダリング(資金洗浄)や不正を検知するシステムを開発するニーズ、チャットで顧客と対話してサービスを提供する企業も増えています。そのうち、AIでビッグデータを解析して信用調査を実施したり、投資有効性を判断したりする場合にも用いられることになるでしょう。

製造業

製造業では、製造設備の保全や品質管理、効率化、CO2削減を中心とした環境配慮などに利用されます。長年工場のラインで蓄積されたデータをAIで解析します。そこから出る答えで、部品交換の時期を指定するなどし、製造設備の故障で、生産が止まるようなことを未然に防ぎ、生産効率を上げ、人員配置を最適化し、電力需要まで予測して無駄を排除するなど徹底した効率化が可能になります。

米自動車メーカーの1社は、製造プロセスの改革にビッグデータを活用しています。多数のセンサーを自動車に取り付け、大量な情報を得られるようにした上で、納品後の自動車の状況や故障率を監視することで、継続的に品質改善を試みています。製造業はAIとデータサイエンティストが目に見える形で腕を振るえる業種と言えるでしょう。

行政

行政では、アンケートやSNSからわかる市民の意見、交通量のデータ、過去に起きた事件事故、自然災害、などさまざまなデータを分析し、政策に生かして、皆が安心して暮らせる社会を作る必要があります。

政府も令和元年ごろからデータ分析に基づくエビデンスに基づいた政策を打ち出せるように「地方公共団体におけるデータ利活用ガイドブックVer.2.0」(令和元年5月21日)を発表しています。このガイドブックの中では、「データ活用型公務員の育成」が提唱されていますが、これはまさに、行政の場にデータサイエンティストが求められていることを裏付けるものと言えるでしょう。

産官学の連携を

DXは、クラウドシフトを背景に、大量データの共有とAIなどの最新技術を活用し、過去を整理し、新しい知恵を発見して、未来を切り開くことだと言えます。それを実現するためには、データを理解する人材の力が不可欠です。
データサイエンティストが活躍する近未来では、製造業や金融、流通など既存産業の変革はもちろん、難病の克服や自然災害の予測など、社会課題の解決も進んでいくと考えられます。

そのためには、データサイエンティストの育成が急務です。産官学が連携し、データサイエンティストの育成に注力する時を迎えています。

誰でも簡単に
「社内外のデータ収集」と
「非構造化データの構造化」で
データを資産化

AirLakeは、データ活用の機会と効果を拡張する
ノーコードクラウドデータプラットフォームです。            

鬼尾宗慶
ITをはじめとする、各種ビジネス分野のライター。
SEやビジネスマンとしての30年にわたる経験に最新の知見を組み合わせて、各種Webメディアで執筆活動をしている。
0