記事を検索する
注目のキーワード

データサイエンスはビジネスを科学する--武蔵野大学データサイエンス学部 の中西准教授

2022年03月31日更新

昨今、さまざまなところでデータサイエンスという言葉を聞くことが多くなったと思います。そもそもなぜこれほどデータサイエンスが注目されるようになったのでしょうか。また、データサイエンスは、どのようなサイエンス(科学)なのでしょうか。

データサイエンスと他のサイエンスとの違い

最初に、データサイエンスと他のサイエンスとの違いを考えなくてはなりません。データサイエンスと他のサイエンスとの違いは大きく2つあるかと思います。

1つは、モデルを人間が作るのか、統計・機械学習というツールを用いて作るかの違いがあります。ここでモデルというものは理論を表すための数式やルールを指します。公式などを思い出していただければよいかと思います。例えば、皆さんの一番よく知っている公式として、「オームの法則」があります。1826年にドイツの物理学者であるゲオルク・オームによって示されたからその名前がついているわけです。このように、モデルというのは、その道の専門家によって作られるものです。そのモデルが正しいのかを、適切なデータを集めてその公式に当てはめることによって、有効性を検証していたわけです。

モデルというと難しく感じますが、人間の勘やコツ、匠の技なんかは明示的に数式やルールで示されるわけではないですが、モデルの1つの形と考えてもよいかもしれません。これらについてもその道のプロや長年培ってきた経験に基づき、人間が導き出すものでもあります。

それに対して、データサイエンスでは、モデルはデータに基づき、統計・機械学習というツールを用いて作られるものです。特に人工知能や機械学習のニュースを聞いている時に、大量データに基づき学習することによって、より精度が上がるようになったというニュースがよく聞こえてきます。この学習こそが、データに基づいてモデルが生まれる瞬間と考えていただければよいかと思います。

データサイエンスは人材不足の救世主になり、勘やコツからの脱却を促す

データサイエンスは、これまでプロなどの公式、勘、コツ、技だと思われたものを、データで取得し、学習することにより、それをモデルとして生成できるのです。これは人材不足、継承者不足の現場においては救世主になる可能性があります。

さらに、これまで人間では導けなかった事象間の関連、効率化の手法などを見つけてくれる可能性が出てきます。これまで人間の勘やコツに頼っていたところから、データに基づいて方針を示してくれる可能性があります。

データサイエンスと他のサイエンスとの違いのもう1つの観点は、ビジネスの現場、実世界をデータの利活用によってサイエンス(科学)できる点です。これまではビジネスの現場、実世界でデータを精緻に取得することが難しかったはずです。その時には、どうしても、人間の勘やコツに頼らなければならず、根拠のない中で意思決定をする必要があったわけです。それに対し、現在ではDXの波もあり、ほぼ全ての分野、フェーズにおいてデジタル化が可能になりつつあります。

デジタル化が進むことにより、その現場の様子を示すようなデータを取得できるようになります。どこに問題があるのか、どう効率化を図っていくべきかをそれらのデータを用いて検討できるわけです。つまり、ビジネスの現場、実世界の事象についてデータを用いて検討することが可能になるわけです。

これまでのサイエンスは、ある分野のある事象に着目して、緻密なデータを取得しながら、モデルを作っていくという形でした。データサイエンスは、あらゆる分野のあらゆる事象を対象にすることができます。先ほど、ビジネスの現場、実世界の事象と述べたため、どうしてもビルの中のオフィスを考えてしまった方もいらっしゃるかもしれませんが、農業の現場、工場の中などあらゆるところにデータサイエンスの力を発揮する場が生まれています。

これらのことから、データサイエンスは今後、さまざまな分野に入り込み、あらゆるモデルを生み出し続けるでしょう。そのモデルが、これまで気づかなかった事実を見出し、効率化や価値創造を実現します。

ここで、重要なことは、データサイエンスを続けるということです。これまでのデータ分析を考えてみると、一度データを集めて分析をしてその結果に基づく施策を実施して終了ということが多かったと思います。これからは、これをサイクルとして回し続けることが重要です。そう考えると、自社の課題を見出し、その課題を観察するためのデータを取得し続け、分析をし続け、さらにその結果を観察し続け、継続的に施策を実施していくということです。これによって、より良いビジネスサイクルを生み出すことができます。

これらのサイクルは、自身・自社の課題を明確にし、その課題の改善をし続けるためのデータを取得するデータエコシステムを実現すること、データ分析をし続け、その結果を真摯に受け止め、早期に意思決定することを着実に進める必要があります。

まず、自身・自社の課題を明確にすることが始めの一歩です。よくあるパターンは、データサイエンス、人工知能(AI)、DXというキーワードに踊らされて、目的もなく導入をしてしまうことです。もちろんこれらを今すぐ導入することは将来の自身・自社のためには重要なこととなりますが、自社・自身の課題に直結しなければ、それは無用の長物となってしまします。

一時期、人工知能の導入のPoC(Proof of Concept)、つまり人工知能技術導入における新しい概念やアイデアの実証を目的とした試作開発前における検証を頻繁に行われるケースが多くみられました。その中でPoC疲れ、PoC死とよばれる、概念実証まではうまくいくが、その後のビジネス活用、ビジネス化がうまくいかないというケースも多くみられて問題となりました。データサイエンス、人工知能(AI)、DXは、非常に大きな力を持っていますが、何事にもうまくいくものではなく、自身・自社の課題にうまく適用させていくことが成功の秘訣となります。

このように考えていけば、皆さんがサイエンス(科学)と聞いて想像するものが、そのままデータサイエンスでもあるといってもよいかと思います。サイエンス(科学)では最初に仮説を立てて検証を行って、結果を導くわけです。仮説を立てるというのが自身・自社の課題を明確にするということとつながります。自身・自社の課題をデータに基づき解決していく、それが、DX(デジタル化)によって実現できるようになったからこそ、データサイエンスがビジネスを科学できるようになったわけです。

ここまで、データサイエンスのエッセンスをお伝えしたわけですが、自身・自社の課題を明らかにし、そこにデータサイエンスを適用することによってデータサイエンスは、自身・自社のビジネスをこれまで判明していなかった事実を解明する科学として、寄与していきます。それを考えるとデータサイエンスを早期に導入した現場とそうではない現場とでは全く差が開いてしまうことがお分かりになりますでしょうか。

データサイエンスと聞いて、われわれの業界では関係ないと思われた方もいらっしゃるかもしれませんが、それは大きな間違いであり、どういう分野・業界であっても、何らかの形で、自身・自社の課題を解決するためのソリューションとしてデータサイエンスがあると認識していただくことが、重要であると考えます。

データサイエンスで自身・自社のビジネスを科学してみませんか。

【関連リンク】
連載:中西崇文「AI最前線」
> スモールデータでデータ活用を始めてみよう–武蔵野大学データサイエンス学部の中西准教授

誰でも簡単に
「社内外のデータ収集」と
「非構造化データの構造化」で
データを資産化

AirLakeは、データ活用の機会と効果を拡張する
ノーコードクラウドデータプラットフォームです。            

中西 崇文
武蔵野大学 データサイエンス学部データサイエンス学科長 准教授ほか。1978年、三重県伊勢市生まれ。筑波大学大学院システム情報工学研究科にて博士(工学)の学位取得。経済産業省 「流通・物流分野における情報の利活用に関する研究会」委員、総務省「ICTインテリジェント化影響評価検討会議」構成員。専門はデータマイニング、感性情報処理など。著書に『Pythonハンズオンによるはじめての線形代数』(森北出版)がある。
1