DataRobot導入事例「中外製薬株式会社」(後編)~成功の鍵はチームアップとNSSOLデータサイエンティストの活用~

DataRobot導入事例「中外製薬株式会社」(後編)~成功の鍵はチームアップとNSSOLデータサイエンティストの活用~

営業系領域を中心に機械学習自動化プラットフォームDataRobotを導入した中外製薬。PoC成功の鍵は両社によるチームアップだった。チームアップにおいてNSSOLコンサルタントによる支援に対する評価はどうだったのか。

中外製薬の岡村氏(情報システム部 ITプロフェッショナル 副部長)、石部氏(オンコロジー製品政策部 第1グループ プロダクトマネージャー)に話を聞いた。

聞き手

狩野 慎一郎 狩野 慎一郎(かのう しんいちろう)
日鉄ソリューションズ株式会社
ITインフラソリューション事業本部
デジタルプラットフォーム営業部
デジタルイノベーション営業推進グループ
徐 慧娟 徐 慧娟(じょ けいけん)
日鉄ソリューションズ株式会社
ソリューション企画・コンサルティングセンター

DataRobotは得体が知れない?予測精度と説明性のバランスを取ることが重要。

中外製薬 岡村
DataRobotを触ったことのある当社のデータサイエンティストの中には、得体が知れない、いつも同じモデルが出るわけじゃないし気味が悪い、という感想を持った者もいました。別のモデリングツールでは入れるデータが同じなら毎回同じモデルになる。だから信頼性抜群だ。DataRobotはそうではない、という意見です。DataRobotは投入するデータの並び順が変わるだけで異なるモデルが選択されることもありますよね。グレーボックス化(※1)で説明性を担保しているDataRobotですが、精度は高いけれども気味が悪い、と感じる者もいるようです。

※1 グレーボックス化:機械学習モデルの見える化のことをDataRobotではグレーボックス化と呼ぶ。

岡村氏

岡村 慎吾(おかむら しんご)氏 中外製薬株式会社
情報システム部 ITプロフェッショナル
副部長 

中外製薬 石部
実は「施設別の製品売上予測」の予測結果を現場にフィードバックした際、ある部長から「説明されても分からない。祈祷師のようだ。せめて気象予報士みたいになってほしい」と言われた事があります。どんなに精緻な予測モデルであっても、現場に理解してもらい、実際に業務に適用してもらう事は難しい事であると痛感しました。

石部氏

石部 竜大(いしべ りょうた)氏 中外製薬株式会社
オンコロジー製品政策部 第1グループ
プロダクトマネージャー

NSSOL 徐
説明性と予測精度はバランスをとる必要がありますね。説明性を重視するなら、たとえ精度が高くても複雑なモデルは少し使いづらい。シンプルなモデルの方が説明性は高くなります。一方でアンサンブルのように複雑なモデルは高い精度と引き換えに説明性が若干落ちます。

中外製薬 岡村
徐さんのサポートもあって予測の精度が上がった、上がったけれど理由がわからない、私はそれでもいいと思います。DataRobotなら効いている変数がどれかというインサイトを得られますよね。それを見て手馴れているRでもPythonでもモデリングツールでも使って自分が納得するモデルを書けばいいんですよ。

「本当にこの変数が効いているのか?」という疑問を持ったのならシンプルなプログラムを自分で書いて検証するといいと思います。得体が知れないとか、同じモデルが毎回安定して出てこないとか、そういった理由で使わないのはもったいないことです。

NSSOL 狩野
モデルをそのまま信じて使っている業務もあれば、DataRobotにデータを入れてみて、どんなモデルが選ばれるのか、という一次スクリーニングに使っている業務もある、という製造業のお客様もいらっしゃいます。一次スクリーニングに利用するケースでは、このアルゴリズムがいけそうだ、となったら自分たちでモデリングして完全なホワイトボックスモデルを作っているそうです。

中外製薬 岡村
データサイエンティストが自分でプログラミングして分析して、この変数が効いているな、というところまでモデルを作り込むには少なくとも1週間、2週間、長ければ数か月かかることもある。それが数日でできるようなツールがあるなら使う方がいい。

DataRobotの予測精度と説明性NSSOL 徐
人間は1回に1つのモデルしか作れませんから、探索する初期段階にすごく時間がかかりますが、DataRobotならここを自動化できます。また人間の場合は使いこなせるアルゴリズムが人によって違うので偏りも出てしまう。XGBoostが好き、ランダムフォレストが好き、という好みがあると好きなものを使いがちにもなります。データに合うモデルはこれです。と、一切の先入観なく精度だけで並べて出してくれるのもDataRobotのいいところです。

中外製薬 石部
公平ですよね。全部のアルゴリズムを試してみて、精度が一番いいのはこれです、2番目はこれです、と比較できるように出してくれる。人がやる場合だと最初の1ヵ月は自分が得意なXGBoostを必ず使うみたいなことにもなりかねない。その人の得意技が優先されるのもよくないですよね。

チームとしての一体感を作り出す鍵は”心理的安全性”

NSSOL 狩野
NSSOLコンサルタントによる支援の評価はいかがでしょうか。印象に残った対応などあれば教えてください。

中外製薬 石部
営業系のPoCでデータサンプルをどうやって補うか、という課題に代表されるテクニカルな支援にはとても助けられたと思っていますが、特に感じたのはチームとしての一体感です。社内か社外かは関係ないし区別もない、という感覚がありました。NSSOLさんはよく「共創」ということをおっしゃっていますが、まさにその感覚、一体感がありました。専門性のあるデータを作る人、私のようにアイデアを出す人、徐さんのように専門的なデータサイエンティストの3者が同じテーブルで密に議論することは今までの業務ではなかったことです。

DataRobotを通した共創

中外製薬 岡村
石部さんが話す営業系の言葉で分からない用語があると徐さんは素直に聞いてくれる。そして一回聞けば自分のものにして会話の中で普通に使ってくる。業務ドメインのベーシックなところを質問するのは恥ずかしいと感じる人も多い。でも徐さんは普通に聞いてくれて、その後はディスカッションのツールとして使いこなす。だから勝負が早いんですよ。2回、3回とディスカッションを繰り返すたびに勝負が早くなる。こちらを理解しようとする姿勢があるから私たちも信頼します。

中外製薬 石部
こちら側を理解しようと思ってくれるから、ここまでの一体感や共創の感覚が出たんでしょうね。徐さんが私たちを理解しようとしてくれて、私たちも徐さんやNSSOLさんを理解しようとするから良いチームになっているんだと感じます。「よくわからないけど、あの人が言ったから」「自分は知らないし、知るつもりもないけど、専門家が言ったから」、こういう姿勢があると危ないです。

NSSOL 徐
私は心理的安全性がすごく大事だと思っています。無知は恥ずかしいことではありません。自分はドメイン知識を持っていない代わりに機械学習の知見がある。逆に中外製薬様には機械学習の知見がなくともドメイン知識があります。平等な立場で教え合うことによって互いの壁を無くし、まず心理的安全性を作る、というところから始めるのが私のコンサルティングです。コンサルタントはお客様に対して優位に立っている、という話もよくありますが私はそうは思いません。私たちとお客様の目標は同じです。

チーム作りには心理的安全性が大事

DataRobotはデータサイエンスの裾野を広げるツールとして社内に広めたい

NSSOL 狩野
私自身、多くのお客様に訪問する中で、データサイエンティストではない方でもAIや機械学習を利用できるようにしていこう、という「AIの民主化」の機運を感じています。今まさに営業系で使っていただいていますが、こんなところにも導入できるのでは、など今後の展望はいかがでしょうか。

中外製薬 岡村
研究開発領域などトップレベルでのデータ利活用については、当社のデータサイエンティストが外部のAIコンサル会社と組んでやっていくでしょう。それとは別に、データサイエンティストとまではいかないがデータ分析の経験はある、という人たちがもっとデータを利活用できるよう、DataRobotを使ってもらいたいと考えています。拡大PoC(※2)はこのための取り組みです。

※2 拡大PoC:導入前のPoC(概念実証)ではなく、正式導入後の社内利用者拡大を目的としたPoC


DataRobotをもっと広く使ってほしい

中外製薬はサイエンスの会社です。営業職も学術論文や薬の効果に関する資料を読むことができる。つまりデータに強い、数字に強い人が色々な部署にいるということです。そういう人たちがDataRobotにもっと食いつくようにしたい。広く使ってもらうツールとして用意するDataRobotでデータサイエンスの経験を積んでもらい、もっとやりたい人には専門的な教育を受けられるようにする計画が検討されています。

中外製薬 石部
DataRobotは応用範囲の広い製品だと思っています。営業業務の中だけでも、マーケティング、在庫管理、備品管理、人材教育など幅広く可能性がある。問題意識があってデータがあるなら使うことができます。

NSSOL 狩野
これからもDataRobotの活用シーンが広がりそうですね。

中外製薬 石部
今後はいろんな意味でコラボレーションが重要と思っています。方向性として大きく3つあり、①データセット作成を分担する、②外部のデータも含めて新しく組み合わせる、③データを新しく取りに行く、です。

社内の別部門同士でデータを組み合わせるようなものはもちろんですが、社外とのコラボレーションもはじめています。

マーケットリサーチの会社さんがDataRobotを最近導入したようですが、我々の取り組みを聞きつけてコラボできないかディスカッションを始めています。そこが持っているデータと当社にある営業のデータを突き合わせたらどうかなど、既に3,4件のアイデアが出ていて進み始めていますよ。自分たちのデータだけでも広がりがありますが、次の段階として外部とコラボレーションするとまた違うアウトプットを出せます。今後はコラボが増えていくのでしょうね。

データの取得方法を変えることでDataRobotはさらに活用できる

中外製薬 石部
DataRobotの利用を始めると、データが無くて先に進めない、ということが起こります。そこで「DataRobotでこんなことができるなら、こんなデータがほしいよね、じゃあ集めよう」という流れが出てきました。たとえば営業日報データの利活用がそうです。ベタ打ちのテキストはデータとして扱いづらいので、カテゴリ分けして5段評価にしたり、データの取得形式を変えてみたりしています。

中外製薬 岡村
PoCで成果の出なかったテーマがあるのですが、原因の一つはローデータが無かったことです。集計して平均をとったような丸めたデータや、1時間単位にまとめてしまったデータしか無かった。データ量が増えると大変だ、数十GB単位のデータなんてとんでもない、という時代も過去にはありました。

しかし今後はそういう考えを変えなければいけません。粒度を細かくして取れるならそのまま残す、わざわざプログラムを入れて粒度を落とすことはせず、生のデータを残していくというアプローチが必要だと感じました。

生のデータを残していくというアプローチが必要

NSSOL 狩野
最後に一言お願います。

中外製薬 石部
AIというと何かすごいツールが”やってくるもの”と思いがちですが、自分たちで”つくるもの”と思います。何が必要か?はどんなすごいデータサイエンティストにもわかりません。答えは自分の中にしかないので。意外と自分に何が必要かわかっていないことも多いのではないでしょうか?なので、「自分たち」でつくらないといけない。ただ、自分たち「だけ」では絶対にできません。この感覚をもって行動できるかどうか、が成功と失敗の分岐点なのではと思います。

中外製薬 岡村
改めて、データサイエンティストの徐さんに感謝しています。DataRobot自体に詳しいだけでなく、データサイエンス全般について深い知見を持ち、我々の業務についてもよく吸収してついてきてくれた。間違いなく彼女が、今回のプロジェクト成功の大きな一因です。

中外製薬株式会社
中外製薬株式会社
本 社:
東京都中央区日本橋室町2-1-1
設 立:
1943年
資本金:
732億200万円(2018年12月31日現在)
営業収益:
5,797億8700万円(2018年12月31日現在)
本 社:
従業員数:7,432人(2018年12月31日現在)

※記事内容は掲載当時のものとなっております。

DataRobotに関するお問い合わせ