AI/機械学習とは?
あらゆる企業でAIに対する関心が高まっていますが、AIそのものは決して新しいテーマではありません。1950年代から1970年代にかけて起きた第1次ブーム、1980年代の第2次ブームなど、過去にも何度か世界的な盛り上がりがありました。
しかし「人間の専門家が持つ知識をルール化し、機械(コンピューター)に教え込む」というアプローチを追求してきたものの、人間の知識構造はあまりにも複雑で、思うようにルールに落とし込むことができず、本格的な実用化には至りませんでした。
そこにブレークスルーをもたらしたのが“機械学習”の技術です。人間の脳を構成するニューロン(神経細胞)を模したモデルをコンピューター上に実装して推論を実行するもので、与えられたデータから自律的に知識を獲得することができます。現在のAIブームは、この機械学習の技術が身近になったことで巻き起こったものなのです。
機械学習とは
機械学習は、大量のデータをコンピューターに投入して学習することで、分類や予測などを行うモデルを作成する技術であり、現在のAIの中核となっています。なお、機械学習の中にも教師あり機械学習、教師なし機械学習、強化学習、深層学習(Deep Learning)など、さまざまなタイプが存在します。
機械学習は、データの特徴をコンピューターが学ぶ仕組み
横にスクロールできます
種類 | 説明 | 使用例 | 注意点 |
---|---|---|---|
教師あり機械学習 | 教師データ(過去の事例から人間が作った答えのデータ)を使って、コンピューターが将来を予測するモデルを構築 | プロモーション効果予測、需要予測、画像認識、レコメンデーション等 | 正解データが必要 |
教師なし機械学習 | データの特徴量を使って、何らかの基準でコンピューターが分類する。答えを人間が教える必要はない。 | クラスタリング、異常検知、トピック分類 | 結果の解釈が難しい |
強化学習 | 環境を観察してデータを取得し、決められた報酬を最大化するような取るべき行動を決定する手法 | ゲーム、ロボットの歩行 | ルールがはっきりしてないとダメ |
深層学習(Deep Learning) | 多層のニューラルネットによる機械学習手法 人手による特徴量の抽出が不要 |
画像認識、翻訳 | 大量の正解データが必要 |
DataRobotの得意領域
数ある機械学習の方式の中で、最もスタンダードで実用性が高いのが「教師あり機械学習」です。適切なデータを教師データとして用いることで出力精度を高めることができ、対象物の識別や回帰といったタスクで活用されています。
教師あり機械学習
- 教師データ(正解データ)が必要
問題の種類
- 多値分類問題(Yes/Noを当てる、分類する)
- 回帰問題(数値を当てる)
モデル作成手法の違い
機械学習を導入する上で最も考慮しなければならないのがモデル作成の手法です。プログラミングやGUIによるドラッグ&ドロップツールを用いた手動または半自動のモデル設計は自由度が高い反面で高度な専門知識と時間を要し、予測精度もデータサイエンティストの力量に依存します。
これに対して自動化を追求した全自動モデル作成では、作成者が特定のアルゴリズムをいつどのように適用すべきかといった専門知識を理解したりする必要はありません。モデル作成のリードタイムを大幅に短縮します。DataRobotは機械学習のモデル作成からデプロイまで自動化できるプラットフォームであり、組織全体でのAI活用の民主化を実現します。
横にスクロールできます
自動化レベル | 手動 | 半自動 | 自動 |
---|---|---|---|
手法 | プログラミング | GUI、D&Dによるモデル設計 | 全自動 |
アルゴリズム選択 | 人が選ぶ ※計算機科学の知識・経験が必要 | 人が選ぶ ※計算機科学の知識・経験が必要 | 計算機科学の知識・経験は必要ない |
モデルのコーディング | 必要 | 不要 | 不要 |
モデルのパラメーターチューニング | 手動 | 自動 | 自動 |
モデルの実運用 | 手作業で再コーディング、再テストが必要 | ワンクリックでデプロイ、自動化できる製品もあり | ワンクリックでデプロイ、すぐ運用可能 |
モデル作成工数 | 数日~数か月 | 数日~ | 数時間(ボタンを押すだけ) |
モデル精度 | 作成者に強く依存 | 作成者に依存 | 誰でも高精度 |
製品イメージ | R,Python | Azure MLなど | DataRobot |