機械学習
機械学習(Machine Learning)とは、大規模データから反復的に学習し、共通しているパターン(特徴量、特徴ベクトル)をみつけ、その学習したパターンを新たなデータに当てはめて将来を予測することである。予測に有用なパターンをみつけることはデータマイニングであり、機械学習で作成された学習器を用いて分類・回帰することはパターン認識ともいい、それぞれの手法が類似している場合が多い(図1)。さまざまな分野で応用され、画像・音声・文字認識、検索エンジンや翻訳、レコメンドシステム、医療診断、スパムメール検出など異常検知、株価予測、DNA配列の分類、将棋や囲碁のゲーム戦略など多岐にわたる。
また、第3次AIブームの到来により、機械学習はAI(人工知能)と併用されることが多いが、これは人間が行う一定の範囲での作業の補助や代替となる“弱いAI”を指している。機械学習の1つであるDeep Learning(深層学習)によって高精度の分類・回帰を行い、あらゆる分野で作業の自動化を実現している。一方、“強いAI”は人間と同じように認識・理解し、自ら考え意思決定するような自律型のロボットを指し、まだまだ研究段階である。
機械学習で使用される各手法は、教師付き学習・教師なし学習・半教師付き学習に大別される。教師付き学習では、データとラベルの対応がある学習データから共通パターンを探索・抽出する。一方、教師なし学習は、データとラベルの対応がない学習データから共通パターンを探索・抽出する。この両方を含む学習データを使用する場合は,半教師付き学習となる。
さらに、学習アルゴリズムが類似している手法でも分類することができ,機械学習としてよく使用される手法は以下の通りである。
<主な手法>
- CART
- CHAID
クラスタリング
・k-平均
・ファジィ
・自己組織化マップ
・ナイーブベイズ
・ベイジアンネットワーク
・サポートベクターマシン
・アプリオリ(アソシエーション分析,マーケットバスケット分析)
・パーセプトロン
・Deep Learning
・ブースティング
・バギング
・ランダムフォレスト