■データマイニングとは?
データマイニング(DM: Data Mining)という言葉を最近どこかで耳にした方は多いのではないでしょうか. 一言で言えば“データから規則等の有益な情報を見つけだすこと”ですが,いつ頃から使われ始めたのでしょうか.
1991年に開かれた“データベースからの知識発見(KDD: Knowledge Discovery in Database)に関するワークショップ”が現在のブーム?の火付け役だったようです.
しかし,1977年には既にTukeyがExploratory data analysisという似たような言葉を既に使っていますし,品質管理の常道である“データから入れ”,“データでものを言え”そのもののような気もします.
いったい何が新しいのでしょうか.実際,火元であるデータベースや人工知能の分野でも,この概念に対する認識のレベル差は大きく統一もとれていないようですが,少し聞きかじった事を以下に羅列してみます.
■統計解析とどこが違うの?
データマイニングで扱うデータについて,その研究者らは以下の特徴を挙げています. 1)データの量:大規模データベース,例えばPOSデータは数百万,数千万のオーダである.
2)データの質:データはバイアスがかかって採られ,ランダムサンプルでない.信頼性も低いことが多い. 3)データの種類:カテゴリーデータが多い.
情報ネットワークの発達で,“データを集めたのでなく,多量に集まって来ちゃったのだから,どうにかしてよ”と言うことでしょうか.
“データ先ありき”は,QCの現場でもよくありそうなことで,具体的にどう解析するのかちょっと興味がわきますね.
■どうやってデータから知識を発見するの?
まず,多量のデータ,例えばPOSデータに対して抽出されている知識は相関ルールと呼ばれています. 相関ルールは簡単に言ってしまえば,どの商品群が同時に買われたかということで,同時確率や条件付き確率の高い商品の組み合わせを表示するにすぎません.
えっ!そんな事しかしてないの?と言われるかもしれませんが,この分野の研究者の代弁をさせていただくと,非常に規模の大きいデータで出現確率の高いものを選択するだけでも大変な計算量になるのです.
狭い意味のデータマイニングの研究は実はこの相関ルール計算が中心で,Apprioriというアルゴリズムを基本に高速化が検討されています.
カテゴリーデータは,もちろん統計手法でも取り扱えますが,連続値に対する解析法の延長の手法が多く,本来苦手とするデータには違いありません.
これらに対しては機械学習(ML: Machine Learning)のアルゴリズムが用いられます. 例えば,決定木や帰納論理プログラム等の手法が利用されています.
後者の方法は述語論理を基礎としていますので非常に高い表現能力があり,知識を発見したと言うに値する出力も表現可能ですが,現在のところまだアドホックな手法が多く性能が理論的に保証されていません.
統計手法で利用されるのは一般的な多変量解析の他,CART(Classification And Regression Trees)や多重ロジスティック解析,多次元尺度法,クラスタリング法等です.
実は現在発表されているデータマイニングのモジュールは上記の相関ルール計算法,決定木構成法,統計手法等の寄せ集め程度(極端に言ってしまうとSASやSにおまけが付いた程度)です.
なんだか,期待を裏切ってしまったようですね.
■本当に有益な情報を発見できるようになるの?
データから情報を取り出す場合,次の2つのタイプが考えられます. 一つが仮説検証型もう一つは仮説生成型です. 統計解析の多くが前者でありますが,データマイニングは後者をより強く意識しています.
しかし,上で述べたような相関ルールや決定木による層別では無意味なルールが多く出力されるだけで,有益な仮説はなかなか発見されません.
仮説検証でもデータ解析の知識だけでなく,固有技術の知識がなければ良い仮説はたてられません. 本来,データマイニングといってもデータだけから知識を発見することは不可能ではないでしょうか.
固有技術などの背景知識をシステムが持ってこそ,それは可能になるのです. 背景知識を持たせる部分にこそ人工知能の理論が必要となり,人工知能と統計手法の融合が本当のデータマイニングを可能にするのではないでしょうか.
そうなれば,マーケットデータ,アフターサービスのフィールドデータなど情報の宝庫をもっともっと活用できることになるのですが…これからの研究に期待したいですね.
研究を怠らず,さらに研鑚が必要なとき・足元を見つめ直そう
これからも,世界のお客様に喜ばれる商品を造るためには,営業・販売から商品企画へ,そして製品企画から設計へ,さらには生産技術から製造へと,多くの部門(現場)が連携し活き活きと仕事を進めることが大切である.
そのためには,現場だけでなく専務部門や管理部門のマネージャーやスタッフが率先し,既成に捕らわれず仕事を変革してゆくことが大切でありTQM活動の要諦をなす.
それ故,TQM推進部門は自らの足元を見つめ直し,今何が大切かを考え求心力のある行動軌範を示すことが必要である.
■勇気をもって変革しよう
これからも世界に貢献しうる品質管理を進めるためには,全部門のビジネスプロセスの質が高まるように,明快で理に適うTQM活動がさらに必要となってくる.
それには,『製造業のこれからの品質管理』を考え,将来にむけて見通しが明るくなるようにTQM活動の基軸を変革し垂範することが大切である.
先達がそうであったように,志がある仲間とスクラムを組み,勇気をもって一歩一歩着実に高い山にチャレンジすることが肝要である.
■研究を怠らず良い仕事をしよう
トヨタでは,TQM活動の基軸にTPS(Toyota Production System)に加え,新たにTDS(Toyota
Development System),TMS(Toyota Marketing System)を経営技術として位置づけ,これらの基軸を高める実証科学的方法論として,“Science
SQC”を展開している. ここでは,マネージャーとスタッフが協業し問題解決能力を高めて良い仕事ができるように,SQC推進サイクル(実施−成果−教育−人材育成)を廻し実証研究の積み重ねをすることが重要である.
そして,世界の範となる『次世代のTQM』が構築できるように,研究を怠らず楽しく研鑚できるシナリオ化と場づくりをすることがさらに大切になる.
■活き活きとした職場をつくろう
出来ばえの良い商品を提供できることは仕事の成果の証であり,活き活きとした職場が形成できる糧となる. 全部門が目的意識や仕事の価値を共有し,仕事の質が向上してゆく有様は,TQM活動の目指す『製造業のこれからの品質管理』の基盤となる.
今一度足元を見つめ直し姿勢を正し,これからの仕事に役立つように,TQM活動を進めたいと考えている.