|
テキストマイニングとは、文章データをさまざまな観点から分析し、役に立つ知識・情報を取り出そうという技術です。同じ目的をもつ研究にデータマイニング
がありますが、データマイニングで扱うデータはデータベース・スキーマによってきれいに整理されている(定型データ)という前提がありました。それに対しテキストマイニ
ングでは、形式化されていないテキスト(非定型データ)からのマイニング(知識・情報を見つけ出すこと)を目的としています。
一般にテキストマイニングというと文書の検索を目的にしたものが多く見られます。しかし、我々はある特定の情報を持つ文書の検索を行うのではなく、膨大な
文書の中に記述されている 内容の傾向や相関関係などを分析することで、既存の知識ではない有用な知識・情報を得ることを目的としています。
本プロジェクトでは、コールセンターのログから営業戦略の立案などに有用な情報をマイニングするといったCRM向けのソリューションと、
膨大な医療文献から新たな知見の発見を支援するライフサイエンス向けのソリューションを開発しています。
また、近年は、ブログなどに書かれたメッセージに含まれる口コミ情報も企業の活動にとっては重要な情報源となりつつあります。このようなタイプのテキストに書かれている評判情報を抽出し、マーケティングなどでの応用を目指した研究開発も行っています。
|