IBM®
本文へジャンプ
    Japan [変更]    ご利用条件
 
 
 
    ホーム    製品    サービス & ソリューション    サポート & ダウンロード    マイアカウント    
IBM Research

鹿島 久嗣 (Hisashi Kashima)

Go To English Page

顔写真(ミラネーゼ宅ピンポンダッシュの図)

経歴

  • 1997年3月: 京都大学工学部数理工学科卒業
  • 1999年3月: 京都大学工学研究科応用システム科学専攻博士前期課程修了(修士)
  • 1999年4月〜: IBM東京基礎研究所
  • 2007年3月: 京都大学情報学研究科知能情報学専攻博士後期課程修了(博士(情報学))

研究テーマ

人工知能の一分野である, 機械学習に興味をもっています.
機械学習とは, コンピュータが, 過去のデータをもとにして, 未知のデータに対する予測を行うことのできるルールを獲得できるようにするための手法を研究する分野です.
私は, 機械学習アルゴリズムが従来うまく扱えなかったタイプのデータや, 従来目的としてこなかったタイプの問題をうまく, また, 効率的に扱えるように拡張する研究を行っています.
また, 実際の問題を学習問題として定式化し, これを解決するようなシステムの開発にも興味をもっています.

  • 機械学習アルゴリズムの設計と解析
    • 構造をもつデータを対象とした学習を行うアルゴリズム
      • 従来, 機械学習アルゴリズムは, 扱うことのできるデータの形式はベクトル形式, すなわち(身長=155cm, 体重=47kg, 性別=女)などのように一定数の項目がきれいに並んでいるようなデータ形式を仮定してきました. しかしながら, 近年これらの枠では捉えられないデータが増加しています. 例えば, テキストデータやDNAなどは, 文字が並んだ配列構造データとして, この文書のようなHTMLデータは木構造データとして, また, 化合物やWWWの構造などはグラフ構造データとして表現されますが, 従来の機械学習アルゴリズムはこのような, いわゆる「構造」をもったようなデータをそのまま扱えるようには設計されていませんでした.
      • 機械学習アルゴリズムが, 構造を持ったデータを扱うことができるようにする研究は現在非常に活発に行われています. 代表的なアプローチとしては, 構造パターンマイニングやカーネル法といった手法があげられます. カーネル法では, データ同士の類似度として, 高次元の特徴空間における内積として表現されるカーネル関数と呼ばれる関数を定義する必要があります. 構造をもったデータに対するカーネル関数の設計指針としては, 畳み込みカーネルと呼ばれる便利な枠組みがあります. 私は, 構造データの構造の特徴をうまく捉え, かつ, 効率的に計算できる具体的なカーネル関数の設計を行っています. これまでに, グラフカーネルや, 順序木カーネルといったカーネル関数の提案を行っています.
      • また, 近年では入力だけでなく出力にも構造があるような問題, すなわち, 構造データから構造データへのマッピングを学習するような問題が活発に研究されています. 構造のマッピング問題では, 構造の特徴を捉えるだけでなく, 出力として出すべき構造を生成するところまで考える必要があります. 私は, この問題に対して, 畳み込みカーネルを適用できるような手法の提案や, 構造マッピング問題の1つとして考えられるテキストからの情報抽出に適した目的関数の提案などを行っています.
    • コスト考慮型の学習を行うアルゴリズム
      • 従来, 機械学習アルゴリズムは, 予測が正解する確率を高めること, いいかえれば, 予測が誤りである確率を小さくすることを目指して改良されてきました. しかしながら, 世の中には単に正解と誤りの2種類の基準だけでは済まされない問題も数多くあります. 例えば, 診断の問題を考えてみましょう. 健康な人を誤って病気であると診断してしまうと, ムダな時間や治療といったコストがかかります. しかし, 逆に病気である人を誤って健康であると診断してしまうと, 場合によってはより深刻な結果をもたらすことになりかねません. 当然のことながら, それぞれの誤りがどの程度深刻であるかは誤りの種類や人によって異なってくるでしょう. 従来の機械学習アルゴリズムでは, どんな種類の誤りでもそれは「1回の誤り」として考えられてきました. このような, 「予測がどのくらい悪いか」という程度を「コスト」としてあらわし, 誤り率ではなく, 誤りコストを小さくするように学習を行うような枠組みは「コスト考慮型学習 (Cost-Sensitive Learning)」として近年研究が行われています.
      • コスト考慮型学習では, 通常, 平均コストが小さくなるように分類器を学習するという戦略をとります. この戦略は確かに平均的にはよい性能を期待できそうです. しかしながら, 例えば, 医療などでは、1件の重大な医療ミスが非常に大きな社会的インパクトを持ちえます. あるいは, 資金をどこに投資するべきかを決定するような問題の場合, 大きな失敗が何度か連続して起きるということは, 破産のリスクに直結する恐れがあります. このように, 起こる確率は小さいが, 時に許容できないほど大きなコスト大きなコストが発生してしまう可能性があり, また, その発生が致命的になるような場合に, 平均コストを最小化するというのは必ずしもよい方法とはいえません. 私は, 巨大なコストが発生するリスクをできるだけ回避しようとするという, リスクマネジメント的な立場からのコスト考慮型学習を「リスク回避型学習 (Risk-Sensitive Learning)」とよび, この問題に対する効果的で効率的な解法の提案を行っています.
    • 最適化
      • とくに機械学習に付随して起こる最適化問題を効率よく解くための最適化アルゴリズム
  • 機械学習の応用
    • バイオインフォマティクス
    • 自然言語処理
    • コンピューターシステムの障害検知/解析
    • マーケティング・金融工学・経営工学


受賞

  • 2007/10: 優勝(と3位), IEEE Data Mining Contest 2007 (winner in Task 1 and second-runner up in Task 2)
  • 2007/6: 人工知能学会論文賞(JSAI Best Paper Award)
  • 2004/6 人工知能学会2003年度研究会(知識ベースシステム研究会, SIG-KBS)優秀賞

論文等の出版

ジャーナル論文

  • Hisashi Kashima, Shoko Suzuki, Shohei Hido, Yuta Tsuboi, Toshihiro Takahashi, Tsuyoshi Ide, Rikiya Takahashi and Akira Tajima: A Semisupervised Approach Using Spatio-temporal Information for Indoor Location Estimation, In Qiang Yang, Sinno Jialin Pan and Vincent Wenchen Zheng, Estimating Location Using Wi-Fi, IEEE Intelligent Systems, vol. 23, no. 1, pp. 8-13, Jan/Feb, 2008.
  • Shoko Suzuki, Yuta Tsuboi, Hisashi Kashima, Shohei Hido, Toshihiro Takahashi, Tsuyoshi Ide, Rikiya Takahashi and Akira Tajima: A Dimensionality Reduction Approach, In Qiang Yang, Sinno Jialin Pan and Vincent Wenchen Zheng, Estimating Location Using Wi-Fi, IEEE Intelligent Systems, vol. 23, no. 1, pp. 8-13, Jan/Feb, 2008.
  • Hisashi Kashima: Risk-sensitive Learning via Minimization of Empirical Conditional Value-at-risk, IEICE Transaction on Information and Systems, Vol. E90-D, No. 12, pp. 2043-2052, 2007.
  • Tetsuji Kuboyama, Hisashi Kashima, Kiyoko F. Aoki-Kinoshita, Kouichi Hirata, Hiroshi Yasuda: A Spectrum Tree Kernel, 人工知能学会論文誌, Vol. 22, No. 2, 2007.
  • 鹿島 久嗣, 安倍 直樹: ネットワーク構造の確率的な時変モデルに基づく教師ありリンク予測, 人工知能学会論文誌, Vol.22, No.2, 2007.
  • 鹿島 久嗣, 坂本 比呂志, 小柳 光生: 木構造データに対するカーネル関数の設計と解析, 人工知能学会論文誌, Vol.21, No.1, 2006.
  • (人工知能学会論文賞)
  • 鹿島 久嗣, 津村 直史, 井手 剛, 野ヶ山 尊秀, 平出 涼, 江藤 博明, 福田 剛志: ネットワークデータを用いた分散システムにおける異常検出, 電子情報通信学会論文誌, Vol. J89-D, No. 2, 2006.
  • Tetsuo Shibuya, Hisashi Kashima and Akihiko Konagaya: Efficient Filtering Methods for Clustering cDNAs with Spliced Sequence Alignment, Bioinformatics, 2004.
  • Takanori Fukao, Hisashi Kashima and Norihiko Adachi: Decentralized Adaptive Control with Improved Transient Performance, 計測自動制御学会論文集, Vol.35, No.7, pp. 869-878, 1999

本/解説/翻訳

  • 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇(監訳), Christopher M. Bishop(著): パターン認識と機械学習 - ベイズ理論による統計的予測 (上)(下) (原題: Pattern Recognition and Machine Learning), シュプリンガー・ジャパン, 2007-2008. (鹿島は6章および付録Cの翻訳を担当)
  • 山名 早人(監訳), 石川 隼輔, 堀井 洋, 村上 明子, 鹿島 久嗣, 小柳 光生(訳), Rael Dornfest, Paul Bausch, Tara Calishain(著): Google Hacks 第3版 プロが使うテクニック & ツール 100選, O'Reilly Japan, 2007.
  • 鹿島 久嗣: ネットワーク構造予測, 人工知能学会論文誌, Vol.22, No.3, 2007.
  • Jim Spohrer, Paul P. Maglio, Jeffrey T. Kreulen, Savitha Srinivasan(著), 恐神 貴行, 鹿島 久嗣, 加納 真, 水田 秀行(訳): Becoming a Service Scientist, 情報処理, Vol.47, No.5, pp. 461-466, 2006.
  • 鹿島 久嗣: 構造データマイニングの手法とバイオインフォマティクスへの応用, ソフトウェア・バイオロジー, 化学工学会, 2006.
  • 山名 早人(監訳), 石川 隼輔, 堀井 洋, 村上 明子, 鹿島 久嗣, 小柳 光生(訳), Tara Calishain, Rael Dornfest(著): Google Hacks 第2版 プロが使うテクニック & ツール 100選, O'Reilly Japan, 2005
  • カーネル法による構造データの解析, 電子情報通信学会技術研究報告 言語理解とコミュニケーション/パターン認識・メディア理解, 2005
  • 鹿島: カーネル法による構造データマイニング, 情報処理, Vol. 46, No. 1, 2005
  • 鈴木, 鹿島: 特集「最新!データマイニング手法」, 情報処理, Vol. 46, No. 1, 2005
  • H. Kashima , K. Tsuda and A. Inokuchi: Kernels for Graphs, Kernel Methods in Computational Biology, MIT Press, 2004

国際会議/ワークショップ論文

国内の会議/研究会論文

セミナー等での講演

その他の記事/報告

  • Yuta Tsuboi and Hisashi Kashima, A New Loss Function with Markov Property" for Information Extraction, IBM Research Report, RT0660, 2006.
  • 鹿島 久嗣: The 21st International Conference on Machine Learning (ICML) 2004 参加報告, 人工知能学会誌, Vol. 20, No. 1, 2005
  • 瀧本 英二, 鹿島 久嗣, 黒木 学: Banff (COLT, ICML, UAI) 参加報告, 電子情報通信学会 情報・システムソサイエティ誌, Vol. 9, No. 3, 2004
  

    日本IBMについてプライバシーお問い合わせ