|
 (ミラネーゼ宅ピンポンダッシュの図)
経歴
- 1997年3月: 京都大学工学部数理工学科卒業
- 1999年3月: 京都大学工学研究科応用システム科学専攻博士前期課程修了(修士)
- 1999年4月〜: IBM東京基礎研究所
- 2007年3月: 京都大学情報学研究科知能情報学専攻博士後期課程修了(博士(情報学))
研究テーマ
人工知能の一分野である, 機械学習に興味をもっています.
機械学習とは, コンピュータが, 過去のデータをもとにして, 未知のデータに対する予測を行うことのできるルールを獲得できるようにするための手法を研究する分野です. 私は,
機械学習アルゴリズムが従来うまく扱えなかったタイプのデータや, 従来目的としてこなかったタイプの問題をうまく, また,
効率的に扱えるように拡張する研究を行っています.
また, 実際の問題を学習問題として定式化し,
これを解決するようなシステムの開発にも興味をもっています.
- 機械学習アルゴリズムの設計と解析
- 構造をもつデータを対象とした学習を行うアルゴリズム
- 従来, 機械学習アルゴリズムは, 扱うことのできるデータの形式はベクトル形式,
すなわち(身長=155cm, 体重=47kg, 性別=女)などのように一定数の項目がきれいに並んでいるようなデータ形式を仮定してきました.
しかしながら, 近年これらの枠では捉えられないデータが増加しています. 例えば,
テキストデータやDNAなどは, 文字が並んだ配列構造データとして, この文書のようなHTMLデータは木構造データとして,
また, 化合物やWWWの構造などはグラフ構造データとして表現されますが, 従来の機械学習アルゴリズムはこのような,
いわゆる「構造」をもったようなデータをそのまま扱えるようには設計されていませんでした.
- 機械学習アルゴリズムが, 構造を持ったデータを扱うことができるようにする研究は現在非常に活発に行われています.
代表的なアプローチとしては, 構造パターンマイニングやカーネル法といった手法があげられます.
カーネル法では, データ同士の類似度として, 高次元の特徴空間における内積として表現されるカーネル関数と呼ばれる関数を定義する必要があります.
構造をもったデータに対するカーネル関数の設計指針としては, 畳み込みカーネルと呼ばれる便利な枠組みがあります.
私は, 構造データの構造の特徴をうまく捉え, かつ, 効率的に計算できる具体的なカーネル関数の設計を行っています.
これまでに, グラフカーネルや, 順序木カーネルといったカーネル関数の提案を行っています.
- また, 近年では入力だけでなく出力にも構造があるような問題, すなわち, 構造データから構造データへのマッピングを学習するような問題が活発に研究されています.
構造のマッピング問題では, 構造の特徴を捉えるだけでなく, 出力として出すべき構造を生成するところまで考える必要があります.
私は, この問題に対して, 畳み込みカーネルを適用できるような手法の提案や,
構造マッピング問題の1つとして考えられるテキストからの情報抽出に適した目的関数の提案などを行っています.
- コスト考慮型の学習を行うアルゴリズム
- 従来, 機械学習アルゴリズムは, 予測が正解する確率を高めること, いいかえれば, 予測が誤りである確率を小さくすることを目指して改良されてきました. しかしながら, 世の中には単に正解と誤りの2種類の基準だけでは済まされない問題も数多くあります. 例えば, 診断の問題を考えてみましょう. 健康な人を誤って病気であると診断してしまうと, ムダな時間や治療といったコストがかかります. しかし, 逆に病気である人を誤って健康であると診断してしまうと, 場合によってはより深刻な結果をもたらすことになりかねません. 当然のことながら, それぞれの誤りがどの程度深刻であるかは誤りの種類や人によって異なってくるでしょう. 従来の機械学習アルゴリズムでは, どんな種類の誤りでもそれは「1回の誤り」として考えられてきました. このような, 「予測がどのくらい悪いか」という程度を「コスト」としてあらわし, 誤り率ではなく, 誤りコストを小さくするように学習を行うような枠組みは「コスト考慮型学習 (Cost-Sensitive Learning)」として近年研究が行われています.
- コスト考慮型学習では, 通常, 平均コストが小さくなるように分類器を学習するという戦略をとります.
この戦略は確かに平均的にはよい性能を期待できそうです. しかしながら, 例えば,
医療などでは、1件の重大な医療ミスが非常に大きな社会的インパクトを持ちえます.
あるいは, 資金をどこに投資するべきかを決定するような問題の場合, 大きな失敗が何度か連続して起きるということは,
破産のリスクに直結する恐れがあります. このように, 起こる確率は小さいが,
時に許容できないほど大きなコスト大きなコストが発生してしまう可能性があり,
また, その発生が致命的になるような場合に, 平均コストを最小化するというのは必ずしもよい方法とはいえません.
私は, 巨大なコストが発生するリスクをできるだけ回避しようとするという, リスクマネジメント的な立場からのコスト考慮型学習を「リスク回避型学習
(Risk-Sensitive Learning)」とよび, この問題に対する効果的で効率的な解法の提案を行っています.
- 最適化
- とくに機械学習に付随して起こる最適化問題を効率よく解くための最適化アルゴリズム
- 機械学習の応用
- バイオインフォマティクス
- 自然言語処理
- コンピューターシステムの障害検知/解析
- マーケティング・金融工学・経営工学
受賞
論文等の出版
ジャーナル論文
- Hisashi Kashima, Shoko Suzuki, Shohei Hido, Yuta Tsuboi, Toshihiro Takahashi, Tsuyoshi
Ide, Rikiya Takahashi and Akira Tajima: A Semisupervised Approach Using
Spatio-temporal Information for Indoor Location Estimation, In Qiang Yang,
Sinno Jialin Pan and Vincent Wenchen Zheng, Estimating Location Using Wi-Fi, IEEE Intelligent Systems, vol. 23, no. 1, pp. 8-13, Jan/Feb, 2008.
- Shoko Suzuki, Yuta Tsuboi, Hisashi Kashima, Shohei Hido, Toshihiro Takahashi, Tsuyoshi Ide, Rikiya Takahashi and
Akira Tajima: A Dimensionality Reduction Approach, In Qiang Yang, Sinno
Jialin Pan and Vincent Wenchen Zheng, Estimating Location Using Wi-Fi, IEEE Intelligent Systems, vol. 23, no. 1, pp. 8-13, Jan/Feb, 2008.
- Hisashi Kashima: Risk-sensitive Learning via Minimization of Empirical Conditional Value-at-risk, IEICE Transaction on Information and Systems, Vol. E90-D, No. 12, pp.
2043-2052, 2007.
- Tetsuji Kuboyama, Hisashi Kashima, Kiyoko F. Aoki-Kinoshita, Kouichi Hirata, Hiroshi Yasuda: A Spectrum Tree Kernel, 人工知能学会論文誌, Vol. 22, No. 2, 2007.
- 鹿島 久嗣, 安倍 直樹: ネットワーク構造の確率的な時変モデルに基づく教師ありリンク予測, 人工知能学会論文誌, Vol.22, No.2, 2007.
- 鹿島 久嗣, 坂本 比呂志, 小柳 光生: 木構造データに対するカーネル関数の設計と解析, 人工知能学会論文誌, Vol.21, No.1, 2006.
(人工知能学会論文賞)
- 鹿島 久嗣, 津村 直史, 井手 剛, 野ヶ山 尊秀, 平出 涼, 江藤 博明, 福田 剛志: ネットワークデータを用いた分散システムにおける異常検出, 電子情報通信学会論文誌, Vol. J89-D, No. 2, 2006.
- Tetsuo Shibuya, Hisashi Kashima and Akihiko Konagaya: Efficient Filtering Methods for Clustering cDNAs
with Spliced Sequence Alignment, Bioinformatics, 2004.
- Takanori Fukao, Hisashi Kashima and Norihiko Adachi: Decentralized Adaptive Control with Improved Transient
Performance, 計測自動制御学会論文集, Vol.35, No.7, pp. 869-878, 1999
本/解説/翻訳
- 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇(監訳), Christopher M. Bishop(著): パターン認識と機械学習 - ベイズ理論による統計的予測 (上)(下) (原題: Pattern Recognition and Machine Learning), シュプリンガー・ジャパン, 2007-2008. (鹿島は6章および付録Cの翻訳を担当)
- 山名 早人(監訳), 石川 隼輔, 堀井 洋, 村上 明子, 鹿島 久嗣, 小柳 光生(訳), Rael Dornfest, Paul Bausch, Tara Calishain(著): Google Hacks 第3版 プロが使うテクニック & ツール 100選, O'Reilly Japan, 2007.
- 鹿島 久嗣: ネットワーク構造予測, 人工知能学会論文誌, Vol.22, No.3, 2007.
- Jim Spohrer, Paul P. Maglio, Jeffrey T. Kreulen, Savitha Srinivasan(著),
恐神 貴行, 鹿島 久嗣, 加納 真, 水田 秀行(訳): Becoming a Service Scientist, 情報処理, Vol.47,
No.5, pp. 461-466, 2006.
- 鹿島 久嗣: 構造データマイニングの手法とバイオインフォマティクスへの応用, ソフトウェア・バイオロジー, 化学工学会, 2006.
- 山名 早人(監訳), 石川 隼輔, 堀井 洋, 村上 明子, 鹿島 久嗣, 小柳 光生(訳), Tara Calishain, Rael Dornfest(著): Google Hacks 第2版
プロが使うテクニック & ツール 100選, O'Reilly Japan, 2005
- カーネル法による構造データの解析, 電子情報通信学会技術研究報告 言語理解とコミュニケーション/パターン認識・メディア理解, 2005
- 鹿島: カーネル法による構造データマイニング, 情報処理, Vol. 46, No. 1, 2005
- 鈴木, 鹿島: 特集「最新!データマイニング手法」, 情報処理, Vol. 46, No. 1, 2005
- H. Kashima , K. Tsuda and A. Inokuchi: Kernels for Graphs, Kernel Methods in Computational Biology, MIT Press, 2004
国際会議/ワークショップ論文
- Shohei Hido, Tsuyoshi Ide, Hisashi Kashima, Harunobu Kubo and Hirofumi Matsuzawa: Unsupervised change analysis using supervised learning, In Proc. 12th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD2008), 2008.
- Tsuyoshi Kato, Hisashi Kashima and Masashi Sugiyama: Integration of multiple networks for robust label propagation, In Proc. 2008 SIAM International Conference on Data Mining (SDM2008), 2008.
- Shohei Hido and Hisashi Kashima: Roughly balanced bagging for imbalanced data, In Proc. 2008 SIAM International Conference on Data Mining (SDM2008), 2008.
- Yuta Tsuboi, Hisashi Kashima, Shohei Hido, Steffen Bickel and Masashi Sugiyama: Direct density ratio estimation for large-scale covariate shift adaptation, In Proc. 2008 SIAM International Conference on Data Mining (SDM2008), 2008.
- Hisashi Kashima, Shoko Suzuki, Shohei Hido, Yuta Tsuboi, Toshihiro Takahashi, Tsuyoshi Ide, Rikiya Takahashi and Akira Tajima: A Semi-supervised Approach to Indoor Location Estimation, In IEEE ICDM Data Mining Contest, Omaha NE, USA, 2007 (15チーム中 1位)
- Shoko Suzuki, Yuta Tsuboi, Hisashi Kashima, Shohei Hido, Toshihiro Takahashi, Tsuyoshi Ide, Rikiya Takahashi and Akira Tajima: A Semi-supervised Approach to Transferring the Learned Knowledge for Indoor Location Estimation, In IEEE ICDM Data Mining Contest, Omaha NE, USA, 2007 (17チーム中 3位)
- Masashi Sugiyama, Shinichi Nakajima, Hisashi Kashima, Paul von Bunau and Motoaki Kawanabe: Direct Importance Estimation with Model Selection and Its Application to Covariate Shift Adaptation, In Proc. 21st Annual Conference on Neural Information Processing Systems (NIPS2007), Vancouver, B.C., Canada, 2007.
- Tsuyoshi Kato, Hisashi Kashima, Masashi Sugiyama and Kiyoshi Asai: Multi-task Learning via Conic Programming, In Proc. 21st Annual Conference on Neural Information Processing Systems (NIPS2007), Vancouver, B.C., Canada, 2007.
- Tetsuji Kuboyama, Kouichi Hirata, Kiyoko F. Aoki-Kinoshita, Hisashi Kashima and Hiroshi Yasuda: A Gram Distribution Kernel Applied to Glycan Classification and Motif Extraction, In Proc. 17th International Conference on Genome Informatics (GIW2006), Yokohama, Japan, 2006.
- Hisashi Kashima and Naoki Abe: A Parameterized Probabilistic Model of Network Evolution for Supervised Link Prediction, In Proc. 6th IEEE International Conference on Data Mining (ICDM2006), Hong Kong, 2006.
- Tetsuji Kuboyama, Hisashi Kashima, Kiyoko F. Aoki-Kinoshita, Koichi Hirata and Hiroshi Yasuda: A Spectrum Tree Kernel, In Proc. The International Workshop on Data-Mining and Statistical Science (DMSS2006), Sapporo, Japan, 2006.
- Tetsuji Kuboyama, Kilho Shin and Hisashi Kashima: Flexible Tree Kernels Based on Counting the Number of Tree Mappings, In Proc. Workshop on Mining and Learning (held with ECML/PKDD 2006), Berlin, Germany, 2006.
- Hisashi Kashima: Risk-Sensitive Learning via Expected Shortfall Minimization, In Proc. 2006 SIAM Conference on Data Mining (SDM06), Bethesda, Maryland, USA, 2006.
- Hisashi Kashima, Tadashi Tsumura, Tsuyoshi Ide, Takahide Nogayama, Ryo Hirade, Hiroaki Etoh and Takeshi Fukuda: Network-Based Problem Detection for Distributed Systems, In Proc. 21st International Conference on Data Engineering (ICDE2005), Tokyo, Japan, 2005
- Tsuyoshi Ide and Hisashi Kashima: Eigenspace-based Anomaly Detection in Computer Systems, In Proc. 10th ACM SIGKDD Conference (KDD2004), Seattle, WA, USA, 2004
- Hisashi Kashima and Yuta Tsuboi: Kernel-Based Discriminative Learning Algorithms for Labeling Sequences,
Trees and Graphs, In Proc. 21st International Conference on Machine Learning (ICML2004), Banff, Alberta, Canada, 2004
- Makoto Kano, Hisashi Kashima,Tetsuo Shibuya, Kaori Ide, Aiko Kashihara, Noriko Nakagawa, Mariko Hatakeyama, Seiki Kuramitsu and Akihiko Konagaya: A Method for Normalization of Gene Expression Data, In Proc. Genome Informatics Workshop (GIW2003), Yokohama, Japan, 2003
- Akihiro Inokuchi and Hisashi Kashima: Mining Significant Pairs of Patterns from Graph Structures with Class Labels, In Proc. 3rd IEEE International Conference on Data Mining (ICDM2003), Melbourne, Florida, USA, 2003
- Hisashi Kashima, Koji Tsuda and Akihiro Inokuchi: Marginalized Kernels Between Labeled Graphs, In Proc. 20th International Conference on Machine Learning (ICML2003), Washington, DC USA, 2003
- Hisashi Kashima and Akihiro Inokuchi: Kernels for Graph Classification, In Proc. 1st ICDM Workshop on Active Mining (AM-2002), Maebashi, Japan, 2002
- Hisashi Kashima and Teruo Koyanagi: Kernels for Semi-Structured Data, In Proc. 19th International Conference on Machine Learning (ICML2002), Sydney, Australia, 2002
- Takanori Fukao, Hisashi Kashima and Norihiko Adachi: Decentralized Adaptive Control of Dynamic Interconnected Systems with Improved Performance, In Proc. 8th IFAC Symposium on Large Scale Systems: Theory and Applications, pp. 138-143, 1998
- Takanori Fukao, Hisashi Kashima and Norihiko Adachi: Robust Adaptive Control of Large-Scale Systems with Unmodeled Dynamic Interconnections, In Proc. 2nd Asian Control Conference, Vol 2, pp. 5-8, 1997
国内の会議/研究会論文
- 比戸将平,坪井祐太,鹿島久嗣,杉山将: 密度比推定を用いた特異点検出手法, 第10回 情報論的学習理論ワークショップ (IBIS 2007) , 2007.
- Tsuyoshi Kato,Hisashi Kashima, Masashi Sugiyama: Probabilistic Label Propagation on Multiple Networks, 第10回 情報論的学習理論ワークショップ (IBIS 2007) , 2007.
- 鹿島 久嗣, 山崎 一孝, 西郷 浩人, 猪口 明博: 目的変数が範囲で与えられる回帰問題に対するEM法, The International Workshop on Data-Mining and Statistical Science (DMSS2007) , 2007.
- Masashi Sugiyama, Shinichi Nakajima, Hisashi Kashima, Paul von Bunau, Motoaki Kawanabe: Kullback-Leibler importance estimation procedure for covariate shift adaptation, The International Workshop on Data-Mining and Statistical Science (DMSS2007) , 2007.
- Tsuyoshi Ide and Hisashi Kashima: Effective Dimension in Anomaly Detection: Its Application to Computer Systems, New Frontiers in Artificial Intelligence (Post-proceedings of the Eighteenth Annual Conference of Japanese Society of Artificial Intelligence), Lecture Notes in Artificial Intelligence, Vol. 3609, pp.189-204, 2007.
- Tetsuji Kuboyama, Koichi Hirata, Hisashi Kashima and Kiyoko F. Aoki-Kinoshita: The Gram Distribution Kernel: A Tree Kernel for Glycan Classification, 人工知能学会 第63回 人工知能基本問題研究会 (SIG-FPAI), 2006.
- 久保山 哲二, 申 吉浩, 鹿島 久嗣, 平田 耕一: 共通構造の数え上げによる半構造データカーネルの設計, 電子情報通信学会 第17回データ工学ワークショップ (DEWS2006), 2006
- 鹿島 久嗣: リスク回避型学習, 第8回 情報論的学習理論ワークショップ (IBIS 2005), 2005.
- 坪井 祐太, 鹿島 久嗣: 構造データのラベル付け学習モデルの設計, 第8回 情報論的学習理論ワークショップ (IBIS 2005), 2005.
- 鹿島 久嗣, 坪井 祐太: 構造化データのラベル付け学習とカーネル法(スライド), 構造化データの機械学習研究会(MOST), 2005.
- 鹿島 久嗣, 坪井 祐太: カーネル法に基づく構造データのラベリング学習アルゴリズム, 電子情報通信学会 人工知能と知識処理研究会(AI), 2004
- 井手 剛, 鹿島 久嗣: 固有空間におけるコンピュータシステムの障害検知, 人工知能学会全国大会, 2004
- 猪口 明博, 鹿島 久嗣: クラスラベル付きグラフデータからの有用なパターンペア発見, 人工知能学会 知識ベースシステム研究会, SIG-KBS, 2004
- Tetsuo Shibuya, Christian Schoenbach, Hisashi Kashima and Akihiko Konagaya: Accurate cDNA Clustering Algorithm based on Spliced
Sequence Alignment, 電子情報通信学会コンピュテーション研究会, COMP-2002-9-14,
17-24, 2002
- 鹿島 久嗣, 小柳 光生: 半構造データに対するサポートベクターマシンの適用, 人工知能学会
人工知能基礎論研究会, SIG-FAI-A104, 2002
- 鹿島 久嗣: 確率的ブーリアンネットワークを用いた遺伝子ネットワークの同定, 人工知能学会
分子生物情報研究会, 2001
- 鹿島 久嗣: 乗算型学習アルゴリズムを用いた属性選択, 人工知能学会全国大会, 2001
- Hisashi Kashima and Yasumasa Kajinaga: Optimal Winner Determination Algorithms for E-procurement
Auction,電子情報通信学会 コンピュテーション研究会, COMP-2000-57-63, 17-23,
2000
セミナー等での講演
- 鹿島 久嗣: 「生体ネットワーク予測の機械学習」, 日本バイオインフォマティクス学会 バイオインフォマティクス夏の学校2007, 2007/8/7.
- Hisashi Kashima: 「Methods for Predicting Network Structures」, The International Workshop on Data-Mining and Statistical Science (DMSS2006), 2006/9/26
- 鹿島 久嗣: 「ネットワーク構造解析 - 機械学習によるアプローチ -」, 人工知能学会 第63回 人工知能基本問題研究会 (SIG-FPAI), 九州工業大学, 2006/9/8
- 鹿島 久嗣, 坪井 祐太, 工藤 拓: 「言語処理における識別モデルの発展 -- HMMからCRFまで --」, 言語処理学会第12回年次大会(NLP2006), 慶應義塾大学, 2006/3/13
- 鹿島 久嗣, 坂本 比呂志: 「木構造データに対するカーネル関数の設計と解析」, 木とカーネルのセミナー, 九州工業大学, 2006/1/13
- 鹿島 久嗣: 「構造データマイニングの手法とバイオインフォマティクスへの応用」, シンポジウム:産業応用に向けたバイオインフォマティクス, 化学工学会 第37回秋期大会, 2005/9/17
- 鹿島 久嗣: 「カーネル法による構造データの解析」, 電子情報通信学会パターン認識・メディア理解研究会, 国立情報学研究所(NII), 2005/2/25
- 鹿島 久嗣: 「A Kernel-based Approach to Sequence Labeling Problems」, バイオインフォマティクスセミナー, 京都大学科学研究所バイオインフォマティクスセンター, 2004/9/6
- 鹿島 久嗣: >「構造をもつインスタンスに対するカーネル関数のアルゴリズム設計」, 生命情報科学特別講義, 産業技術総合研究所 生命情報科学研究センター(CBRC),
2003/1/8
その他の記事/報告
- Yuta Tsuboi and Hisashi Kashima, A New Loss Function with Markov Property" for Information Extraction, IBM Research Report, RT0660, 2006.
- 鹿島 久嗣: The 21st International Conference on Machine Learning (ICML) 2004 参加報告, 人工知能学会誌, Vol. 20, No. 1, 2005
- 瀧本 英二, 鹿島 久嗣, 黒木 学: Banff (COLT, ICML, UAI) 参加報告, 電子情報通信学会 情報・システムソサイエティ誌,
Vol. 9, No. 3, 2004
|
|