[English/Japanese]
[2012/03/22] 研究室紹介PDFをアップしました.複雑ネットワークの構造を明らかにする統計科学 (クリックでPDFが開きます)
[2011/03/06] スライドPDFをアップしました. なぜサンプルサイズを負にするとベイズが頻度論に変わるのか?(研究業績賞記念講演@日本統計学会春季集会)
[2010/10/08] 2010年後期の集中講義: 福水健次教授(統計数理研究所) による機械学習の集中講義 「カーネル法:正定値カーネルによるデータ解析」 (「ORの理論第二」 または「数理・計算科学特論第五」 )
[2010/09/07] 日本統計学会研究業績賞を受賞しました.
[2010/06/30] 大田区の区民大学(東京工業大学連携講座)で講演しました NEW! (講演スライドのほかにYouTube動画もあります)
[2010/05/21] VMwareをつかってPCクラスターを構成しました NEW!
[2007/07/08] Shimodaira and Hasegawa (1999) Multiple comparisons of log-likelihoods with applications to phylogenetic inference, Molecular Biology and Evolution, 16, 1114-1116 の論文被引用回数が1000回を超えました(ISI Thomson SCIデータベース).この論文で提案した統計的検定手法はShimodaira-Hasegawa testと呼ばれ,分子系統学(DNAから進化を推定する学問)で国際的な標準手法の一つとして用いられるようになっています.
[2007/01/07] Paul Sheridan (研究生) が国際会議 PSB2007 (ハワイ) にて発表をしました.
[2006/12/06] 理化学研究所との共同研究の成果がプレスリリースされました.
[2006/07/14] 下平英寿(助教授)がscaleboot (an R package for multiscale bootstrap) をリリースしました.
[2006/04/12] 下平英寿(助教授)が文部科学大臣表彰若手科学者賞を受賞しました.
[2006/04/08] 下平英寿(助教授)の主要3論文の被引用回数が1000回を超えました.(ISI Thomson SCIデータベースにて調査.内訳:753,129,121).
[2006/01/07] 上村健(修士2年)が国際会議 PSB2006 (ハワイ) にて発表をしました.
[2005/12/20] 上村健(修士2年),谷雪岳(学部4年)が,国際会議 GIW2005 にて発表をしました.
[2005/02/24] 鈴木了太(修士2年)が pvclust (An R package for hierarchical clustering with p-values) をリリースしました.
[2005/01/07] 上村健(修士1年)が国際会議 PSB2005 (ハワイ) にて発表をしました.
[2004/12/22] 「モデル選択」(岩波書店) が出版されました.
[2004/12/22] 下平英寿(講師)が平成16年度「東工大挑戦的研究賞」を受賞しました.
[2004/12/13] 鈴木了太(修士2年),上村健(修士1年),谷口智也(学部4年)が,国際会議 GIW2004 にて発表をしました.
[2004/07/30] 田中・下平 (2004) マイクロアレイデータに対するクラスタ分析のバラツキの評価 −Multiscale bootstrap法のSASマクロの作成−, SAS Forum ユーザー会 学術総会 2004, 論文集 pp.403-413 (発表者:田中紀子 東京大学大学大学院 医学系研究科)が「ポスター賞」を受賞しました.
[2004/03/09] 数理・計算科学専攻リサーチレポート・シリーズB にて,以下の二つのレポートを下平英寿(講師)が刊行しました.B-402:Approximately unbiased tests of regions using multistep-multiscale bootstrap resampling. B-403:Technical details of the multistep-multiscale bootstrap resampling. どちらもマルチスケール・ブートストラップ法に関する論文で,こちらよりご覧になれます.日本語による解説はこちらにあります.B-402の最新版は,Annals of Statistics Vol. 32, No. 6 - December 2004 に掲載予定です.
[2003/12/17] 上村健(学部4年)が国際会議 GIW2003 にて卒論テーマの発表をしました.題名: "Multiscale Bootstrap Analysis of Gene Networks Based on Bayesian Networks and Nonparametric Regression" (ベイジアンネットワークとノンパラメトリック回帰を用いた遺伝子ネットワークのマルチスケールブートストラップ解析).[ポスター画像,ポスターPDF,論文PDF]
GIW2003で発表する上村君 |
|||||
[2003/08/01] Shimodaira and Hasegawa (2001) CONSEL: for assessing the confidence of phylogenetic tree selection, Bioinformatics, 17, 1246-1247 が ISI New Hot Papers (コンピュータサイエンス部門,2003年7月期)を受賞しました.
「ランダムネス」の研究: 統計科学とバイオインフォマティクス
統計科学は「データから意味のある知識を得るための方法」を研究する学問です.いくらたくさんのデータがあっても,ランダムネスを合理的に処理しなければわれわれの役には立ちません.統計科学では情報抽出のプロセスを数理的な問題としてとらえ,各種のアルゴリズムを駆使して,データから知識の発見を行います.アルゴリズムの開発や理論の研究だけでなく,それを現実の問題で実践することも重視します.統計科学の歴史をふりかえると,むしろ,泥臭い実践から本当に新しい理論研究が生まれました.下平研ではデータ解析の方法論(言い換えるとアルゴリズム)の研究を行っていますが,数理統計の理論研究から実践的なデータ解析まで幅広いスペクトルがあります.自分で考えた新しいアルゴリズムのアイデアを実装するためのプログラミングも重要な要素ですし,そのアルゴリズムの正当性を数学的に証明することも重要です.つまり,プログラミングと数学が研究の両輪となります.
下平研では特にバイオインフォマティクス(バイオと情報技術の融合した学問)を主な対象として最先端科学のデータを分析する機会がありますが,これにとらわれず様々な分野のデータを扱います.データ解析の対象を「確率モデル」によって記述して,最尤法やベイズ推測といった統計科学の方法論を用います.今から250年ほど前にThomas Bayesが与えたベイズ推測の原理が,みなさんの身近なところでは例えば,音声認識やスパムフィルターの基本アルゴリズムとして現在役立っています.統計科学が本格的に研究されるようになってからすでに100年以上たちますが,いまだ合理的な帰納推論の方法論にたどりついていないと思います.帰納推論というのはいくつかの事例(つまりデータ)から普遍的な法則を導き出すことです.あなたもチャレンジしてみてはどうでしょうか?
幅広い視野を身につけるために,OR系の5研究室(確率,統計,最適化)が共同でゼミを運営しています.学生部屋も共通ですから,ゼミ以外の相互交流もあります.各研究室のゼミや輪読もあります.下平研究室では,各学生の状況に応じた柔軟な運営を行っていて,随時ディスカッションを通して研究を進めます
研究の紹介
1.データのランダムネスを測定するアルゴリズムの開発.DNA配列から生物進化の系統樹を推定することが盛んに行われています.系統樹は生物学の知的興味だけでなく,HIVの感染経路推定などで基本情報を提供します.下平が博士課程のときに開発したShimodaira-Hasegawa testと呼ばれる手法は,推定した系統樹が何パーセント信用できるかを計算するアルゴリズムで,いまや世界中で利用される標準手法になっています.最近ではより性能の高いマルチスケール・ブートストラップ法を開発し,日本数学会で特別講演を行いました.数理と応用が深く結びつく実例でしょう.
2.Assessing the uncertainty in hierarchical cluster analysis via multiscale bootstrap resampling (鈴木了太 2004年度 修士論文).生きている細胞の遺伝子レベルの活動状況をリアルタイムで測定する技術(DNAチップ,マイクロアレイと呼ばれる)があります.鈴木君はDNAチップ情報から細胞状態を分類し,その信頼性を計算するソフトウエアpvclustを開発しました.下平研の独自アルゴリズムであるマルチスケール・ブートストラップを実装しています.すでにRシステムの一部として組み込まれており,最近アメリカで出版されたES細胞を分類する論文でも使われています. 膨大な計算量ですが,TSUBAMEのようなコンピュータをつかった並列計算を実装し高速化も実現しています.
3.スケールフリー構造をもつ遺伝子ネットワークのベイズ推定 (上村健 2005年度 修士論文).DNAチップ情報から遺伝子間の相互作用を推定する研究が近年盛んに行われています.ソフトウエアに例えると遺伝子は関数やサブルーチンに相当します.ある遺伝子が動き出すとそれが次の遺伝子を動かす,という関連を推定してグラフ構造で表現します.WWWや友人ネットワークと同様に遺伝子も少数のハブとなるノードが多数の枝を持つ性質(スケールフリーネットワーク)があります.上村君は,これを確率モデルで表現してマルコフ連鎖モンテカルロ法に組み込むアルゴリズムの研究を行いました.
4.マルチスケール・バギングによる判別分析の信頼性評価 (青木正良 2008年度 卒業論文).スパムフィルターのように正解例から予測を行う機械学習(判別問題)では,バギングと呼ばれるアルゴリズムによって多数の学習器の多数決をとって判別精度を高くします.青木君は予測結果の信頼度(何パーセントの確率で正しいか)をマルチスケール・ブートストラップ法で計算する手法の研究を行いました.
このページは下平英寿によって管理されています.いうまでもなく手前味噌です.