下平英寿研究室 情報科学総合演習・実験 2003年度


バイオインフォマティクス(分子系統樹の推定)の体験的入門


担当: 下平英寿

ティーチングアシスタント 山本洋

質問メールはこちらに送ってください: shimo-enshu (a) is.titech.ac.jp

日時: 木曜 15:00−16:30 W911.

第1ラウンド: 開講しない

第2ラウンド初回: 11月10日(月曜) 13:30 西8号館W707

第3ラウンド初回: 12月15日(月曜) 13:30 西8号館W707

評価方法: 出席とレポート



 バイオインフォマティクスはゲノム科学とコンピュータ科学の融合ともいえる分野であり,近年急速に成長している.ゲノム科学の発展によって生物の設計図であるDNAの情報が次々とデータベースに登録されており,これらにコンピュータ科学の手法を用いて新たな発見や生命の理解を目指している.これはまた最新の統計科学や最適化手法が実践される場でもある.

 本演習ではバイオインフォマティクスの一例として「分子系統樹の推定」を実際に体験する.公共のデータベースから自分の興味のある動物群のDNA配列をダウンロードし,これらに各種のプログラムを適用することによって進化の系統樹を推定する.この体験を通して,データ解析の面白さに気づいたり,情報科学の研究に関する問題意識(モチベーション)を高めるきっかけを作ることが狙いである.

 本演習を行うにあたって最低限のUNIX操作をマスターしていることが前提である.しかし今回の入門ではプログラミングスキルは必ずしも必要ではない.具体的には,ログイン,ファイル操作(lsやcp等),編集(emacsやvi等)が必須であり,さらにシェルスクリプト(bashを使用)やPerlがある程度読めるとスムーズに作業が出来るであろう.データベースのアクセスにはwebブラウザ(ネットスケープ,IE等)を用いる.

 まず一般向けの解説である確率モデルで探る生物の進化を読んでから次の作業1−6を行うこと.また演習に関してのヒント集(2002年度TAの郡司氏作成)を参照すること.レポートの書き方については,2002年度に提出されたレポート「羊膜類の生物進化系統樹の推定」(嶋村謙太・富岡さやか)や「情報科学総合演習・実験レポート」(鷹岡良治・斎藤耕二郎)も参考にすること.


1. 作業ディレクトリの準備

2. 進化系統樹

3. データベースへのアクセス

4. DNA配列のアライメント

5. 系統樹の推定

6. 系統樹の信頼集合



全体を通して以下のサイトは参考になるだろう.


遺伝研ホームページ (http://www.nig.ac.jp/home-j.html)

遺伝研 「遺伝学電子博物館」 (http://www.nig.ac.jp/museum/index.html)

東大生物情報工学清水研 「バイオインフォマティクスの基礎」 (http://www.bi.a.u-tokyo.ac.jp/~shimizu/exp/database.html)

西山智明さん (http://www.nibb.ac.jp/~tomoaki/)

UCB Museum of Paleontology (http://www.ucmp.berkeley.edu/)

Tree of Life Web Project (http://tolweb.org)

NCBI Home Page (http://www.ncbi.nlm.nih.gov/)


Google等の検索エンジンを用いて,「進化」,「系統樹」,「最尤法」,「ミトコンドリア」などをキーワードに各自調べてみる.


講義と演習のページへ戻る