担当: 下平英寿
ティーチングアシスタント 塚本賢一, 郡司貴之
日時: 月曜 13:20−16:30 初回は西8号館W707,2回目以降はW811.
評価方法: 出席とレポート
バイオインフォマティクスはゲノム科学とコンピュータ科学の融合ともいえる分野であり,近年急速に成長している.ゲノム科学の発展によって生物の設計図であるDNAの情報が次々とデータベースに登録されており,これらにコンピュータ科学の手法を用いて新たな発見や生命の理解を目指している.これはまた最新の統計科学や最適化手法が実践される場でもある.
本演習ではバイオインフォマティクスの一例として「分子系統樹の推定」を実際に体験する.公共のデータベースから自分の興味のある動物群のDNA配列をダウンロードし,これらに各種のプログラムを適用することによって進化の系統樹を推定する.この体験を通して,データ解析の面白さに気づいたり,情報科学の研究に関する問題意識(モチベーション)を高めるきっかけを作ることが狙いである.
本演習を行うにあたって最低限のUNIX操作をマスターしていることが前提である.しかし今回の入門ではプログラミングスキルは必ずしも必要ではない.具体的には,ログイン,ファイル操作(lsやcp等),編集(emacsやvi等)が必須であり,さらにシェルスクリプト(bashを使用)やPerlがある程度読めるとスムーズに作業が出来るであろう.データベースのアクセスにはwebブラウザ(ネットスケープ,IE等)を用いる.
まず一般向けの解説である確率モデルで探る生物の進化を読んでから次の作業1−6を行うこと.また演習に関してのヒント集(TAの郡司氏作成)を参照すること.
1. 作業ディレクトリの準備
2. 進化系統樹
3. データベースへのアクセス
4. DNA配列のアライメント
5. 系統樹の推定
6. 系統樹の信頼集合
全体を通して以下のサイトは参考になるだろう.
遺伝研ホームページ (http://www.nig.ac.jp/home-j.html)
遺伝研 「遺伝学電子博物館」 (http://www.nig.ac.jp/museum/index.html)
東大生物情報工学清水研 「バイオインフォマティクスの基礎」 (http://www.bi.a.u-tokyo.ac.jp/~shimizu/exp/database.html)
西山智明さん (http://www.nibb.ac.jp/~tomoaki/)
UCB Museum of Paleontology (http://www.ucmp.berkeley.edu/)
Tree of Life Web Project (http://tolweb.org)
NCBI Home Page (http://www.ncbi.nlm.nih.gov/)
Google等の検索エンジンを用いて,「進化」,「系統樹」,「最尤法」,「ミトコンドリア」などをキーワードに各自調べてみる.