BLAST

wetとdryていう言い方もいい。

相同性解析の考え方;
http://ja.wikipedia.org/wiki/BLAST

Bob Marley: Live in Santa Barbara [COMPLETO]


ここの解説がわかりやすい。
http://lecture.ecc.u-tokyo.ac.jp/~ashugo/database/lec2.html
曰く、
「データベース検索は、キーワードを指定してその条件にマッチするエントリを探す、という「キーワード検索」であった。ホモロジー検索はこれとは異なり、上で述べたように、手持ちの塩基配列あるいはアミノ酸配列と関係がありそうな、よく類似した配列をデータベースに対して検索すること」

具体例はアミノ酸配列解析なので、核酸配列とは別だが方法の参考に。

「bitsは類似性のスコア」

「bitスコアが大きく、E-Valueが小さい場合には、互いの配列のホモロジーは高いと言える。」
E-Valueはblastnにおける期待値、expect値であろう。

「今のc-Cblの検索では、E-valが「0.0」と表示されている配列が複数ヒットしており。配列がクエリーとほとんど同じかまったく同じであるデータベース配列がいくつか見つかったことがわかる。それらの中には、クエリー配列そのものであるCBL_HUMANの他、マウスのc-Cblなども含まれており、このような生物種ではc-Cblアミノ酸配列がヒトのそれと非常に類似していることがわかる。」

手元のデータでもexpect値が0のもの、上位5位が返されている。
菌株はともかく、菌種がかわるのはいただけん。プライマーの設計が悪いとか言われそう。

系統樹は自分で作るかな。