Bioinf6.doc

(26 KB) Pobierz
Multiple Sequence alignment (MSA)

Bioinformatyka 2006/07  22.03.07

Multiple Sequence alignment (MSA)

 

1.      Dowolną metodą znajdź sekwencję białka Q7Z4Y5

2.      Przeszukaj sekwencje z p.1 bazę UNIPROT za pomocą programu BLAST, użyj standardowych parametrów

3.      10 wybranych sekwencji spośród otrzymanych w p.2 wyślij do programu T-coffee (http://www.ch.embnet.org/software/Tcoffee.html) celem wykonania MSA

4.      Po zakończeniu obliczeń obejrzyj różne formaty output’u

5.      Używając programu emma z pakietu emboss sporządź MSA używanych w poprzednich punktach sekwencji.

6.      Kolejny MSA dla sekwencji q7z4y5 sporządź korzystając z programu MUSCLE (http://www.drive5.com/muscle/)

7.      Porównaj otrzymane wyniki

 

PROFILE

 

1.      Znajdź sekwencję ludzkiej dehydrogenazy alkoholowej.

2.      Przeszukaj sekwencją z p.1 bazę NR, z trzema iteracjami programu PSI_BLAST (ncbi)

3.      Dla pierwszych 20 hitów przygotuj MSA. Skorzystaj z programu T-coffee (wynik zapisz w formacie MSF) lub emma.

4.      Korzystając z pakietu EMBOSS zrób profil (‘wossname’) na podstawie przygotowanego w p.2 MSA.

5.      Znajdź ostatni pozytywny hit w pliku wynikowym PSI-BLASTA i odszukaj jego pełną sekwencję

6.      Korzystając z pakietu EMBOSS wykonaj alignment sekwencji z p.5 z przygotowanym profilem (program prophet) i porównaj go z alignmentem z pliku wynikowego PSI-BLASTA.

7.      Użyj zbudowanego w p.2 MSA do zbudowania ukrytego modelu Markowa (HMM) programem ehmmbuild z pakietu EMBOSS.

8.      Zrób alignment sekwencji znalezionej w p.4 z przygotowanym HMM (ehmmpfam)

9.      Użyj sekwencji z p.5 do przeszukania bazy PFAM (http://www.sanger.ac.uk/Software/Pfam/ - search by sequence). Jakie domeny znaleziono?

...
Zgłoś jeśli naruszono regulamin