Bioinformatyka 2006/07 22.03.07
Multiple Sequence alignment (MSA)
1. Dowolną metodą znajdź sekwencję białka Q7Z4Y5
2. Przeszukaj sekwencje z p.1 bazę UNIPROT za pomocą programu BLAST, użyj standardowych parametrów
3. 10 wybranych sekwencji spośród otrzymanych w p.2 wyślij do programu T-coffee (http://www.ch.embnet.org/software/Tcoffee.html) celem wykonania MSA
4. Po zakończeniu obliczeń obejrzyj różne formaty output’u
5. Używając programu emma z pakietu emboss sporządź MSA używanych w poprzednich punktach sekwencji.
6. Kolejny MSA dla sekwencji q7z4y5 sporządź korzystając z programu MUSCLE (http://www.drive5.com/muscle/)
7. Porównaj otrzymane wyniki
PROFILE
1. Znajdź sekwencję ludzkiej dehydrogenazy alkoholowej.
2. Przeszukaj sekwencją z p.1 bazę NR, z trzema iteracjami programu PSI_BLAST (ncbi)
3. Dla pierwszych 20 hitów przygotuj MSA. Skorzystaj z programu T-coffee (wynik zapisz w formacie MSF) lub emma.
4. Korzystając z pakietu EMBOSS zrób profil (‘wossname’) na podstawie przygotowanego w p.2 MSA.
5. Znajdź ostatni pozytywny hit w pliku wynikowym PSI-BLASTA i odszukaj jego pełną sekwencję
6. Korzystając z pakietu EMBOSS wykonaj alignment sekwencji z p.5 z przygotowanym profilem (program prophet) i porównaj go z alignmentem z pliku wynikowego PSI-BLASTA.
7. Użyj zbudowanego w p.2 MSA do zbudowania ukrytego modelu Markowa (HMM) programem ehmmbuild z pakietu EMBOSS.
8. Zrób alignment sekwencji znalezionej w p.4 z przygotowanym HMM (ehmmpfam)
9. Użyj sekwencji z p.5 do przeszukania bazy PFAM (http://www.sanger.ac.uk/Software/Pfam/ - search by sequence). Jakie domeny znaleziono?
biologia