Pfam

Pfam è un database di famiglie di proteine che include le loro annotazioni e gli allineamenti di sequenze multiple generati usando i modelli di Markov nascosti.^[1]^[2]^[3]

Caratteristiche

Per ogni famiglia di proteine presente su Pfam si possono ottenere:

La vista di molteplici allineamenti
La vista delle architetture del domain proteico
Esaminare la distribuzione delle specie
Seguire i collegamenti ad altri database
Osservare le strutture proteiche note

All'incirca il 74% delle sequenze proteiche hanno almeno un collegamento a Pfam. Questo numero viene chiamato la copertura delle sequenze.

Pfam-A

Il database Pfam-A contiene informazione circa i domain proteici e le famiglie di proteine Pfam-A è a parte del database curata da operatori umani che contiene più di 10.000 voci. In ogni articolo sono archiviati un allineamento della sequenza aminoacidica e il corrispettivo Modello di Markov nascosto. Questi modelli di Markov nascosti possono essere usati per cercare databse di sequenze grazie al pacchetto di programmi HMMER scritto da Sean Eddy. Dal momento che le voci di Pfam-A attualmente non coprono tutte le proteine note, è stato generato automaticamente un supplemento denominato Pfam-B.

Pfam-B

La sezione Pfam-B contiene un gran numero di piccole famiglie proteiche derivate da clusters prodotti da un algoritmo denominato ADDA.^[4] Anche se di minore qualità, la sezione di famiglie contenute in Pfam-B può essere utile quando non si trova una famiglia proteica in Pfam-A.

iPfam

Il database iPfam^[5] viene costruito in base alla descrizione del domain di Pfam. Questo database investiga se le differenti proteine descritte assieme (in base alla struttura proteica derivata dal database Protein Data Bank) sono davvero lo sufficientemente vicine per interagire potenzialmente.

Nell'ottobre del 2009, la release "Pfam 24.0" conteneva 11.912 famiglie proteiche.

Note

^ Finn RD, Tate J, Mistry J, Coggill PC, Sammut SJ, Hotz HR, Ceric G, Forslund K, Eddy SR, Sonnhammer EL, Bateman A, The Pfam protein families database., in Nucleic Acids Res, vol. 36, Database issue, 2008, pp. D281–8, DOI:10.1093/nar/gkm960, PMID 18039703.
^ PMID 16381856
^ PMID 14681378
^ PMID 15608174
^ PMID 15353450

Voci correlate

Protein Data Bank
Proteopedia
TrEMBL Database performing an automated protein sequence annotation
InterPro Integration of protein domain and protein family databases

Collegamenti esterni

(EN) Pfam - Protein family database at Sanger Institute UK
(EN) Pfam - Protein family database at Janelia Farm Research Campus USA
(EN) Pfam - Protein family database at Center for Genomics and Bioinformatics Sweden
(EN) iPfam - Interactions of Pfam domains in PDB

[pmid18039703-1] Finn RD, Tate J, Mistry J, Coggill PC, Sammut SJ, Hotz HR, Ceric G, Forslund K, Eddy SR, Sonnhammer EL, Bateman A, The Pfam protein families database., in Nucleic Acids Res, vol. 36, Database issue, 2008, pp. D281–8, DOI:10.1093/nar/gkm960, PMID 18039703.

[pmid16381856-2] PMID 16381856

[pmid14681378-3] PMID 14681378

[pmid15608174-4] PMID 15608174

[pmid15353450-5] PMID 15353450

[1]

[2]

[3]

[4]

[5]

Pfam

Indice

Caratteristiche

Pfam-A

Pfam-B

iPfam

Note

Voci correlate

Collegamenti esterni

Menu di navigazione

Pfam

Caratteristiche

Pfam-A

Pfam-B

iPfam

Note

Voci correlate

Collegamenti esterni

Menu di navigazione

Ricerca