XtalPred: egy webszerver a fehérjék kristályosíthatóságának előrejelzésére
Abstract
Summary: XtalPred is a web server for prediction of protein crystallizability. Az előrejelzés úgy történik, hogy a fehérje több jellemzőjét összehasonlítjuk a TargetDB-ben található e jellemzők eloszlásával, és az eredményeket kombinálva meghatározzuk a kristályosodás teljes valószínűségét. Az XtalPred biztosítja: (1) a fehérje jellemzőinek részletes összehasonlítását a TargetDB megfelelő eloszlásával; (2) a fehérje jellemzőinek és előrejelzéseinek összefoglalóját, amely jelzi a fehérje kristályosítása során valószínűleg felmerülő problémákat; (3) a ligandumok előrejelzését; és (4) (opcionális) a teljes mikrobiális genomból származó közeli homológok listáját, amelyek nagyobb valószínűséggel kristályosíthatók.
Készenlét: Az XtalPred webszerver szabadon elérhető tudományos felhasználók számára a http://ffas.burnham.org/XtalPred
Contact:[email protected]
1 BEVEZETÉS
A fehérjeszerkezetek kísérleti meghatározásának magas hibaaránya még mindig a strukturális biológia egyik legnagyobb kihívása. A strukturális genomikai (SG) központok adatai azt mutatják, hogy a nagy áteresztőképességű (HT) beállításokban az általános sikerességi arány mindössze 5% körül van, és bár a szokásos strukturális biológiai laboratóriumokról nem állnak rendelkezésre statisztikák, az anekdotikus bizonyítékok azt sugallják, hogy a kudarcok aránya szintén nagyon magas. A bioinformatikai eszközök segíthetnek annak felismerésében, hogy mely fehérjéknek van nagyobb esélyük a sikerre, a többiek számára pedig javaslatokat tehetnek a lehetséges módosításokra. A legnagyobb esélyű célpontok kiválasztása különösen hasznos az SG-központok számára, amelyek inkább fehérjecsaládokat céloznak meg, mint egyes fehérjéket.
A fehérjék tulajdonságai és kristályosíthatóságuk közötti kapcsolatot több csoport is vizsgálta (Bertone et al., 2001; Canaves et al., 2004; Goh et al., 2004; Oldfield et al., 2005). A hagyományos laboratóriumok azonban csak a szerkezetmeghatározás sikereiről számolnak be, ami a pozitív és negatív adatokat tartalmazó, megfelelően kiegyensúlyozott adatsorok hiánya miatt szinte lehetetlenné teszi az adatbányászati elemzéseket. Ez a helyzet megváltozott a Protein Structure Initiative (www.nigms.nih.gov/Initiatives/PSI) létrehozásával, amely megköveteli a tagközpontoktól, hogy a sikereket és a kudarcokat egyaránt jelentse egy központi adatbázisba, a TargetDB-be (Chen et al., 2004). A TargetDB-ből kinyert tanulási halmazok lehetővé tették a fejlettebb elemzéseket (Chandonia et al., 2006; Overton és Barton, 2006; Smialowski et al., 2006), amelyeket itt kibővítünk a Joint Center for Structural Genomics (JCSG) munkájából származó adatok és meglátások felhasználásával.
A logaritmikus véleménygyűjtési módszert (Genest et al., 1984), hogy a több egyedi fehérjejellemzőre számított valószínűségi eloszlásokat egy “kristályosítási megvalósíthatósági pontszámban” (Slabinski et al., 2007) egyesítsük, ahol bebizonyítottuk, hogy módszerünk jelentősen javíthatja a szerkezetmeghatározás általános sikerességi arányát. A PDB-ben lévő letétek elemzése (Berman et al., 2000) megerősítette, hogy ugyanazok a fehérjejellemzők a standard, nem-HT szerkezetmeghatározás sikerességi arányára is jelentős hatással vannak, ami arra utal, hogy a “kristályosítási megvalósíthatósági pontszám” a széles szerkezetbiológiai közösség számára is jelentős érdeklődésre tarthat számot. Algoritmusunkat 2006 óta sikeresen használják a JCSG-ben az optimális szerkezetmeghatározási célpontok kiválasztására olyan fehérjecsaládok közül, amelyeknek nincs vagy nem megfelelő a szerkezeti lefedettsége.
Az XtalPred szerver a PSI által az elmúlt 7 év során a fehérjekristályosításról összegyűjtött statisztikai ismeretekre épül, és a HT szerkezetmeghatározásból származó meglátásokat a szerkezetbiológusok széles közössége számára teszi elérhetővé.
2 SZERVER JELLEMZŐK ÖSSZEFOGLALÓJA
Kristályosítási elemzések: a webszerver összehasonlítja az elemzett fehérje kilenc biokémiai és biofizikai jellemzőjét a TargetDB-ből származó megfelelő valószínűségi eloszlásokkal. Minden egyes fehérjejellemzőhöz grafikon készül, amely mutatja a TargetDB-ből kinyert halmazok sikertelenségi és sikertelenségi eloszlásait; a kristályosodás valószínűségének interpolált empirikus eloszlásait; és a fehérje helyét ezekben az eloszlásokban (1. ábra).
Példa az XtalPred kimenetére. Az egyes fehérjejellemzőkhöz kapott hisztogramokból számított valószínűségek (jobb oldali panel) alapján a fehérjét a megfelelő kristályosodási osztályba soroljuk (bal felső sarok). A bal alsó sarokban a különböző adatbázisokban található homológok listáira mutató linkek találhatók.
Példa az XtalPred kimenetére. Az egyes fehérjejellemzőkhöz kapott hisztogramokból számított valószínűségek (jobb oldali panel) segítségével a fehérjét a megfelelő kristályosodási osztályba soroljuk (bal felső sarok). A bal alsó sarokban a különböző adatbázisokban található homológok listáira mutató linkek találhatók.
Kristályosodási előrejelzés: A predikciót az egyes kristályosodási valószínűségek egyetlen kristályosodási pontszámba történő kombinálásával végezzük. E pontszám alapján a fehérjét az öt kristályosodási osztály egyikébe sorolják: optimális, szuboptimális, átlagos, nehéz és nagyon nehéz (1. ábra).
A fehérjéről szóló információk összefoglalása: a szerver kiszámítja és előrejelzi a fehérje kristályosíthatóságával kapcsolatos fehérjejellemzőket, és egy weboldalon összefoglalja azokat. A kiszámított fehérjejellemzők a következők: fehérje hossza; molekulatömeg; gravy index (Kyte és Doolittle, 1982); instabilitási index (Guruprasad et al., 1990); extinkciós együttható (Gill és von Hippel, 1989); izoelektromos pont (Creighton, 1984); Cys, Met, Trp, Tyr és Phe maradékok tartalma; és az illesztések átlagos száma a fehérjeszekvenciák nem redundáns (NR) adatbázisában található homológokhoz képest. A megjósolt jellemzők közé tartoznak: másodlagos szerkezet, rendezetlen régiók, alacsony komplexitású régiók, tekercses-tekercses régiók, transzmembrán hélixek és szignálpeptidek. Kiemelésre kerülnek azok a jellemzők, amelyek a kristályosítási folyamat során felmerülő problémákra utalhatnak. A külső szoftverrel készített predikciók (3. szakasz) esetén a nyers kimenet szöveges fájlként elérhető.
Közelebbi homológok, amelyek nagyobb valószínűséggel kristályosodnak: a szerverről elérhető az összes teljes mikrobiális genom (jelenleg 487 genom; 1, 549, 504 fehérje) előreszámított kristályosodási osztálya. A szerver minden egyes beküldött fehérjéhez a homológjainak listáját adja meg a kristályosodási osztályukról szóló információval együtt. A lista az egyes homológokra vonatkozó részletes információkhoz vezető linkeket is tartalmaz.
Fold és ligand predikció: Az XtalPred biztosítja a bemeneti fehérje szekvenciaillesztését a PDB-ben található összes homológ fehérjével. Tartalmazza továbbá a homológ fehérjékkel együtt kristályosított ligandumok listáját és azok másodlagos szerkezetét.
Skálázhatóság: A szerver egyetlen beküldéssel akár 10 szekvenciát is képes feldolgozni. Nagyobb beadványokat a webszerver adminisztrátorával kell megbeszélni.
Homológok: a szerver biztosítja a homológokkal való összehangolást, amely felhasználható a csonkolási javaslatokhoz.
3 SZERVER DETAILS
Az XtalPred szerver több nyilvánosan elérhető programot használ a fehérjék jellemzőinek kiszámításához és előrejelzéséhez: PSI-BLAST a homológiakereséshez; CD-HIT (Li és Godzik, 2006) a fehérje szekvencia adatbázisok klaszterezéséhez; COILS (Lupas et al., 1991) a tekercselt tekercs régiók előrejelzéséhez, TMHMM (Krogh et al., 2001) a transzmembrán hélixek előrejelzésére, RPSP (Plewczynski et al., 2007) a szignálpeptidek előrejelzésére, SEG (Wootton, 1994) az alacsony komplexitású régiók kiszámítására, PSIPRED (Jones, 1999) a másodlagos szerkezet előrejelzésére, és DISOPRED2 (Ward et al., 2004) a szerkezetileg rendezetlen régiók előrejelzéséhez.
FELHÍVÁSOK
Ezt a munkát az NIH Protein Structure Initiative U54 GM074898 (JCSG) és P20 GM076221 (JCMM) ösztöndíjai támogatták.
Érdekütközési konfliktus: nincs bejelentett.
, et al.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
. ,
,
, et al.
,
,
, vol.
(pg.
–
)
,
.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
,
.
,
,
, vol.
(pg.
–
)
,
.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
,
.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
, et al.
,
,
, vol.
(pg.
–
)
.
,
,
, vol.
(pg.
–
)
Autori jegyzetek
Társszerkesztő: Thomas Lengauer