לדלג לתוכן

CASP

מתוך ויקיפדיה, האנציקלופדיה החופשית
מבנה יעד (פסים) ו-354 תחזיות מבוססות תבנית מונחות אחת על השנייה (שלדי α-פחמן אפורים); מ‑CASP8

הערכה ביקורתית של חיזוי מבנה (CASP), המכונה לעיתים גם הערכה ביקורתית של חיזוי מבנה חלבון, הוא ניסוי עולמי בהיקף קהילתי בתחום חיזוי מבנה חלבון המתקיים אחת לשנתיים מאז 1994.[1][2] CASP מספק לקבוצות מחקר את ההזדמנות לבחון באופן אובייקטיבי את שיטות חיזוי המבנה שלהן, ומעניק הערכה בלתי תלויה למצב המתקדם ביותר בתחום דוגמנות מבנה החלבונים הן לקהילת המחקר והן למשתמשי התוכנה. למרות שהמטרה העיקרית של CASP היא לקדם את השיטות לזיהוי המבנה התלת-ממדי של חלבון מתוך רצף החומצות האמיניות, רבים רואים בניסוי זה "אליפות עולם" בתחום המדע. למעלה מ-100 קבוצות מחקר מכל רחבי העולם משתתפות באופן קבוע ב-CASP, ולא נדיר כי קבוצות שלמות מושעות ממחקרים אחרים למשך חודשים, תוך התמקדות בהכנת השרתים לניסוי ובביצוע החיזויים המפורטים.

בחירת חלבונים כיעד

[עריכת קוד מקור | עריכה]

על מנת להבטיח כי אף אחד מהחוזים לא יהיה בעל מידע מוקדם אודות מבנה חלבון אשר יעניק לו יתרון, חשוב שהניסוי יתבצע בשיטה עיוורת כפולה: לא החוזים ולא המארגנים והמעריכים ידעו את המבנים של חלבוני היעד בזמן ביצוע החיזויים. חלבוני היעד לחיזוי מבנה הם או מבנים אשר עתידים להיפתר בקרוב באמצעות קריסטלוגרפיה בקרני רנטגן או ספקטרוסקופיית NMR, או מבנים שנפתרו זה עתה (בעיקר על ידי אחד ממרכזי הגנומיקה המבנית) ונשמרים בהמתנה על ידי בנק מידע החלבונים. אם נמצא כי הרצף הנתון קשור בירושה משותפת לרצף חלבון בעל מבנה ידוע (המכונה "תבנית"), ניתן להיעזר בדוגמנות חלבונים השוואתית כדי לחזות את המבנה השלישוני. ניתן לאתר תבניות באמצעות שיטות עימוד רצפים (למשל, BLAST או HHsearch) או באמצעות שיטות protein threading, אשר מצטיינות במציאת תבניות מרוחקות. במקרים אחרים, יש להיעזר בחיזוי מבנה de novo (כגון Rosetta), השיטה אומנם פחות אמינה אך לעיתים עשויה להניב מודלים בעלי קיפול נכון (בדרך כלל, לחלבונים הקטנים מ-100–150 חומצות אמיניות). קיפולים חדשים באמת הופכים להיות נדירים בקרב חלבוני היעד,[3][4] מה שהופך את הקטגוריה לזעירה ממה שהיה רצוי.

השיטה העיקרית להערכה[5] היא השוואת מיקומי α-פחמן במודל החזוי לאלה שבמבנה היעד. השוואה זו מוצגת באופן חזותי באמצעות גרפים מצטברים של מרחקים בין זוגות מקבילים של α-פחמן ביישור בין המודל למבנה, כפי שמוצג באיור (מודל מושלם היה נשאר באפס לאורך כל הגרף), ומוענקת לה ציון מספרי – GDT-TS (Global Distance Test—Total Score) – המתאר את אחוז השאריות המודל הממודלות היטב ביחס למבנה היעד.[6] גם חיזוי מבנה חופשי (ללא תבנית, או de novo) מוערך באופן חזותי על ידי המעריכים, שכן הציונים המספריים אינם מתאימים למציאת התאמות גסות במקרים הקשים ביותר.[7] החזויים מבוססי תבנית בעלי דיוק גבוה הוערכו ב-CASP7 על פי יכולתם לשמש לפאזינג בהחלפת מולקולות במבנה הגבישי של היעד[8] כאשר ההצלחות נבחנו בהמשך,[9] וכן על פי איכות המודל המלא והתאמתו המלאה למבנה היעד ב-CASP8.[10]

הערכת התוצאות מתבצעת בקטגוריות החיזוי הבאות:

  • חיזוי מבנה שלישוני (בכל ניסויי CASP)
  • חיזוי מבנה שניוני (הופסק לאחר CASP5)
  • חיזוי קומפלקסים מבניים (רק ב-CASP2; ניסוי נפרד – CAPRI – עוסק בנושא זה)
  • חיזוי מגעים בין שאריות (מתחיל מ-CASP4)
  • חיזוי אזורים חסרי סדר (מתחיל מ-CASP5)
  • חיזוי גבולות תחומי חלבון (CASP6–CASP8)
  • חיזוי תפקוד (מתחיל מ-CASP6)
  • הערכת איכות המודל (מתחיל מ-CASP7)
  • שיפור המודל (מתחיל מ-CASP7)
  • חיזוי מבוסס תבנית ברמת דיוק גבוהה (מתחיל מ-CASP7)

קטגוריית חיזוי המבנה השלישוני חולקה לתת-קטגוריות נוספות:

  • homology modeling
  • זיהוי קיפול (המכונה גם protein threading; שם זה אינו מדויק, שכן ה-threading הוא שיטה)
  • חיזוי מבנה de novo, המכונה כיום "קיפול חדש", מפני שרבות מהשיטות כוללות פונקציות הערכה או דירוג המושפעות מיידעות על מבנים טבעיים של חלבונים, כגון רשת עצבית מלאכותית.

החל מ-CASP7, הוגדרו מחדש הקטגוריות כדי לשקף את ההתפתחויות בשיטות. קטגוריית "דוגמנות מבוססת תבנית" כוללת את כל הדוגמנות ההשוואתית הקודמת, מודלים מבוססי קיפול הומולוגי וחלק מהמודלים המבוססים על קיפול אנלוגי. קטגוריית "דוגמנות ללא תבנית (FM)" כוללת מודלים של חלבונים בעלי קיפולים שלא נראו בעבר ומודלים מבוססי קיפול אנלוגי קשים. בשל מספר מצומצם של חלבוני יעד ללא תבנית (הם נדירים יחסית), הושק בשנת 2011 ניסוי מתמשך בשם CASP ROLL. ניסוי CASP מתמשך זה שואף להערכה מחמירה יותר של שיטות חיזוי ללא תבנית, באמצעות הערכת מספר גדול יותר של חלבוני יעד מחוץ לעונת החיזוי הרגילה. בניגוד ל־LiveBench ולEVA, ניסוי זה נעשה ברוח החיזוי העיוור של CASP, כלומר, כל החיזויים מתבצעים על מבנים שטרם נחשפו.[11]

תוצאות CASP מפורסמות בגיליונות תוספות מיוחדים של כתב העת המדעי Proteins, כולם נגישים דרך אתר CASP.[12] מאמר מוביל בכל אחד מתוספות אלו מתאר את המאפיינים הספציפיים של הניסוי[13][14] ומאמר מסכם מעריך את ההתקדמות בתחום.[15][16]

בדצמבר 2018, CASP13 עשה כותרות כאשר AlphaFold, תוכנית בינה מלאכותית שפותחה על ידי DeepMind, ניצחה בתחרות.[17] בנובמבר 2020, גרסה משופרת 2 של AlphaFold ניצחה ב-CASP14.[18] על פי אחד ממייסדי CASP, ג'ון מולט, AlphaFold קיבלה ציון בסביבות 90 מתוך 100 בסולם דיוק החיזוי עבור חלבוני יעד ברמת קושי בינונית.[19] AlphaFold נעשה ל-קוד פתוח בשנת 2021, וב-CASP15 ב-2022; כאשר אף על פי ש-DeepMind לא השתתפה, כמעט כל הקבוצות המדורגות הגבוהות השתמשו ב-AlphaFold או בגרסאות מותאמות של AlphaFold.[20]

דירוג התוצאות

[עריכת קוד מקור | עריכה]

הערכות אוטומטיות עבור CASP15 (2022)

הערכות אוטומטיות עבור CASP14 (2020)

הערכות אוטומטיות עבור CASP13 (2018)

הערכות אוטומטיות עבור CASP12 (2016)

הערכות אוטומטיות עבור CASP11 (2014)

הערכות אוטומטיות עבור CASP10 (2012)

הערכות אוטומטיות עבור CASP9 (2010)

הערכות אוטומטיות עבור CASP8 (2008)

הערכות אוטומטיות עבור CASP7 (2006)

קישורים חיצוניים

[עריכת קוד מקור | עריכה]

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. ^ "Home - CASP15". predictioncenter.org. נבדק ב-2022-12-14.
  2. ^ Moult J, Pedersen JT, Judson R, Fidelis K (בנובמבר 1995). "A large-scale experiment to assess protein structure prediction methods". Proteins. 23 (3): ii–v. doi:10.1002/prot.340230303. PMID 8710822. S2CID 11216440. {{cite journal}}: (עזרה)
  3. ^ Tress ML, Ezkurdia I, Richardson JS (2009). "Target domain definition and classification in CASP8". Proteins. 77 Suppl 9 (Suppl 9): 10–7. doi:10.1002/prot.22497. PMC 2805415. PMID 19603487.
  4. ^ Zhang Y, Skolnick J (בינואר 2005). "The protein structure prediction problem could be solved using the current PDB library". Proceedings of the National Academy of Sciences of the United States of America. 102 (4): 1029–34. Bibcode:2005PNAS..102.1029Z. doi:10.1073/pnas.0407152101. PMC 545829. PMID 15653774. {{cite journal}}: (עזרה)
  5. ^ Cozzetto D, Kryshtafovych A, Fidelis K, Moult J, Rost B, Tramontano A (2009). "Evaluation of template-based models in CASP8 with standard measures". Proteins. 77 Suppl 9 (Suppl 9): 18–28. doi:10.1002/prot.22561. PMC 4589151. PMID 19731382.
  6. ^ Zemla A (ביולי 2003). "LGA: A method for finding 3D similarities in protein structures". Nucleic Acids Research. 31 (13): 3370–4. doi:10.1093/nar/gkg571. PMC 168977. PMID 12824330. {{cite journal}}: (עזרה)
  7. ^ Ben-David M, Noivirt-Brik O, Paz A, Prilusky J, Sussman JL, Levy Y (2009). "Assessment of CASP8 structure predictions for template free targets". Proteins. 77 Suppl 9 (Suppl 9): 50–65. doi:10.1002/prot.22591. PMID 19774550. S2CID 16517118.
  8. ^ Read RJ, Chavali G (2007). "Assessment of CASP7 predictions in the high accuracy template-based modeling category". Proteins. 69 Suppl 8 (Suppl 8): 27–37. doi:10.1002/prot.21662. PMID 17894351. S2CID 33172629.
  9. ^ Qian B, Raman S, Das R, Bradley P, McCoy AJ, Read RJ, Baker D (בנובמבר 2007). "High-resolution structure prediction and the crystallographic phase problem". Nature. 450 (7167): 259–64. Bibcode:2007Natur.450..259Q. doi:10.1038/nature06249. PMC 2504711. PMID 17934447. {{cite journal}}: (עזרה)
  10. ^ Keedy DA, Williams CJ, Headd JJ, Arendall WB, Chen VB, Kapral GJ, et al. (2009). "The other 90% of the protein: assessment beyond the Calphas for CASP8 template-based and high-accuracy models". Proteins. 77 Suppl 9 (Suppl 9): 29–49. doi:10.1002/prot.22551. PMC 2877634. PMID 19731372.
  11. ^ Kryshtafovych A, Monastyrskyy B, Fidelis K (בפברואר 2014). "CASP prediction center infrastructure and evaluation measures in CASP10 and CASP ROLL". Proteins. 82 Suppl 2 (2): 7–13. doi:10.1002/prot.24399. PMC 4396618. PMID 24038551. {{cite journal}}: (עזרה)
  12. ^ "CASP Proceedings".
  13. ^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Hubbard T, Tramontano A (2007). "Critical assessment of methods of protein structure prediction-Round VII". Proteins. 69 Suppl 8 (Suppl 8): 3–9. doi:10.1002/prot.21767. PMC 2653632. PMID 17918729.
  14. ^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Tramontano A (2009). "Critical assessment of methods of protein structure prediction - Round VIII". Proteins. 77 Suppl 9 (Suppl 9): 1–4. doi:10.1002/prot.22589. PMID 19774620. S2CID 9704851.
  15. ^ Kryshtafovych A, Fidelis K, Moult J (2007). "Progress from CASP6 to CASP7". Proteins. 69 Suppl 8 (Suppl 8): 194–207. doi:10.1002/prot.21769. PMID 17918728. S2CID 40200832.
  16. ^ Kryshtafovych A, Fidelis K, Moult J (2009). "CASP8 results in context of previous experiments". Proteins. 77 Suppl 9 (Suppl 9): 217–28. doi:10.1002/prot.22562. PMC 5479686. PMID 19722266.
  17. ^ Sample, Ian (2 בדצמבר 2018). "Google's DeepMind predicts 3D shapes of proteins". The Guardian. נבדק ב-19 ביולי 2019. {{cite news}}: (עזרה)
  18. ^ "DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology". MIT Technology Review (באנגלית). נבדק ב-30 בנובמבר 2020. {{cite web}}: (עזרה)
  19. ^ Callaway, Ewen (2020). "'It will change everything': DeepMind's AI makes gigantic leap in solving protein structures". Nature. 588 (7837): 203–204. doi:10.1038/d41586-020-03348-4. PMID 33257889. S2CID 227243204.
  20. ^ Schreiner, Maximilian (2022-12-14). "CASP15: AlphaFold's success spurs new challenges in protein-structure prediction". The Decoder (באנגלית אמריקאית). נבדק ב-2023-02-13.