קיבוץ נתונים

חדשות מדע בשפה ידידותית
01.12.2000

שתף

 
מימין: תלמידי המחקר אראל לוין וגד גץ, פרופ' איתן דומאני ותלמידת המחקר שירלי ברדה
 
 
מדענים העוסקים בחקר הגורמים הגנטיים למחלות סרטניות ואחרות יוכלו בקרוב להיעזר במערכת מתמטית ייחודית, שפיתחו פרופ' איתן דומאני ותלמידי המחקר גד גץ ואראל לוין מהמחלקה לפיסיקה של מערכות מורכבות במכון ויצמן למדע. בשנים האחרונות, עם פיתוח טכנולוגיית השבבים הגנטיים, יכולים המדענים לבחון בעת ובעונה אחת את התבטאותם של אלפי גנים בדוגמאות רקמה שמקורן בעשרות נבדקים. כך מקבלים החוקרים נתונים המורכבים מ-100,000 ועד 1,000,000 מספרים. כדי לנתח ביעילות כמות כזאת של מידע, יש צורך בכלים חדשניים לעיבוד נתונים. פרופ' דומאני ותלמידיו פיתחו כלי כזה, המבוסס על אלגוריתם (מתכון פעולה), אשר מאפשר למחשב למיין עצמים לקבוצות על פי מידת הדמיון ו/או הקשר ביניהם, גם אם לא "למד" מראש על מאפייניהם האפשריים של העצמים. מדובר בפעולה מסובכת וקשה במיוחד לביצוע, מ"נקודת מבטו" של המחשב. מדענים רבים, במקומות שונים בעולם, משקיעים בשנים האחרונות מאמצים רבים בפיתוח שיטות שיאפשרו למחשבים לבצע "קיבוץ" של פריטי מידע לקבוצות בעלות מהות משותפת.
 
במחקרים המבוססים על שימוש בשבבים גנטיים "שולף" האלגוריתם שפיתחו דומאני ותלמידיו קבוצות קטנות יחסית של גנים שיש להם "משהו" במשותף, ומזהה - באמצעות הגנים האלה - רקמות שיש ביניהן דמיון ביולוגי. זיהוי הקשר ו/או הדמיון בין הרקמות מאפשר לחלק אותן לקבוצות על פי הדמיון בין התהליכים הביולוגיים המתחוללים בהן. למשל: בקבוצה אחת ייכללו רקמות שמתחוללים בהן תהליכים המובילים להתפתחות גידול סרטני, ובקבוצה אחרת - הרקמות שנלקחו מגופם של אנשים בריאים.
 
האלגוריתם החדש משתמש בכלי חישוב שפיתחו בעבר פרופ' דומאני ועמיתיו, על בסיס מחקרים קודמים שהתמקדו במעברי פאזה (מופע) בחומרים מגנטיים לא מסודרים. אלגוריתם חדש זה כבר הוכיח את עצמו במחקר שממצאיו התפרסמו באחרונה בכתב העת המדעי "רשומות האקדמיה הלאומית למדעים של ארה"ב (PNAS). במחקר זה קיבל המחשב נתונים על רמת ההתבטאות של 2,000 גנים בתאי גופם של 70 נבדקים שעברו בבתי-חולים מבדקים שונים לאיבחון סרטן. כך, למעשה, המחשב קיבל 140,000 מספרים ללא כל "הסבר" נוסף. באמצעות האלגוריתם של פרופ' דומאני הצליח המחשב ליצור תבנית שבה חולקו הגנים השונים לקבוצות על פי רמת ההתבטאות שלהם ברקמה הנבדקת (התבטאות של גן היא מידת ההיווצרות של החלבון שהמידע לייצורו מקודד בגן). כך נוצרו קבוצות נפרדות של רקמות בריאות וסרטניות, וזוהו קבוצות של נבדקים בעלי פרופיל גנטי דומה.
 
בדרך זו הצליחו החוקרים להגדיר, מתוך 2,000 הגנים שנבחנו, קבוצה של כמה עשרות גנים שעל פי מידת התבטאותם אפשר להבחין ברמת דיוק טובה למדי בין הנבדקים הבריאים לבין אלה שבגופם מתחוללים תהליכים העלולים להוביל להתפתחות סרטן.
 
בנוסף ליכולתו לנתח נתונים המתקבלים מבדיקות בשבבים גנטיים, עשוי האלגוריתם החדש לשמש לניתוח מידע הנאגר במערכות MRI בתחום חקר המוח, בניתוח מידע כלכלי, בסיווג מסמכים במאגרי מידע, וכן באיתור פריטי מידע מוגדרים מתוך מאגרי מידע ממוחשבים גדולים מאוד, דוגמת המאגרים שנוצרו במסגרת הפרויקט הרב-לאומי לפיענוח ולמיפוי גנום האדם. חברת "ידע", הממונה על היישומים המסחריים והתעשייתיים של פירות המחקרים שמבוצעים במכון ויצמן למדע, הגישה בקשה לרישום פטנט על האלגוריתם החדש.
 
ביטוי גנים ברקמת תאים סרטניים של המעי הגס
 

שתף