דברים שרואים

שתף

ד"ר איתן שרון. חלוקה למרכיבים - פרופ' אחי ברנד, ד"ר מרב גלון, ופרופ' רונן בצרי. תמונה שלמה

לקחת את ידי בידך ואמרת לי
דברים שרואים מכאן, לא רואים משם

מלים: יעקב רוטבליט
לחן: מתי כספי
ביצוע: יהודית רביץ

ספקן: מיליארדי תאי עצב פועלים יחד במוח בתהליך הראייה. מכיוון שכל תא עצב הוא מערכת מורכבת מאוד בפני עצמה, נראה שלא יהיה זה מציאותי לצפות שמחשבים יוכלו לראות.

מדען: זו סיבה טובה להתחיל לעבוד על זה.אם אפשר היה לגרום למחשב לראות, לחקות את תהליך הראייה הטבעי, היו נוספות לחיינו אפשרויות רבות ומלהיבות. מחשבים יוכלו להוות "עין נוספת" שתפעל בחדרי ניתוח ותזעיק את הרופאים כשבעיות כלשהן יחלו להתהוות; יעילותן של מערכות אבטחה תשופר ללא הכר; חנויות גדולות יוכלו להשתמש במחשבים כדי לזהות כשלי תחזוקה או לעקוב אחר חשודים בגניבה; ומפעלי תעשייה יפעילו "עיניים ממוחשבות" כדי לזהות תקלות בפסי ייצור. ואם לא די בכל אלה, הרי שמחקר בתחום זה עשוי לשפוך אור על הדרך שבה המוח שלנו מעבד את הקלט העצבי המגיע אליו מהעיניים שרואות את התמונה שלפנינו.

הבעיה היא בדרך שבה מחשבים "קוראים" דימויים ותמונות. הם רואים אותם כצירוף של ריבועים קטנים ("פיקסלים"), שנושאים רק סוג אחד של מידע: צבע. אבל צבע עשוי להיות מדריך כוזב כשמדובר בהבחנה בין אובייקטים. פרפר צהוב הנמצא על פרח צהוב עשוי להיראות למחשב כחלק מהפרח. ליצן, המציג צבעים רבים, יכול להיראות כמספר אובייקטים שונים. זברה, שלה שני צבעים המתחלפים לסירוגין, יכולה להיראות למחשב כאוסף של סרטים שאין ביניהם קשר.

כדי לפתח את יכולתם של מחשבים לראות החלו כמה מדענים ממכון ויצמן למדע לפעול באסטרטגיית פעולה המתנהלת "מלמטה כלפי מעלה". באסטרטגיה זו תהליך ניתוח המידע מתחיל מפיקסל בודד. כלומר, בשלב הראשון מבצע המחשב השוואה בין כל פיקסל בתמונה למשנהו, לפי צבע. כשנוצרות קבוצות פיקסלים המאורגנות לפי הצבע, עובר המחשב להשוואה בין הקבוצות, אלא שהפעם הוא מוסיף להשוואת צבע מדדים מורכבים יותר: טקסטורה (הפסים השחורים והלבנים של הזברה מתגלים כ"טקסטורה" הקיימת בתוך אובייקט אחד ויחיד); צורה (כל פיקסל בודד דומה בתכלית לכל פיקסל בודד אחר, אבל קבוצות של פיקסלים יוצרות צורות רבות ושונות); ועוד. קבוצות שמדדים רבים משותפים להן ייחשבו על-ידי המחשב כחלקים שונים של אובייקט אחד, או של קבוצה גדולה שתושווה לקבוצות גדולות אחרות. ככל שהקבוצות גדולות יותר, המדדים להשוואה ביניהן נעשים רבים ומורכבים יותר. ריבוי הגורמים ומורכבותם מקטין מאוד את טווח הטעות האפשרית של המחשב המפרש את התמונה הנצפית. בדרך זו הצליחו מדעני המכון להשיג שיפור ניכר ביכולתו של המחשב להבחין בין אובייקטים שונים. את המחקר ביצע ד"ר איתן שרון, במסגרת עבודת דוקטורט שהכין בהנחייתם של פרופ' אחי ברנד ופרופ' רונן בצרי, בהשתתפות ד"ר מרב גלון, כולם מהמחלקה למדעי המחשב ומתמטיקה שימושית במכון ויצמן למדע.

התהליך החדש של עיבוד המידע החזותי אמנם מורכב למדי, אבל על-אף זאת הוא מבוצע במהירות רבה יותר בהשוואה לזמן שנדרש לתהליכים אחרים לעיבוד תמונה, שמידת מורכבותם דומה. גורם היתרון כאן הוא המיעוט היחסי של מדדים המושווים בשלביו הראשונים של התהליך, כאשר המחשב משווה פיקסלים בודדים או קבוצות קטנות. התוצאות המתקבלות בחישובים ראשוניים אלה מסייעות באופן מצטבר להשגת הפתרונות בשלבים המתקדמים והמורכבים יותר של התהליך.

משמאל: תמונות רגילות של נמר ודב. מימין: הדרך שבה מחשב מפרש את התמונות כשהוא מחלק אותן לאובייקטים שונים (כל צבע מייצג אובייקט)

הינך נמצא כאן

שתף

שתף