מערכת הראייה מזהה עצמים הודות ליכולתה ללמוד "יחידות זיהוי אטומיות"

הינך נמצא כאן

מדעני המכון גילו, כי מערכת הראייה מזהה עצמים הודות ליכולתה ללמוד "יחידות זיהוי אטומיות". ממצאים אלה מעידים, שזיהוי חזותי מקודד היטב במוח האדם.

מימין: ד"ר דני הררי, פרופ שמעון אולמן וליאב אסיף. ראייה ממוחשבת

די בקו מעוקל ובשתי נקודות המונחות מעליו כדי להעלות במוחנו דימוי של פני אדם. יתרה מזאת, די בהם כדי שנוכל לזהות, בקלות, האם האדם המאויר שמח או עצוב. חוקרי מוח, מדעני מחשב ומהנדסי רובוטיקה שואפים להבין כיצד פועל מנגנון זיהוי זה – בבני-אדם ובמערכות ממוחשבות כאחד. מדעני מכון ויצמן למדע, שעבדו בשיתוף עם מדענים מהמכון לטכנולוגיה של מסצ'וסטס (MIT), גילו שקיימת יחידה "אטומית" של זיהוי – כמות מינימלית של מידע שדימוי מסוים חייב להכיל כדי שמנגנון הזיהוי יוכל לפעול. במאמר שפורסם באחרונה בכתב-העת המדעי "רשומות האקדמיה הלאומית למדעים של ארה"ב" (PNAS), מצביעים המדענים על הבדלים בסיסיים בין מנגנון הזיהוי בבני-האדם לבין המודלים הקיימים. הבנת ההבדלים האלה עשויה אף לתרום לתיכנון מערכות ראייה ממוחשבות מתקדמות.

פרופ' שמעון אולמן וד"ר דניאל הררי, יחד עם החוקר ליאב אסיף ותלמיד המחקר איתן פתייה, מהמחלקה למדעי המחשב ומתמטיקה שימושית במכון ויצמן למדע, הישוו את מנגנון הזיהוי של מודלים ממוחשבים של ראייה ממוחשבת ליכולות העין האנושית. לשם כך הם גייסו אלפי משתתפים, וביקשו מהם לזהות סדרת תמונות. בחלק מהתמונות לא נחשף האובייקט במלואו, ואחרות הוצגו בהפרדה נמוכה והיו מטושטשות.

המשתתפים במחקר הצליחו, יותר מהמודלים הממוחשבים, לזהות תמונות חלקיות או מטושטשות, אך כל המשתתפים נכשלו באותה הנקודה. "אובדן של כמות מידע מזערית בתמונה זו או אחרת הפך את הקערה על פיה", מסביר פרופ' אולמן. "נראה שקיימת נקודה שבה הדימוי החזותי מפסיק לייצר משמעות בעבור מוח האדם, שכן התגלה מעבר חד ומשותף לרוב הנבדקים בין תמונות שניתן לזהותן לבין תמונות דומות מאוד, שזיהוין נכשל".

שינוי מזערי בכמות המידע החזותי בתמונות עשוי לגרום להפחתה משמעותית ביכולת האנושית לזהות את הדימוי החזותי. למעלה: תמונות "אטומיות" המאפשרות זיהוי של הדימוי; למטה: תמונות מתחת לסף המינימלי, שאינן מאפשרות זיהוי. המספרים לצד כל תמונה מציינים את שיעור הזיהוי מבין כלל הנבדקים במחקר

ממצאים אלה מעידים על כך, שלא משנה מה הם ניסיון חיינו או הכשרתנו – זיהוי חזותי מקודד היטב במוח האדם, ופועל באורח דומה אצל כולנו. המדענים מציעים שהפערים שהתגלו במחקר נבעו מאופן הסריקה של הדימויים במודלים הממוחשבים, כלומר "מלמטה למעלה": הם מתחילים מהמרכיבים הפשוטים שמופיעים בתמונה, ועוברים, בהדרגה, לפרטים מורכבים יותר. מוח האדם, לעומת זאת, נוקט כמה שיטות שונות במקביל, ואף משווה את מרכיבי התמונה לספריית הדימויים המאוחסנת במאגר הזיכרון שלו.

המחקר מעיד על אפשרות קיומו של מרכיב בסיסי במוח אשר מסוגל לפענח דימוי חזותי מורכב על-פי מעט מאוד מידע. שילובו של מנגנון כזה במודלים הממוחשבים הקיימים עשוי לשפר במידה ניכרת את יכולתם לזהות דימויים. הבנה טובה יותר של מנגנון זה עשויה לתרום גם למחקרים עתידיים הקשורים בתיפקוד מוחי, ולפיתוחן של מערכות ראייה ממוחשבות, שיעלו במידה רבה על אלה הקיימות ברשותנו כיום. אפשר למצוא פרטים נוספים באתר המחקר.

יכולתם של הנבדקים לזהות דימוי מסוים פחתה ב-67% כאשר תכולת התמונה (רזולוציה או גודל) הייתה נמוכה יותר מתצורת הזיהוי המינימלית שקבעו המדענים.​

#מספרי_מדע

לקבלת מידע נוסף, תמונות ולתיאום ראיונות:
משרד הדובר - מכון ויצמן למדע
08-9343856 news@weizmann.ac.il

שתף