מחקר: AI טועה בהערכת גיל פי שניים יותר מבני אדם

זיהוי פנים היפסטר קשיש (צילום: Prostock-studio, Shutterstock) — כשל בזיהוי פנים של אדם מבוגר. "הגיל הוא קריטי עבור הרשתות כשהן ניגשות ללקוחות" | צילום: Prostock-studio, Shutterstock

בניגוד למה שאנחנו חושבים על עצמנו, רובנו מפספסים כשאנחנו מנסים להעריך את גילו של אדם שלפנינו. מחקר חדש שנערך באוניברסיטת בן גוריון בנגב, שהתפרסם בכתב העת Scientific Reports, מצא דבר מפתיע: ממש כמו בני אדם - גם בינה מלאכותית טועה בהערכת גילם של אנשים, אבל מידת הטעות גדולה יותר מהטעות האנושית, מה שעלול להוות בעיה במערכות שנעשות נפוצות לזיהוי גיל של לקוחות בחנויות, גיל של מועמדים לעבודה ועוד.

עורכי המחקר הם פרופ' צבי גנאל מהמחלקה לפסיכולוגיה ופרופ' כרמל סופר מהמחלקה למדעי המוח והקוגניציה, בשיתוף פרופ' מלווין גודייל מאוניברסיטת מערב אונטריו בקנדה. החוקרים אספו נתונים של פעילות 21 מערכות AI מסחריות, בהן מערכות של מיקרוסופט, אמזון, Everypixel וכן מערכות לא מסחריות, שמספקות הערכת גיל על פי ניתוח צילום פנים. התוצאות של הבינה המלאכותית הושוו לתוצאות של 30 סטודנטים וסטודנטיות מאוניברסיטת בן גוריון בנגב.

ההשוואה העלתה שהבינה המלאכותית סובלת מהטיות דומות לבני אדם, אם כי במינון חמור יותר. אחת ההטיות המוכרות לחוקרים, לדוגמה, היא שבני האדם נוטים להעריך פרצופים מחייכים כמבוגרים יותר בהשוואה לאותם פרצופים עם הבעה ניטרלית. הטיה נוספת היא שבני אדם נוטים להערכת אנשים זקנים כצעירים יותר מגילם האמיתי ולהיפך – צעירים כמבוגרים יותר מגילם האמיתי. יש גם פערים בין הערכת גיל של נשים להערכת גיל של גברים. הבינה המלאכותית טעתה בכל הטעויות האלה, ובמידה חמורה יותר.

פרופ' צבי גנאל: "פרצופים מחייכים נתפסים מבוגרים יותר ובאופן פחות מדויק מפרצופים ניטרליים, פרצופי נשים נתפסים באופן פחות מדויק מפרצופי גברים. אלו נתונים שהראינו בעבר אצל נבדקים אנושיים וכעת אנו מבינים שתופעה זו קיימת ובצורה חזקה יותר גם ב- AI"

פרופ' גנאל, פסיכולוג קוגנטיבי שמחקריו מתמקדים בין השאר בתפיסה האנושית של פרצופים וגיל, אומר שההטיה אצל בני אדם נאמדת בהפרש של שנה-שנתיים לעומת הגיל האמיתי, ואילו במערכות AI ההפרש לעומת הגיל האמיתי כפול.

איך אתה מסביר את זה?
"כשאני מנסה להעריך מה הגיל של אדם מחייך, אני יודע שהוא מחייך ואולי יש לזה אפקט מקטין על ההטייה, עצם זה שאני מודע לקטגוריה – אדם מחייך. ב-AI אין תהליכים מתערבים ואין קטגוריזציה. הם זורקים את כל הפרצופים מכל הגזעים עם כל ההבעות לתוך מקשה אחת ורואים מה יוצא".

מערכות AI מבוססות על תיוג שנעשה על ידי בני אדם, שכמובן סובלים מהטיות. כמה זה מפתיע שהתוצאה היא בינה מלאכותית עם הטיות גדולות יותר מהמתייגים שלה?
"זה מפתיע. בכל דבר שבדקנו ה-AI טעה באופן חמור יותר מבני אדם. זה מפתיע גם כי זה יחסית אמור להיות יותר פשוט ל-AI, למשל להתעלם מקמטי הבעה. ככל שחשבתי על זה, הדרך שמערכות AI יכולות להשתפר תהיה דרך התמקצעות שלהן, במובן של לבנות רשתות ספציפיות לקטגוריות, ואז הן ישתפרו ואולי יעקפו את הביצועים האנושיים. כשאתה יוצר רשת כללית עם כל הגזעים, ההבעות, הגילאים, אתה מייצר ממוצע של הקטגוריות השונות. אם היית בונה רשת רק לפרצופים מחייכים היא היתה יותר טובה מרשת כללית של פרצופים".

פרופ' צבי גנאל (צילום: דני מכליס, אוניברסיטת בן-גוריון בנגב) — פרופ' צבי גנאל. "ב-AI זורקים את כל הפרצופים מכל הגזעים עם כל ההבעות לתוך מקשה אחת ורואים מה יוצא" | צילום: דני מכליס, אוניברסיטת בן-גוריון בנגב

המדרון החלקלק של הבינה המלאכותית

החוקרים התחברו למערכות ה-AI דרך קוד API שכל המערכות האלה מציעות כיום. לדברי פרופ' גנאל כל החברות מציעות כיום יכולת להעריך את גיל האדם לצד תכונות אחרות שלו. לדבריו יש לטכנולוגיה ערך רב עבור שימושים מסחריים וכך למשל רשתות סופרמרקט באירופה משתמשות בזיהוי גיל של הלקוח כדי לאשר רכישת אלכוהול על ידו. שימושים אחרים כוללים התאמה של השירות ושל המוצר לגילו של הלקוח, הבטחת סיוע ללקוחות מבוגרים, התאמת קוסמטיקה לפי גיל הלקוחות ועוד. "הגיל הוא קריטי עבור הרשתות כשהן ניגשות ללקוחות", הוא אומר, "יש פה הבטחה מאוד גדולה וזו הסיבה שמצאתי כל כך הרבה אפליקציות שמזהות גיל, גם בתשלום וגם חינמיות".

כעת עוסקים החוקרים כבר במחקר הבא שלהם בתחום AI וגיל, והפעם מערכות שמייצרות באמצעות AI תאומים דיגיטליים של בני אדם או דמויות תלת ממדיות של בני אדם, למשל למשחקים או למטאוורס. "זה משהו שעכשיו תופס תאוצה, אז אנחנו יוצרים קשר עם חברות שמייצרות פרצופים ובודקים אם יש הטיית גיל תוך כדי ייצור פרצופים מלאכותיים והאם AI יזהה את הגיל של הפרצופים המלאכותיים".

מעבר לנתונים שהתקבלו מהמחקר, דפוסי השגיאות וההטיות שהתגלו בתוצאות יכולים לספק מספר תובנות לגבי האופן שבו ניתן לשפר טכנולוגיות AI להערכת גיל מפרצופים."פרצופים מחייכים נתפסים מבוגרים יותר ובאופן פחות מדויק מפרצופים ניטרליים, פרצופי נשים נתפסים באופן פחות מדויק מפרצופי גברים. אלו נתונים שהראינו בעבר אצל נבדקים אנושיים וכעת אנו מבינים שתופעה זו קיימת ובצורה חזקה יותר גם ב- AI, ביחס לנבדקים אנושיים. עם ההבנה הזו ניתן לעשות שימוש יעיל יותר בטכנולוגיות AI קיימות", סיכם פרופ' גנאל.

מצאתם טעות לשון?