המונה ליזה המונפשת הזו נוצרה על ידי AI והיא מפחידה

Send

החיוך האניגמטי, המצויר, של "מונה ליזה" ידוע ברחבי העולם, אך הפרצוף המפורסם הזה הציג לאחרונה מגוון חדש של ביטויים, באדיבות בינה מלאכותית (AI).

בסרטון שהשתתף ביוטיוב ב- 21 במאי, שלושה קטעי וידיאו מראים דוגמאות מביכות של המונה ליזה כשהיא מניעה את שפתיה ומסובבת את ראשה. היא נוצרה על ידי רשת עצבית מפותלת - סוג של AI שמעבד מידע כמו שעושה מוח אנושי, לצורך ניתוח ועיבוד תמונות.

חוקרים הכשירו את האלגוריתם להבין את צורותיהם הכלליות של תווי הפנים וכיצד הם מתנהגים יחסית זה לזה, ואז ליישם את המידע הזה על תמונות סטילס. התוצאה הייתה רצף וידיאו מציאותי של הבעות פנים חדשות ממסגרת יחידה.

בסרטוני המונה ליזה, ה- AI "למד" תנועת פנים ממערכות נתונים של שלושה נושאים אנושיים, והפיק שלוש אנימציות שונות מאוד. בעוד שכל אחד משלושת הקליפים עדיין היה ניתן לזהות את המונה ליזה, וריאציות במראה וההתנהגות של דוגמניות ההדרכה השאילו "אישים" מובחנים ל"דיוקנאות החיים ", Egor Zakharov, מהנדס במכון סקולקובו למדע וטכנולוגיה, ו מרכז ה- AI של סמסונג (שניהם ממוקמים במוסקבה), הסביר בסרטון.

זכארוב ועמיתיו הפיקו גם אנימציות מתמונות של אייקונים תרבותיים של המאה העשרים כמו אלברט איינשטיין, מרילין מונרו וסלבדור דאלי. החוקרים תיארו את הממצאים שלהם, שלא נבדקו על ידי עמיתים, במחקר שפורסם באינטרנט ב- 20 במאי בכתב העת preprint arXiv.

פרצופים מוכרים מקבלים ביטויים לא מוכרים. (קרדיט תמונה: א. זחרוב ואח ')

הפקת קטעי וידאו מקוריים כמו אלה, המכונים זיופים עמוקים, אינה דבר קל. ראשים אנושיים מורכבים גיאומטרית ודינאמיים מאוד; מודלים תלת-ממדיים של ראשים כוללים "עשרות מיליוני פרמטרים", כתבו מחברי המחקר.

יתר על כן, מערכת הראייה האנושית טובה מאוד בזיהוי "אפילו טעויות קלות" בראשים אנושיים המוצלים בתלת מימד, כך עולה מהמחקר. רואים משהו שנראה כמעט אנושי - אך לא ממש - מעורר תחושה של אי נוחות עמוקה המכונה אפקט העמק המטורלל.

AI הוכיחה בעבר כי ייצור זיופים עמוקים משכנע אפשרי, אך הוא דרש מספר זוויות של הנושא הרצוי. לצורך המחקר החדש, המהנדסים הציגו את ה- AI למערך נתונים גדול מאוד של סרטוני עזר המראים פנים אנושיות בפעולה. המדענים הקימו ציוני פנים שיחולו על כל פנים, כדי ללמד את הרשת העצבית כיצד פרצופים מתנהגים באופן כללי.

לאחר מכן, הם הכשירו את ה- AI להשתמש בביטויי ההתייחסות למיפוי תנועה של תכונות המקור. הדבר איפשר ל- AI ליצור זיוף עמוק גם כאשר הייתה לו רק תמונה אחת לעבוד ממנה, כך דיווחו החוקרים.

ותמונות מקור נוספות סיפקו תוצאה מפורטת עוד יותר בהנפשה הסופית. סרטונים שנוצרו מתוך 32 תמונות, ולא רק אחת, השיגו "ריאליזם מושלם" במחקר משתמשים, כתבו המדענים.

Send