AI מבאס לצלם תמונות חתול מקסימות, מחמיץ בבירור את כל נקודת האינטרנט

Send

בינה מלאכותית (AI) ניסתה לאחרונה ליצור צילומי חתול מאפס, והתוצאות היו אסטרופיות של חתולים.

הרשת העצבית הספציפית הזו (סוג של AI שעוצב על פי פעולות המוח האנושי) יכולה לייצר תמונות מקוריות מציאותיות להפליא של פנים אנושיות. למעשה, תמונותיהם של האנשים המורכבים הללו כמעט בלתי אפשריים לצופים אנושיים להבדיל מתמונות של אנשים אמיתיים, כך דיווחו מתכנתי ה- AI במחקר שפורסם בדצמבר 2018 לכתב העת הקדום arXiv.

עם זאת, פלינס התגלה כסיפור אחר. אותו אלגוריתם שיצר פנים אנושיות ללא רבב יצר חתולים עם ראשים מעוצבים; המספר הלא נכון של העיניים והרגליים; וגופים שהיו ארוכים מדי, קצרים מדי, סיבובים או מלבניים בצורה בלתי רגילה, וכפופים בזוויות מוזרות.

מנוע ה- AI שהפיק את צילומי החתול המפחיד הוא מה שמכונה "ארכיטקטורת גנרטורים מבוססת-סגנון לרשתות אדפרסיביות גנריות", או StyleGAN. רשתות כמו אלה הן "היריבות" מכיוון ששני דגמים עובדים במקביל: האחד מייצר תמונות, ואחר מעריך את התוצאות מול תמונות במערך נתוני אימונים, כך שהרשת לומדת מהטעויות שלה ומשפרת את הביצועים שלה, אמר המחקר.

כדי שה- AI ייצר דימויים אנושיים חיים, היה עליו קודם "ללמוד" איך נראו פרצופים אנושיים מהתמונות הקיימות. האלגוריתם שבר את הפנים למטה לרשימה של תכונות סגנון, כמו מיקום ראש; מין; צבע עור; מרקם שיער וסגנון; החוקרים דיווחו וצורת העיניים, האף והפה.

ברגע ש- StyleGAN הצליחה לזהות את כל אותם גורמים - ללא פיקוח אנושי - היא למדה להרכיב אותם באופן עצמאי כדי ליצור פנים אנושיות לגמרי-פוטו-ריאליות. החוקרים סירבו לבקשת ראיון אך הסבירו את התהליך שלהם בסרטון שהועלה ל- YouTube ב- 12 בדצמבר 2018.

אז, מדוע StyleGAN לא יכול היה ליצור תמונות חתול ריאליסטיות להפליא? האלגוריתם עשה כמיטב יכולתו עם מה שהיה צריך לעבוד איתו - וכשמדובר בחתולים, אלפי תמונות הייחוס בהן השתמשו היו פחות אידיאליות, אמרה ג'נל שיין, חוקרת שמכשירה רשתות עצביות, אך לא הייתה מעורבת בתחום ללמוד, אמר לייב מדע.

שיין כתבה על החתולים המוזרים ב- 7 בפברואר בבלוג שלה AI Weirdness. בניגוד לסט נתוני הצילום של StyleGAN של פרצופים אנושיים - בהם גופות ורקעים נכרתו ומיקומי הראש דומים זה לזה - תמונות החתול במערך הנתונים שונות מאוד. הקולקציה כוללת צילומי תקריב ויריות רחבות של חתולים במגוון הגדרות ועל רקע תפאורה שונה. חלק מהתמונות הראו חתול אחד, חלקן כללו חתולים מרובים ואחרות גם אנשים.

"יש חתולים הפוכים; יש חתולים מכורבלים בכדור; העיניים שלהם פקוחות; העיניים שלהם עצומות. אתה בהחלט יכול לדעת שנתוני הקלט שלהם קצת רועשים - ועל ידי רועש, אני מתכוון שיש שם דברים שם זו לא סתם תמונה של חתול, "אמר שיין.

אז, אל תתקשו יותר מדי על StyleGan בגלל המאמנים המחרידים שלה של חתולים מסויטים.

שיין קורה שהאלגוריתם צריך ללמוד, "הוסיף שיין.

בעוד שבני האדם הצלם-ריאליסטיים של StyleGAN היו ללא רבב, הרשת העצבית נאבקה בהרכבת שקיות. (קרדיט תמונה: Nvidia)

רמזים חזותיים סותרים הקשו על StyleGAN ללמוד איך נראה חתול אמיתי. ולרשתות עצביות אין הקשר בעולם האמיתי למידע שהם נותנים; כל מה שהם יודעים זה מה שיש במערכות הנתונים שלהם. StyleGAN למדה מספיק מצילומי הייחוס בכדי לשחזר במדויק פרטים וטקסטורות בקנה מידה קטן, כמו פרוות חתול או צורת אוזן חתולית. אבל ברור שהתוכנית נאבקה בהרכבת החתול כולו, אמר שיין.

"הרשת העצבית לא מבינה איך חתולים עובדים. היא לא מבינה כמה רגליים יש להם. לא ממש ברור כמה עיניים יש להם או לאן כל האנטומיה שלהם הולכת," היא אמרה ל- Live Science.

צפו בתמונות נוספות של חתולים מטרידים של StyleGAN, תמונות אנוש מושלמות כמעט וקבצי פרויקט אחרים בפלטפורמת הפיתוח GitHub.

Send