Google представи невронната мрежа Imagen, която създава картини и фотореалистични изображения от текстово описание
Екипът на Google Brain представи невронна мрежа – художник Imagen, която разпознава текст с помощта на големи езикови модели и след това създава фотореалистична рисунка.
Imagen е генерирала първото изображение с размер 64×64 пиксела, а след това е увеличила разделителната способност до 256×256 и 1024×1024 пиксела, добавяйки детайли по време на процеса. Изкуственият интелект Imagen е надминал по отношение на качеството на картинките.смятания за най-добрия до този момент ИИ DALL-E 2, създаден от OpenAI на Илон Мъск,
„Нашата ключова констатация е, че общите големи езикови модели (като T5), предварително обучени върху текстови масиви, са изненадващо ефективни при кодирането на текст за синтез на изображения: увеличаването на размера на езиковия модел в Imagen значително подобрява както точността на извадката, така и изравняването на изображение и текст“ съобщават разработчиците от Google Brain.
Но освен това екипът на Google докладва за възникнали етични проблеми, които са се появили, въпреки че не навлизат в подробности за обезпокоителното съдържание, генерирано от Imagen. От Google Brain отбелязат, че невронната мрежа „кодира няколко социални пристрастия и стереотипа, включително общо пристрастие към създаване на изображения на хора с по-светъл цвят на кожата и склонност към изображения, изобразяващи различни професии, съответстващи на западните стереотипи за пола“.
Това е така, защото на Imagen са били подавани масиви от данни от интернет без да се осъществява 100% предварителен подбор. Този вид информация често отразява „социални стереотипи, репресивни гледни точки и унизителни или по друг начин вредни асоциации с маргинализирани групи за идентичност“. Много данни в процеса на обучението са били филтрирани заради неподходящо съдържание. Освен това е бил използван масива от данни LAION-400M, който съдържа широк спектър от неподходящо съдържание, включително порнографски изображения, расистки обиди и вредни социални стереотипи.
По тази причина изходният код на Imageн не е представен на обществеността.