fbpx

Google представи невронната мрежа Imagen, която създава картини и фотореалистични изображения от текстово описание

Екипът на Google Brain представи невронна мрежа – художник Imagen, която разпознава текст с помощта на големи езикови модели и след това създава фотореалистична рисунка.

Imagen е генерирала първото изображение с размер 64×64 пиксела, а след това е увеличила разделителната способност до 256×256 и 1024×1024 пиксела, добавяйки детайли по време на процеса. Изкуственият интелект Imagen е надминал по отношение на качеството на картинките.смятания за най-добрия до този момент ИИ DALL-E 2, създаден от OpenAI на Илон Мъск,

Изображения, генерирани от текст Източник: Google Brain

„Нашата ключова констатация е, че общите големи езикови модели (като T5), предварително обучени върху текстови масиви, са изненадващо ефективни при кодирането на текст за синтез на изображения: увеличаването на размера на езиковия модел в Imagen значително подобрява както точността на извадката, така и изравняването на изображение и текст“ съобщават разработчиците от Google Brain.

Но освен това екипът на Google докладва за възникнали етични проблеми, които са се появили, въпреки че не навлизат в подробности за обезпокоителното съдържание, генерирано от Imagen. От Google Brain отбелязат, че невронната мрежа „кодира няколко социални пристрастия и стереотипа, включително общо пристрастие към създаване на изображения на хора с по-светъл цвят на кожата и склонност към изображения, изобразяващи различни професии, съответстващи на западните стереотипи за пола“.

Това е така, защото на Imagen са били подавани масиви от данни от интернет без да се осъществява 100% предварителен подбор. Този вид информация често отразява „социални стереотипи, репресивни гледни точки и унизителни или по друг начин вредни асоциации с маргинализирани групи за идентичност“. Много данни в процеса на обучението са били филтрирани заради неподходящо съдържание. Освен това е бил използван масива от данни LAION-400M, който съдържа широк спектър от неподходящо съдържание, включително порнографски изображения, расистки обиди и вредни социални стереотипи.

По тази причина изходният код на Imageн не е представен на обществеността.

Източник

0 0 votes
Article Rating
guest
0 Comments
Inline Feedbacks
View all comments

Харесайте ни :-)


This will close in 25 seconds

Дари
0
Would love your thoughts, please comment.x
()
x