Энтузиаст задействовал нейросеть Stable Diffusion для обработки селфи

Немецкий энтузиаст Фабиан Штельцер использовал онлайн-инструменты на базе популярной нейросети Stable Diffusion для обработки своих селфи в разных стилях. Он популяризировал подобные алгоритмические системы и сделал их вирусными, пишет Motherboard.

Штельцер задействовал программы, которые несколько раз вносят пользовательские настройки в генератор изображений по тексту.

Он создал селфи в различных стилях живописи, жанрах фильмов и по своим задумкам вроде фото из «Вудстока» или в образе женщины.

Stable Diffusion от стартапа Stability AI — одна из многих ИИ-систем, генерирующая изображения по запросу. Разработчики обучили алгоритм на миллиардах аннотированных и размеченных картинок. 

Нейросеть можно натренировать ассоциировать конкретные слова и фразы с определенными типами изображений, эстетикой, местами или объектами. Благодаря этому появились веб-сайты, позволяющие пользователям «регулировать» модель и добавлять собственные встраивания.

Создатели сервиса drawanyone утверждают, что их инструмент способен обработать фото по пяти исходным снимкам всего за час. Несколько человек продемонстрировали свои ИИ-селфи в треде под Twitter-постом Штельцера.

По словам энтузиаста, его поразило качество работы системы, так как потребовалось всего несколько эталонных изображений для «внедрения себя» в модель.

«Загруженные мной селфи, возможно, немного одинаковые, поэтому я буду заново тренировать инструмент на более разнообразном наборе поз и выражений», — сказал он.

Штельцер также занимается другими ИИ-проектами, включая разработку полнометражного мультисюжетного фильма «Соль». Он задействует алгоритмы вроде Stable Diffusion, Midjourney и DALL-E 2 для создания кадров и модели генерации звука, включая Synthesia и Murf. За написание сценария отвечает нейросеть GPT-3.

По мере появления каждого фрагмента фильма зрители могут проголосовать за один из вариантов продолжения.

«[ИИ-системы] по крайней мере, так же велики, как открытие фотографии или кино, а если мы включим языковые модели вроде GPT-3, то, вероятно, это можно сравнить с изобретением печатного станка. Влияние на средства массовой информации, культуру и ткань реальности станет довольно глубоким», — заявил Штельцер.

Энтузиаст отметил, что принятое Stability AI решение о публикации исходного кода сделает алгоритм безопаснее закрытых корпоративных проектов.

«Такими системами тоже пользуются злоумышленники. Однако с подобными проектами работают меньше пользователей, способных грамотно задействовать инструмент», — добавил он.

Напомним, в октябре энтузиаст задействовал Stable Diffusion для создания постоянно меняющихся виртуальных миров.

В том же месяце ИИ-исследователь научил нейросеть превращать «кого угодно» в покемонов.

В августе Stability AI предоставила более 1000 разработчикам доступ к генератору изображений по тексту Stable Diffusion, а позже открыла его для широкой аудитории.

Подписывайтесь на наш Telegram и будьте в курсе последних новостей!
Чтобы оставить комментарий необходимо или зарегистрироваться