Энтузиаст задействовал нейросеть Stable Diffusion для обработки селфи

Немецкий энтузиаст Фабиан Штельцер использовал онлайн-инструменты на базе популярной нейросети Stable Diffusion для обработки своих селфи в разных стилях. Он популяризировал подобные алгоритмические системы и сделал их вирусными, пишет Motherboard.

Штельцер задействовал программы, которые несколько раз вносят пользовательские настройки в генератор изображений по тексту.

https://twitter.com/fabianstelzer/status/1579818101134106626

Он создал селфи в различных стилях живописи, жанрах фильмов и по своим задумкам вроде фото из «Вудстока» или в образе женщины.

https://twitter.com/fabianstelzer/status/1579818111246958593

Stable Diffusion от стартапа Stability AI — одна из многих ИИ-систем, генерирующая изображения по запросу. Разработчики обучили алгоритм на миллиардах аннотированных и размеченных картинок.

Нейросеть можно натренировать ассоциировать конкретные слова и фразы с определенными типами изображений, эстетикой, местами или объектами. Благодаря этому появились веб-сайты, позволяющие пользователям «регулировать» модель и добавлять собственные встраивания.

Создатели сервиса drawanyone утверждают, что их инструмент способен обработать фото по пяти исходным снимкам всего за час. Несколько человек продемонстрировали свои ИИ-селфи в треде под Twitter-постом Штельцера.

https://twitter.com/voidwalker_com/status/1579841554298331141

По словам энтузиаста, его поразило качество работы системы, так как потребовалось всего несколько эталонных изображений для «внедрения себя» в модель.

«Загруженные мной селфи, возможно, немного одинаковые, поэтому я буду заново тренировать инструмент на более разнообразном наборе поз и выражений», — сказал он.

https://twitter.com/fabianstelzer/status/1579818105672302592

Штельцер также занимается другими ИИ-проектами, включая разработку полнометражного мультисюжетного фильма «Соль». Он задействует алгоритмы вроде Stable Diffusion, Midjourney и DALL-E 2 для создания кадров и модели генерации звука, включая Synthesia и Murf. За написание сценария отвечает нейросеть GPT-3.

По мере появления каждого фрагмента фильма зрители могут проголосовать за один из вариантов продолжения.

«[ИИ-системы] по крайней мере, так же велики, как открытие фотографии или кино, а если мы включим языковые модели вроде GPT-3, то, вероятно, это можно сравнить с изобретением печатного станка. Влияние на средства массовой информации, культуру и ткань реальности станет довольно глубоким», — заявил Штельцер.

Энтузиаст отметил, что принятое Stability AI решение о публикации исходного кода сделает алгоритм безопаснее закрытых корпоративных проектов.

«Такими системами тоже пользуются злоумышленники. Однако с подобными проектами работают меньше пользователей, способных грамотно задействовать инструмент», — добавил он.

Напомним, в октябре энтузиаст задействовал Stable Diffusion для создания постоянно меняющихся виртуальных миров.

В том же месяце ИИ-исследователь научил нейросеть превращать «кого угодно» в покемонов.

В августе Stability AI предоставила более 1000 разработчикам доступ к генератору изображений по тексту Stable Diffusion, а позже открыла его для широкой аудитории.

Энтузиаст задействовал нейросеть Stable Diffusion для обработки селфи

Комментарии

Добавить комментарий Отменить ответ