Энтузиаст задействовал нейросеть Stable Diffusion для обработки селфи
Просмотров: 1
Немецкий энтузиаст Фабиан Штельцер использовал онлайн-инструменты на базе популярной нейросети Stable Diffusion для обработки своих селфи в разных стилях. Он популяризировал подобные алгоритмические системы и сделал их вирусными, пишет Motherboard.
Штельцер задействовал программы, которые несколько раз вносят пользовательские настройки в генератор изображений по тексту.
Он создал селфи в различных стилях живописи, жанрах фильмов и по своим задумкам вроде фото из «Вудстока» или в образе женщины.
Stable Diffusion от стартапа Stability AI — одна из многих ИИ-систем, генерирующая изображения по запросу. Разработчики обучили алгоритм на миллиардах аннотированных и размеченных картинок.
Нейросеть можно натренировать ассоциировать конкретные слова и фразы с определенными типами изображений, эстетикой, местами или объектами. Благодаря этому появились веб-сайты, позволяющие пользователям «регулировать» модель и добавлять собственные встраивания.
Создатели сервиса drawanyone утверждают, что их инструмент способен обработать фото по пяти исходным снимкам всего за час. Несколько человек продемонстрировали свои ИИ-селфи в треде под Twitter-постом Штельцера.
По словам энтузиаста, его поразило качество работы системы, так как потребовалось всего несколько эталонных изображений для «внедрения себя» в модель.
«Загруженные мной селфи, возможно, немного одинаковые, поэтому я буду заново тренировать инструмент на более разнообразном наборе поз и выражений», — сказал он.
Штельцер также занимается другими ИИ-проектами, включая разработку полнометражного мультисюжетного фильма «Соль». Он задействует алгоритмы вроде Stable Diffusion, Midjourney и DALL-E 2 для создания кадров и модели генерации звука, включая Synthesia и Murf. За написание сценария отвечает нейросеть GPT-3.
По мере появления каждого фрагмента фильма зрители могут проголосовать за один из вариантов продолжения.
«[ИИ-системы] по крайней мере, так же велики, как открытие фотографии или кино, а если мы включим языковые модели вроде GPT-3, то, вероятно, это можно сравнить с изобретением печатного станка. Влияние на средства массовой информации, культуру и ткань реальности станет довольно глубоким», — заявил Штельцер.
Энтузиаст отметил, что принятое Stability AI решение о публикации исходного кода сделает алгоритм безопаснее закрытых корпоративных проектов.
«Такими системами тоже пользуются злоумышленники. Однако с подобными проектами работают меньше пользователей, способных грамотно задействовать инструмент», — добавил он.
Напомним, в октябре энтузиаст задействовал Stable Diffusion для создания постоянно меняющихся виртуальных миров.
В том же месяце ИИ-исследователь научил нейросеть превращать «кого угодно» в покемонов.
В августе Stability AI предоставила более 1000 разработчикам доступ к генератору изображений по тексту Stable Diffusion, а позже открыла его для широкой аудитории.