Новости

Компьютер нарисовал птицу по текстовому описанию

Как пишет издание «Хайтек», в Microsoft изобрели алгоритм, который нарисовал птицу с чистого листа, используя только текстовую подсказку. При этом бот не выбирал изображение из базы данных, а продемонстрировал настоящий акт творчества.

Современный ИИ умеет распознавать объекты на фото – по такому принципу поисковые системы ищут похожие картинки в Сети. Работники Microsoft решили дать машине более сложное задание: создать изображение по описанию: «желтая птица с черными крыльями и коротким клювом», и ИИ справился.

На рисунке, выполненном ботом, – неизвестная науке желтая птица, похожая на фотографию или реалистичное изображение. Это существо полностью является плодом «воображения» ИИ, каждый пиксель которого создавался с нуля.

Алгоритм еще будет оттачиваться, и в будущем технология, возможно, воплотится в приложение для написания картин, создания планов интерьеров и редактирования фотографий, работающее на голосовом управлении. Пока это выглядит совсем утопично, но в планах разработчиков – отрисовка анимационных фильмов по одному лишь текстовому сценарию.

Глава команды разработчиков Сяодун Хэ рассказал о том, как создавался алгоритм. Сначала проводились исследования машинного зрения и обработки речи посредством CaptionBot – это система на основе ИИ, генерирующая подписи к фото. После была создана программа SeeingAI, которая умеет отвечать на вопросы об изображении и может стать полезной людям с нарушениями зрения.

ИИ-технология, позволяющая рисовать образы на основе описания, создана из двух компонентов: Generative Adversarial Network – бота, генерирующего изображения, и дискриминатора, оценивающего их качество и релевантность. Методом машинного обучения у CaptionBot сформировали понимание соответствий между подписями и картинками.

Как сказал разработчик С. Хэ, программа является своеобразным компьютерным аналогом внимания художника, который переносит на холст неясный образ и не имеет представления о конечном результате. Мозг человека выделяет из потока деталей основные черты, и они становятся основой рисунка, – ИИ действует по схожему принципу.

Смотрите также