В сотрудничестве с Калифорнийским университетом, Apple представила новый инновационный проект в области искусственного интеллекта, известный как MGIE. Этот инструмент предлагает революционный подход к редактированию фотографий, где пользователи могут управлять изображениями, используя текстовые инструкции.

MGIE базируется на передовых мультимодальных языковых моделях (MLLM), которые анализируют запросы пользователей и преобразуют их в конкретные действия на изображении. Это позволяет осуществлять различные модификации фотографий: от простых коррекций, таких как изменение яркости или контрастности, до более сложных операций, например, применение художественных эффектов или трансформация отдельных элементов изображения.

Пользователи MGIE могут не только корректировать общий вид фотографии, но и тонко настраивать различные аспекты, такие как форма, размер и текстура объектов. Помимо стандартных инструментов редактирования, таких как обрезка или изменение размера, MGIE предлагает также и более креативные функции, включая изменение фона, добавление или удаление элементов со сцены, что делает его незаменимым для фотохудожников, дизайнеров и других профессионалов в области графического контента.

Благодаря публикации открытого исходного кода и обученных моделей на платформе GitHub, MGIE становится доступным для широкого круга пользователей, интересующихся исследованиями в области искусственного интеллекта в фотографии. Также существует возможность онлайн-тестирования MGIE через веб-сайт Hugging Face Spaces, что облегчает ознакомление с инструментом без необходимости загрузки или установки.

Такие инновационные решения, как MGIE, открывают новый уровень взаимодействия между человеком и искусственным интеллектом в области обработки изображений, предоставляя удобные и интуитивно понятные средства для творчества и дизайна. Расширение доступности подобных технологий, безусловно, окажет влияние на будущее цифрового искусства и фотографии, открывая новые возможности для экспериментов и инноваций.

Код MGIE доступен на GitHub, попробовать модель можно с помощью веб-демо на Hugging Face Spaces.