Мы как-то привыкли к моделям, которые занимаются генерацией картинок и на то, что вышла еще одна, внимание обращаем редко. Но вот тут на прошлой неделе Black Forest Labs представили FLUX.1 Kontext, которая заявляется как семейство моделей для редактирования изображений, которые понимают контекст и позволяют вносить точечные изменения без потери общей композиции. Доступны версии [pro] и [max], а [dev] появится в ближайшее время.
Главное преимущество, как пишут разработчики — модель понимает намерения пользователя и контекст изображения, поэтому не требует детальных промптов. Достаточно описать желаемое изменение, и система сама разберется, как его реализовать без нарушения общей логики композиции.
Модель уже можно попробовать на fal.ai или Replicate. Если помните, я неделю назад писал, как пытался соорудить простую обработку старых фотографий и даже залез в дебри Deep Color, так вот Kontext позволяет эту задачу решить достаточно хорошо в определенных условиях.
Тут надо понимать, что фотографии, которые требуется обработать, должны соответствовать определенным требованиям. В примерах на платформах есть несколько старых фотографий, восстановленных действительно хорошо, но на нескольких моих примерах — а я еще в детстве сначала отобрал у отца дедовский ФЭД, а потом и “Зенит-Е”, так что некоторый запас старых плохих фотографий у меня есть, — заметно, что плохо проработанные детали вынуждают модель галлюцинировать. Это наиболее заметно по лицу, впрочем, насмешил результат колоризации старой армейской фотографии отца — вместо советской полевой формы он оказался одет в серую ковбойку и джинсы. Впрочем, удачно получается, если в промпте указать, например, что костюм на мужчине темно-синий, а цветы в вазе — красные и белые гвоздики.