SIDiffAgent: Self-Improving Diffusion Agent

Аватар автора
Paper debate
SIDiffAgent: Самосовершенствующийся Диффузионный Агент Документ представляет SIDiffAgent, новый самосовершенствующийся диффузионный агент, разработанный для преодоления ограничений существующих текстово-графических диффузионных моделей. Эти модели часто страдают от чувствительности к формулировке запросов, семантической неоднозначности, артефактов изображений и требуют обширной инженерии запросов, что затрудняет их применение в реальном мире. SIDiffAgent — это бестреннинговая многоагентная система, использующая семейство моделей Qwen для автономного управления инженерией запросов, обнаружения и исправления неудачных генераций, а также для детального удаления артефактов. Ключевым нововведением является механизм итеративного самосовершенствования, который сохраняет прошлый опыт в базе знаний для внедрения рекомендаций на протяжении всего процесса генерации. Система использует различные субагенты для уточнения запросов, генерации адаптивных негативных ограничений и оценки, с межагентным рассуждением, вдохновленным «Теорией разума», для динамического управления рабочим процессом. Такой подход обеспечивает более надежные и согласованные результаты с превосходным выравниванием текста и изображения и реализмом, способные обрабатывать сложные запросы и отрицательные ограничения. SIDiffAgent достиг впечатляющего показателя VQA 0.884 на GenAIBench, значительно превзойдя существующие модели. #СинтезИзображений отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC...

0/0


0/0

0/0

0/0

Скачать популярное видео

Популярное видео

0/0