Светлана Габдуллина
Ведущий специалист по машинному обучению @ Ecom.tech (ранее Samokat.tech)
Москва

Генеративный AI переоценен? Почему стоит смотреть в сторону простых решений на примере задачи генерации тени.

  • День выступления: 28.09.2024
  • Время начала: 12:15
  • Время окончания: 12:45
  • Зал: База [Blue4]
  • Категории: Разработка
  • Секции: Машинное обучение

Описание:

Использование “больших” современных генеративных моделей поможет быстро собрать MVP или baseline, но текущее состояние технологий не позволяет получить высокое качество результата. Об этом как будто бы не часто говорят, но если хочется решать задачу хорошо, нужно ее дробить и вникать в процессы, которые автоматизируем. И скорее всего – искать более простые, иногда классические, инструменты.

Мы делаем продукт для автоматической ретуши фотографий товаров. Один из шагов ретуши – наложение тени.

Дано:

- большое разрешение фотографий;

- три ракурса съемки товаров;

- высокие требования к реалистичности тени;

- ограниченный объем данных для обучения.

Попробовали:

- тень по контуру;

- image-editing с помощью диффузии;

- предсказывание слоя с тенью по картинке/маске.

На примере этой задачи продемонстрируем особенности и недостатки генеративных подходов, поговорим о возникающих ограничениях и проблемах, расскажем, как от сложной задачи генерации перешли к, внезапно, более простой задаче сегментации, и что из этого вышло.

О спикере

Светлана Габдуллина

Ведущий специалист по машинному обучению @ Ecom.tech (ранее Samokat.tech)
Москва

Работаю в проекте Molbert AI, призванном автоматизировать ретушь и процесс подготовки фотографий товаров к публикации в приложении. Занимаюсь компьютерным зрением, специализируюсь на задачах генерации изображений и видео.

Похожие доклады