Войти через соцсеть:
Войти через email:
В последнее время стала популярна тема так называемых копилотов, то есть помощников для каких-то повседневных действий за компьютером. Началась эта тема с GitHub CoPilot, который должен помогать программисту. Мы делаем своего помощника программисту, и я вам расскажу, как мы учим модели для него. Наши модели в настоящее время в некоторых задачах достигли т.н. state of the art результатов, то есть достигли первого места на открытом бенчмарке.
Мы поговорим о том, кто же быстрее пишет код: автокомплит или искусственный интеллект, и стоит ли его вообще использовать и как. Мы так же обсудим, как сейчас пишут код и какие инструменты при этом используют.
Долгое время автоматическое написание кода по его свободному описанию оставалась лишь несбыточной мечтой: алгоритмические решения не представлялись возможными, а эксперименты на базе ML-подходов не обобщались до реальных задач. Еще несколько лет назад, уже даже после активной шумихи вокруг нейронных сетей, значительных подвижек в автоматической кодогенерации не наблюдалось. Только с приходом Больших Языковых Моделей (LLM), навроде Chat-GPT, в этой области начали происходить существенные изменения.
В этом докладе мы подробно обсудим, как подступиться к AI Program Synthesis: как формализовать нашу задачу, как измерять качество получаемых методов, рассмотрим все основные архитектуры актуальных нейронных сетей для Code Generation, а также порассуждаем, в какую сторону будут развиваться дальнейшие методы
Использование “больших” современных генеративных моделей поможет быстро собрать MVP или baseline, но текущее состояние технологий не позволяет получить высокое качество результата. Об этом как будто бы не часто говорят, но если хочется решать задачу хорошо, нужно ее дробить и вникать в процессы, которые автоматизируем. И скорее всего – искать более простые, иногда классические, инструменты.
Мы делаем продукт для автоматической ретуши фотографий товаров. Один из шагов ретуши – наложение тени.
Дано:
- большое разрешение фотографий;
- три ракурса съемки товаров;
- высокие требования к реалистичности тени;
- ограниченный объем данных для обучения.
Попробовали:
- тень по контуру;
- image-editing с помощью диффузии;
- предсказывание слоя с тенью по картинке/маске.
На примере этой задачи продемонстрируем особенности и недостатки генеративных подходов, поговорим о возникающих ограничениях и проблемах, расскажем, как от сложной задачи генерации перешли к, внезапно, более простой задаче сегментации, и что из этого вышло.
Я преподаю основы программирования на Python в Высшей школе экономики для магистрантов направления “Компьютерная лингвистика”. Запросы у ребят серьезные: они хотят устроиться (и устраиваются!) по специальности, но их фоновый опыт очень разный. В одной группе могут учиться выпускники разных направлений, включая филологов, юристов, педагогов, а также выпускников матмеха СПбГУ и специалистов с опытом мобильной разработки. В таких условиях я стараюсь сделать учебный план максимально адаптивным, и в этом мне помогает генеративный искусственный интеллект. В своем докладе я поделюсь опытом использования ChatGPT для разработки адаптивных учебных планов.
Адаптация курса к целям и интересам студентов
Обычно студенты приходят учиться с конкретными целями. Например, у любого языка программирования есть множество применений. Так, можно сегрегировать задания для тех, кому нужен Python для анализа данных и машинного обучения, для тех, кто изучает программирование для академических исследований и для тех, кто планирует работать в индустрии. Важно учитывать интересы студентов: если задание совпадает с их хобби, мотивация заниматься самостоятельно будет гораздо выше. Для этого я генерирую тематические датасеты и задания. Например, для киноманов я создаю задачи обработку базы данных IMDB и категоризацию кинорецензий.
Предотвращение списываний
Одной из задач является предотвращение списываний. С ChatGPT для разных групп и даже отдельных студентов можно создавать неограниченное количество вариантов заданий. Я генерирую задания к каждому занятию, вношу правки и перепроверяю их.
Адаптация учебного материала для инклюзивной среды
Еще одно важное направление — адаптивное обучение для студентов с особыми потребностями, инклюзивное образование. ChatGPT помогает упрощать формулировки и адаптировать учебный материал с указанием специальных требований, таких как как использование увеличенного шрифта и повышенной контрастности для студентов с нарушениями зрения. В этом году я буду читать адаптированную версию своего курса в благотворительной организации, где также буду использовать ChatGPT.
Большие языковые модели уже сами по себе неплохо умеют говорить, но пока ещё не способны решать сложные задачи, требующие цепочек рассуждений. Кроме того, возникает проблема, как научить их разговаривать в нужной нам предметной области, например, играть роль инженера тех поддержки. Мы рассмотрим разные стратегии решения такого рода задач - от использования In-Context Learning на основе продвинутых способов Retrieval-Augmented Generation (на основе графов знаний), до многоагентных систем. Поделимся примером кода, который вы сможете посмотреть дома, или же по ходу доклада или мастер-класса.
— Практика использования ML-моделей для работы с играми, где DAU исчисляется тысячами
— В каких задачах используем ML? Где начинается ML? И где он заканчивается?
– Что лучше — своя ML-разработка или готовые решения?
А также расскажу о пяти моделях, которые используем мы:
— Model 1: InnoRan - Optimove (ML кластеризация)
– Model 2: PhycoTypes (ML кластеризация)
— Model 3: Finance Models (Прогнозирование)
– Model 4: Innova LM (обработка естественного языка)
— Model 5: CHEATER-KILLER
- Зачем нужен Langchain и почему стоит разрабатывать на нем LLM-приложения
- Способы интеграции приложений с веб-сервисами: обзор различных подходов
- Обзор возможностей связки Langchain и Web
- Практический кейс: интеграция Langchain-приложения в контур клиента