May 27, 2017

Лекции 27 мая 2017

27 мая прошла первая встреча клуба машинного обучения в Омске. Мероприятие стало открытием для сообщества по машинному обучению в Омске.

Мы с вами послушали доклады про два диаметрально противоположных подхода к применению ML. С одной стороны сугубо практический – всё серьезно, настоящий продакшен, реальные пользователи и деньги. С другой – спортивно-соревновательный, где важен 5-ый знак после запятой для качества предсказания модели, данные идеально подготовлены, а задача предельно ясна (а может и нет xD).

После докладов провели питчи «идей», где поделились проблемами и обсудили с участниками, можно ли решит эту проблему методами ML эффективно.

Фото

ML в онлайн играх и рекламе

Артём Шевляков, Институт математики СО РАН, старший научный сотрудник.

Докладчик расскажет о своем опыте работы на поприще ML. Будут рассмотрены модели предсказания поведения пользователя в онлайн игре, а также алгоритмы оптимального размещения рекламных баннеров на сайтах. Кроме того, на примере данных задач будет рассмотрен вечный вопрос: “Почему в теории всё хорошо, а на практике не очень”.

Закончил матфак (ИМИТ) ОмГУ. Потом тихо-мирно работал (и сейчас работаю) в одном из научных институтов РАН. И доказывал бы я всю жизнь абстрактные теоремы по алгебре, но пару лет назад пригласили поучаствовать в коммерческом проекте, связанном с разработкой моделей ML. Вот об этом периоде моей жизни и пойдёт речь в докладе.

Слайды

ML в задаче поиска повторяющихся вопросов

Дмитрий Вальчук, ИМИТ 3-й курс, 7bits, backend разработчик.

На этом докладе я расскажу о том, как совсем недавно я принимал участие в соревновании на kaggle.com по поиску вопросов, похожих по смыслу. Мы разберем некоторые приемы, которые помогут решить подобные задачи, а также увидим, какими особенностями обладают задачи на kaggle.com.

Только начинаю свой путь в ML и data science. Еще в школе занимался олимпиадным программированием, возможно, оттуда начался интерес к неочевидным и красивым методам решения задач. В ML больше всего привлекает то, что почти всегда результат зависит не только от того, какой алгоритм используется, а еще от того, какие признаки были выделены из исходных данных. Сейчас инетересуюсь задачами процессинга реальных текстов (NLP).

Слайды

ML Boot Camp IV. Задача “с секретом”

Вячеслав Введенский, разработчик.

В этом докладе я расскажу о том, как принимал участие в своём первом соревновании по ML на mlbootcamp.ru по решению задачи “с секретом” - с неизвестной содержательной постановкой. Расскажу о способах отбора и генерации признаков. А также о сложностях, которые подстерегают по пути к решению.

Закончил матфак ОмГУ. Работал 10 лет разработчиком ПО. Потом ушел в энергетику внедрять и сопровождать автоматизированные системы диспетчерского управления. Решил вернуться к истокам и начал с участия в соревнованиях по ML.

Слайды