Обо мне

-Знание и опыт применения алгоритмов машинного обучения с учителем и без (регрессия, бустинг (xgboost, catboost), деревья решений (CART/DTree, RF, ExTree), knn, k-means, naive bayes). Стек библиотек: sklearn, catboost, xgboost, numpy, scipy, pandas, seaborn/matplotlib, fastparquet/pyarrow (чтение паркетов Hadoop), H2O, keras.

-Опыт решения задач: предсказание оттока, сегментация пользователей,  рекомендации продукта (NextBestOffer), детектирование аномалий/поломок, прогнозирование потребления сырья, оптим. размещение объектов, детектирование локаций пользователя (работа, дом) по геометкам/чекинам, фрод-анализ и др.

- Специализация на методах обработки и анализа естественного языка ( прошел NLP-курс "Продвинутый DataScience" от MoscowCodingSchool и Сбербанка, преп. Денис Антюхов): чат-боты, анализ тональности текста, поиск фейковых новостей и отзывов, спам-анализ, поиск опечаток/ошибок и т.п. Знание инструментария: NLTK, gensim(word2vec+doc2vec, glove, fastext), Keras (dense, CNN, GRU, LSTM, DSSM), pymorphy2,pymystem3, SymSpell, Natasha, spacy

-Знание методов мат. оптимизации: непрерывной и дискретной, транспортные задачи, генетические алгоритмы, отжиг, роевой интеллект и т.д. (имеются статьи и выступление на конференциях, НИР), NP-трудные/комбинаторные задачи размещения.

-Опыт работы с БД в т.ч. через python (SQL: join таблиц, фильтрация, выборка данных, агрегация и группировка)

-Опыт участия в соревнованиях по анализу данных: Kaggle, YandexAlgorithm ML-трек 2018 (топ100, имеется футболочка), boosterspro, mlbootcamp, Tinkoff, Эвотор (топ-30 мест), MoscowCodingSchool (топ-3), Raiffaizen Data Cup (топ 3% из 570 мест),
IoT Хакатон МТС в Иннополисе (2 место номинация Data science), Modulbank AI Hack MSK (победитель 2-место ), Хакатон ПАО "Сибур" цифровой завод (финалисты конкурса, топ-5 команд), финалист конкурса "ТелекомИдея 2018" МТС (2 место), Хакатон "Теле2Hack" (1-е место)

Участие в профессиональных сообществах
Опыт работы
Крупнейший транснациональный и универсальный банк России
Data scientist/nlp engineer
Февраль 2019 — По настоящее время (6 месяцев)
Информатизация города
Аналитик данных (data scientist)
Ноябрь 2017 — Февраль 2019 (1 год и 4 месяца)

Аналитика данных, машинное обучение, математическое моделирование. Фрод-анализ, управленческая аналитика, прогнозирование исходов городских событий, консалтинг по внешним проектам в сфере машинного обучения, задачи анализа текстов, чат-боты, сегментация аудитории.

Ведущий универсальный банк в России для всех, кто ценит качество.
Аналитик
Май 2017 — Июль 2017 (3 месяца)
Аналитик (Data science) Анализ данных клиентского портфеля (CRM), машинное обучение, проектная работа: модели оттока клиентов по продуктам банка.
Производитель программного обеспечения для организаций
Стажер аналитик
Ноябрь 2016 — Май 2017 (7 месяцев)
Public sector intern (data science intern в гос. секторе) Младший аналитик в presale команде отраслевой экспертизы в гос. Секторе. Анализ открытых данных, машинное обучение. Помощь в проектах по предиктивной аналитике с примением продукта SAP predictive analytics (KXEN): скоринг контрагентов на выполнение контрактных обязательств, модели прогноза макроэкономич. показателей, выявление мест потенциальных проверок гос. органами.
Специализированная сервисная ИТ-компания, управляющая ИТ-обеспечением группы «Газпром»
инженер-технолог
Декабрь 2015 — Ноябрь 2016 (1 год)
Анализ существующих и разработка новых моделей транспорта газа. Проектирование бизнес-процессов. Проектирование метамоделей. Помощь начальнику отдела в составлении ТЗ, ЧТЗ: рисование схем взаимодействия модулей системы, интерфейсов (мокапов) системы для программистов. Ведение деловой переписки: служебные записки, деловые письма, переговоры с др.подразделениями.
Высшее образование
Российский государственный университет нефти и газа имени И.М. Губкина
Москва
Факультет: Автоматики и вычислительной техники
Сентябрь 2010—Июль 2016 (5 лет и 10 месяцев)

- Образование в области интеллектуальных компьютерных систем в нефтегазе (умные/цифровые месторождения, системы ИИ, нейронные сети, интеллектуальный анализ данных)

- Знание и практический опыт применения алгоритмов машинного обучения с учителем и без (лин. регрессия, деревья решений, knn, k-means, xgboost/catboost, naive bayes и др.) как в отрасли так и в бизнесе.

-Знание и опыт анализа текстов, NLP. (word2vec/gensim, TF-IDF/bagofwords, NLTK, pymorphy2, spacy, natasha, keras/CNN for text), написание чат-ботов, моделей сентимент-анализа, сегментация текстов по тематикам.

-Опыт работы с БД (SQL: join таблиц, фильтрация/havig by/order by, группировка/groupby, выборка данных/select)

-Опыт проектной работы, в качестве постановщика задач для аналитиков данных.

-Опыт участия в соревнованиях по анализу данных:

Kaggle ссылка на профиль: https://www.kaggle.com/andrilko ;

YandexAlgorithm ML-трек 2018 (топ100/67 место, имеется поло за топ100);

mlbootcamp VI (топ-15 из 200);

BoostersPro Raiffaisen Data Cup (топ 3% из 570 мест);

Хакатон МТС в Иннополисе (Призер, 2 место номинация Data science);

Modulbank AI Hack MSK (Призер, 2-место); Хакатон ПАО Сибур (топ-5, финалисты);

Финалист Федерального конкурса "ТелекомИдея2018" МТС (топ 3 команд);

Победитель хакатона Теле2hack Москва 2018 г.

-Опыт преподавания курса по machine learning (38 ак.ч. +3 kaggle inclass соревнования) в ВУЗе.

- Книги по data science авторов: Уэсс Маккини, А.Мюллер, С.Гвидо, Ф. Шолле и др. не новость. Постоянно ищу новые материалы, как на родном так и на английском языке.

Ссылки на проекты хакатонов:

-Хакатон "Tele2Hack": https://m.habr.com/post/420887/ , 1-е место, задача анализа диалогов центра поддержки абонентов

- Хакатон "Цифровой завод" ПАО Сибур, команда ML_witnesses: http://ai-community.com/otchet_sibur_hackathon, поиск аномалий/прогноз поломок оборудования

- Хакатон в г.Иннополис, МТС, команда ML divers: https://m.vk.com/@ditmos-hakaton-v-kazani-prines-komande-dit-2-mesto, прогноз ремонтов

- Хакатон "Modulbank AI Hack MSK", команда overfitting_dummies: https://vk.com/wall-117459195_602, 2-е место, next best offer модель