Проводим исследование о роли образования в ИТ. Пройти опрос (займёт 7-10 минут).
Обо мне

-Знание и опыт применения алгоритмов машинного обучения с учителем и без (регрессия, бустинг (xgboost, catboost), деревья решений (CART/DTree, RF, ExTree), knn, k-means, naive bayes). Стек библиотек: sklearn, catboost, xgboost, numpy, scipy, pandas, seaborn/matplotlib, fastparquet/pyarrow (чтение паркетов Hadoop), H2O, keras.

-Опыт решения задач: предсказание оттока, сегментация пользователей,  рекомендации продукта (NextBestOffer), детектирование аномалий/поломок, прогнозирование потребления сырья, оптим. размещение объектов, детектирование локаций пользователя (работа, дом) по геометкам/чекинам, фрод-анализ и др.

- Специализация на методах обработки и анализа естественного языка ( прошел NLP-курс "Продвинутый DataScience" от MoscowCodingSchool и Сбербанка, преп. Денис Антюхов): чат-боты, анализ тональности текста, поиск фейковых новостей и отзывов, спам-анализ, поиск опечаток/ошибок и т.п. Знание инструментария: NLTK, gensim(word2vec+doc2vec), Keras (LSTM), pymorphy2, SymSpell, Natasha, spacy

-Знание методов мат. оптимизации: непрерывной и дискретной, транспортные задачи, генетические алгоритмы, отжиг, роевой интеллект и т.д. (имеются статьи и выступление на конференциях, НИР), NP-трудные/комбинаторные задачи размещения.

-Опыт работы с БД в т.ч. через python (SQL: join таблиц, фильтрация, выборка данных, агрегация и группировка)

-Опыт участия в соревнованиях по анализу данных: Kaggle, YandexAlgorithm ML-трек 2018 (топ100, имеется футболочка), boosterspro, mlbootcamp, Tinkoff, Эвотор (топ-30 мест), MoscowCodingSchool (топ-3), Raiffaizen Data Cup (топ 3% из 570 мест),
IoT Хакатон МТС в Иннополисе (2 место номинация Data science), Modulbank AI Hack MSK (победитель 2-место ), Хакатон ПАО "Сибур" цифровой завод (финалисты конкурса, топ-5 команд), финалист конкурса "ТелекомИдея 2018" МТС (2 место), Хакатон "Теле2Hack" (1-е место)

Участие в профессиональных сообществах
Опыт работы
Ноябрь 2017 — по настоящее время (1 год и 4 месяца)
Аналитик данных (data scientist)
Москва
Обязанности и достижения

Аналитика данных, машинное обучение, математическое моделирование. Фрод-анализ, управленческая аналитика, прогнозирование исходов городских событий, консалтинг по внешним проектам в сфере машинного обучения, задачи анализа текстов, чат-боты, сегментация аудитории.

Май 2017 — Июль 2017 (3 месяца)
Аналитик
Москва
Обязанности и достижения
Аналитик (Data science) Анализ данных клиентского портфеля (CRM), машинное обучение, проектная работа: модели оттока клиентов по продуктам банка.
Ноябрь 2016 — Май 2017 (7 месяцев)
Стажер аналитик
Москва
Обязанности и достижения
Public sector intern (data science intern в гос. секторе) Младший аналитик в presale команде отраслевой экспертизы в гос. Секторе. Анализ открытых данных, машинное обучение. Помощь в проектах по предиктивной аналитике с примением продукта SAP predictive analytics (KXEN): скоринг контрагентов на выполнение контрактных обязательств, модели прогноза макроэкономич. показателей, выявление мест потенциальных проверок гос. органами.
Декабрь 2015 — Ноябрь 2016 (1 год)
инженер-технолог
Москва
Обязанности и достижения
Анализ существующих и разработка новых моделей транспорта газа. Проектирование бизнес-процессов. Проектирование метамоделей. Помощь начальнику отдела в составлении ТЗ, ЧТЗ: рисование схем взаимодействия модулей системы, интерфейсов (мокапов) системы для программистов. Ведение деловой переписки: служебные записки, деловые письма, переговоры с др.подразделениями.
Высшее образование
Сентябрь 2010 — Июль 2016
РГУ Губкина
Автоматики и вычислительной техники
Москва
Специализация и достижения

- Образование в области интеллектуальных компьютерных систем в нефтегазе (умные/цифровые месторождения, системы ИИ, нейронные сети, интеллектуальный анализ данных)

- Знание и практический опыт применения алгоритмов машинного обучения с учителем и без (лин. регрессия, деревья решений, knn, k-means, xgboost/catboost, naive bayes и др.) как в отрасли так и в бизнесе.

-Знание и опыт анализа текстов, NLP. (word2vec/gensim, TF-IDF/bagofwords, NLTK, pymorphy2, spacy, natasha, keras/CNN for text), написание чат-ботов, моделей сентимент-анализа, сегментация текстов по тематикам.

-Опыт работы с БД (SQL: join таблиц, фильтрация/havig by/order by, группировка/groupby, выборка данных/select)

-Опыт проектной работы, в качестве постановщика задач для аналитиков данных.

-Опыт участия в соревнованиях по анализу данных:

Kaggle ссылка на профиль: https://www.kaggle.com/andrilko ;

YandexAlgorithm ML-трек 2018 (топ100/67 место, имеется поло за топ100);

mlbootcamp VI (топ-15 из 200);

BoostersPro Raiffaisen Data Cup (топ 3% из 570 мест);

Хакатон МТС в Иннополисе (Призер, 2 место номинация Data science);

Modulbank AI Hack MSK (Призер, 2-место); Хакатон ПАО Сибур (топ-5, финалисты);

Финалист Федерального конкурса "ТелекомИдея2018" МТС (топ 3 команд);

Победитель хакатона Теле2hack Москва 2018 г.

-Опыт преподавания курса по machine learning (38 ак.ч. +3 kaggle inclass соревнования) в ВУЗе.

- Книги по data science авторов: Уэсс Маккини, А.Мюллер, С.Гвидо, Ф. Шолле и др. не новость. Постоянно ищу новые материалы, как на родном так и на английском языке.

Ссылки на проекты хакатонов:

-Хакатон "Tele2Hack": https://m.habr.com/post/420887/ , 1-е место, задача анализа диалогов центра поддержки абонентов

- Хакатон "Цифровой завод" ПАО Сибур, команда ML_witnesses: http://ai-community.com/otchet_sibur_hackathon, поиск аномалий/прогноз поломок оборудования

- Хакатон в г.Иннополис, МТС, команда ML divers: https://m.vk.com/@ditmos-hakaton-v-kazani-prines-komande-dit-2-mesto, прогноз ремонтов

- Хакатон "Modulbank AI Hack MSK", команда overfitting_dummies: https://vk.com/wall-117459195_602, 2-е место, next best offer модель