Алекс Абрамов

Data scientist

Местоположение

Проживание: Россия, Москва

Готовность к работе: готов к переезду и удаленной работе

Возраст и стаж

Стаж: 3 года и 10 месяцев

Возраст: 27 лет

Зарплатные ожидания: От 250000 руб.

Контактная информация


Профессиональные навыки


Датамайнинг • Машинное обучение • Python • SQL • Математическое моделирование • Обработка естественного языка • Нейронные сети • Computer Science • Keras • Business intelligence

Участие в профессиональных сообществах


Сентябрь 2014 —
По наст. время
(5 лет и 3 месяца)

GitHub

@Ab1992ao: 49 вкладов в 7 репозиториев, связан с языками:

Jupyter NotebookPython

Опыт работы


Февраль 2019 —
По наст. время
(11 месяцев)

Сбербанк

Data scientist/nlp engineer
Россия, Москва

Обязанности и достижения

ЦА ПАО Сбербанк. Руководитель направления исследования данных/Главный ML инженер. Команда AI в текстах: чат-боты и голосовые помощники. Разработка моделей машинного обучения в области NLP и внедрение в прод. Глубокое обучение RNN/LSTM/GRU, DSSM, CNN/TCNN модели в nlp. Сегментация текстов и тематическое моделирование, модели классификации текстов по сценариям. Выделение интентов и сентимент анализ. Проверка гипотез по изменению автоматизации, стат.тесты/бутстраппинг.

Первым в Сбербанке для чат бота СберОнлайн (сайт и приложение) запустил в продакшн нейронные сети, основанные на технологии deep learning (biLSTM with attention)

Ноябрь 2017 —
Февраль 2019
(1 год и 4 месяца)

ДИТ г. Москвы

Аналитик данных (data scientist)
Россия, Москва

Обязанности и достижения

Аналитика данных, машинное обучение, математическое моделирование. Фрод-анализ, управленческая аналитика, прогнозирование исходов городских событий, консалтинг по внешним проектам в сфере машинного обучения, задачи анализа текстов, чат-боты, сегментация аудитории.

Май 2017 —
Июль 2017
(3 месяца)

Райффайзенбанк

Аналитик
Россия, Москва

Обязанности и достижения

Аналитик (Data science) Анализ данных клиентского портфеля (CRM), машинное обучение, проектная работа: модели оттока клиентов по продуктам банка.
Ноябрь 2016 —
Май 2017
(7 месяцев)

SAP

Стажер аналитик
Россия, Москва

Обязанности и достижения

Public sector intern (data science intern в гос. секторе) Младший аналитик в presale команде отраслевой экспертизы в гос. Секторе. Анализ открытых данных, машинное обучение. Помощь в проектах по предиктивной аналитике с примением продукта SAP predictive analytics (KXEN): скоринг контрагентов на выполнение контрактных обязательств, модели прогноза макроэкономич. показателей, выявление мест потенциальных проверок гос. органами.
Декабрь 2015 —
Ноябрь 2016
(1 год)

Газпром информ

инженер-технолог
Россия, Москва

Обязанности и достижения

Анализ существующих и разработка новых моделей транспорта газа. Проектирование бизнес-процессов. Проектирование метамоделей. Помощь начальнику отдела в составлении ТЗ, ЧТЗ: рисование схем взаимодействия модулей системы, интерфейсов (мокапов) системы для программистов. Ведение деловой переписки: служебные записки, деловые письма, переговоры с др.подразделениями.

Высшее образование


Сентябрь 2010 —
Июль 2016

Российский государственный университет нефти и газа имени И.М. Губкина

Автоматики и вычислительной техники
Россия, Москва

Специализация и достижения

- Образование в области интеллектуальных компьютерных систем в нефтегазе (умные/цифровые месторождения, системы ИИ, нейронные сети, интеллектуальный анализ данных)

- Знание и практический опыт применения алгоритмов машинного обучения с учителем и без (лин. регрессия, деревья решений, knn, k-means, xgboost/catboost, naive bayes и др.) как в отрасли так и в бизнесе.

-Знание и опыт анализа текстов, NLP. (word2vec/gensim, TF-IDF/bagofwords, NLTK, pymorphy2, spacy, natasha, keras/CNN for text), написание чат-ботов, моделей сентимент-анализа, сегментация текстов по тематикам.

-Опыт работы с БД (SQL: join таблиц, фильтрация/havig by/order by, группировка/groupby, выборка данных/select)

-Опыт проектной работы, в качестве постановщика задач для аналитиков данных.

-Опыт участия в соревнованиях по анализу данных:

Kaggle ссылка на профиль: https://www.kaggle.com/andrilko ;

YandexAlgorithm ML-трек 2018 (топ100/67 место, имеется поло за топ100);

mlbootcamp VI (топ-15 из 200);

BoostersPro Raiffaisen Data Cup (топ 3% из 570 мест);

Хакатон МТС в Иннополисе (Призер, 2 место номинация Data science);

Modulbank AI Hack MSK (Призер, 2-место); Хакатон ПАО Сибур (топ-5, финалисты);

Финалист Федерального конкурса "ТелекомИдея2018" МТС (топ 3 команд);

Победитель хакатона Теле2hack Москва 2018 г.

-Опыт преподавания курса по machine learning (38 ак.ч. +3 kaggle inclass соревнования) в ВУЗе.

- Книги по data science авторов: Уэсс Маккини, А.Мюллер, С.Гвидо, Ф. Шолле и др. не новость. Постоянно ищу новые материалы, как на родном так и на английском языке.

Ссылки на проекты хакатонов:

-Хакатон "Tele2Hack": https://m.habr.com/post/420887/ , 1-е место, задача анализа диалогов центра поддержки абонентов

- Хакатон "Цифровой завод" ПАО Сибур, команда ML_witnesses: http://ai-community.com/otchet_sibur_hackathon, поиск аномалий/прогноз поломок оборудования

- Хакатон в г.Иннополис, МТС, команда ML divers: https://m.vk.com/@ditmos-hakaton-v-kazani-prines-komande-dit-2-mesto, прогноз ремонтов

- Хакатон "Modulbank AI Hack MSK", команда overfitting_dummies: https://vk.com/wall-117459195_602, 2-е место, next best offer модель


О себе


-Знание и опыт применения алгоритмов машинного обучения с учителем и без (регрессия, бустинг (xgboost, catboost), деревья решений (CART/DTree, RF, ExTree), knn, k-means, naive bayes). Стек библиотек: sklearn, catboost, xgboost, numpy, scipy, pandas, seaborn/matplotlib, fastparquet/pyarrow (чтение паркетов Hadoop), H2O, keras.

-Опыт решения задач: предсказание оттока, сегментация пользователей,  рекомендации продукта (NextBestOffer), детектирование аномалий/поломок, прогнозирование потребления сырья, оптим. размещение объектов, детектирование локаций пользователя (работа, дом) по геометкам/чекинам, фрод-анализ и др.

- Специализация на методах обработки и анализа естественного языка ( прошел NLP-курс "Продвинутый DataScience" от MoscowCodingSchool и Сбербанка, преп. Денис Антюхов): чат-боты, анализ тональности текста, поиск фейковых новостей и отзывов, спам-анализ, поиск опечаток/ошибок и т.п. Знание инструментария: NLTK, gensim(word2vec+doc2vec, glove, fastext), Keras (dense, CNN, GRU, LSTM, DSSM), pymorphy2,pymystem3, SymSpell, Natasha, spacy

-Знание методов мат. оптимизации: непрерывной и дискретной, транспортные задачи, генетические алгоритмы, отжиг, роевой интеллект и т.д. (имеются статьи и выступление на конференциях, НИР), NP-трудные/комбинаторные задачи размещения.

-Опыт работы с БД в т.ч. через python (SQL: join таблиц, фильтрация, выборка данных, агрегация и группировка)

-Опыт участия в соревнованиях по анализу данных: Kaggle, YandexAlgorithm ML-трек 2018 (топ100, имеется футболочка), boosterspro, mlbootcamp, Tinkoff, Эвотор (топ-30 мест), MoscowCodingSchool (топ-3), Raiffaizen Data Cup (топ 3% из 570 мест),
IoT Хакатон МТС в Иннополисе (2 место номинация Data science), Modulbank AI Hack MSK (победитель 2-место ), Хакатон ПАО "Сибур" цифровой завод (финалисты конкурса, топ-5 команд), финалист конкурса "ТелекомИдея 2018" МТС (2 место), Хакатон "Теле2Hack" (1-е место)

ВАЖНО: Рассматриваю переезд в другие страны