Обо мне

Активно принимаю участие в хакатонах, в 2019 году начал участвовать в кагглах: https://www.kaggle.com/lolik11110, где
попал в топ 3% в Quora Insincere questions classification challenge

Топ хакатонов:

  1. Urban.Tech Challenge 2018, EORA, 1 место, сделал логику Акинатора для подбора обоев
  2. GIS Tech Hack 2018, PIVO NA POLU, 1 место, предсказание задержек рейсов самолёта для Аэрофлота, https://github.com/strawberrypie/gistechhack-delays
  3. Хакатон от Ак Барс банка и университета Талантов 2018, EORA, 3 место, чат-бот с технологией верификации по фотографии https://www.akbars.ru/product/news/ak-bars-bank-nagradil-luchshie-it-resheniya-otkritogo-hakatona/
  4. http://www.kazan-its.ru/itis 2018, 1 место, делали точную локализацию автомобиля 
  5. AI.Hack Moscow 2018, трек BestFit.ai, 2 место, нужно было предсказывать характеристики восприятия автомобиля человеком, имея фото автомобиля и табличные данные, описывающие человека https://www.kaggle.com/c/ai-hack-2018-msk-bestfit
Профессиональные навыки
Участие в профессиональных сообществах
Опыт работы
Разработка решений на основе искусственного интеллекта: Computer Vision, Data Science, Machine Learning, NLP
Data Scientist
Сентябрь 2018 — По настоящее время (11 месяцев)

Проекты качестве Data Scientista:

Подсчёт людей в транспорте:

  • Работал с фреймворком Intel OpenVino на C++,  запускал модели на Raspberry Pi + NCS2
  • Построил пайплайн из детектирования лиц, трекинга и распознавания лиц, а также аналогичный c детектированием и распознаванием людей
  • Имплементировал эвристики над дескрипторами для поиска пропавших треков

Определение типажа мужчины по фото:

  • Применял участие в обучении множества моделей классификации, сегментации и детектирования, извлекающих различные характеристики человека по фото: телосложение, тип одежды, цвет волос, наличие бороды / щетины, классификация фона
  • На базе данных характеристик и правил, предоставленных заказчиком, построил финальный классификатор

OCR (распознавание документов КАСКО):

  • Сделал MVP проекта, представляющий из себя:
    • Классификацию бланков
    • Детектирование текста (EAST), распознавание (tesseract)
    • Постпроцессинг: исправление опечаток (natasha) и обёртка в Flask
  • Создал вторую версию проекта, использующую Google OCR + advanced алгоритмы для поиска областей с необходимыми сущностями
  • Создание генератора синтетических данных (с учётом использования разных шрифтов, отступов, заполняемых данных, таких как адреса, ФИО, наложение эффекта скана) для дальнейшего обучения моделей

Data Mining:

  • EDA, очистка данных, приведение к корректному виду, генерация новых признаков
  • Анализ фич, влияющих на конверсию
  • Кластеризация мерчей / пользователей / транзакций по различным признакам, анализ конверсии
  • Поиск и анализ аномалий, проседаний конверсии, проверка гипотез
  • Предоставление результатов в виде визуализаций, отчётов

 

В качестве DS лида:

  • Проект с детектированием головы
  • Проект с оптимизацией моделей
  • Проект с поиском похожих логотипов
    ЗАО Витакор
    Казань
    Разработчик
    Сентябрь 2014 — Август 2016 (2 года)

    Я был вовлечён в разработку медицинской информационной системы, которая представляла собой клиент-серверное desktop приложение на C# с использованием (в основном) Windows Forms, MSSQL и внутреннего фреймворка компании.

    • Занимался созданием новых модулей:
      • Анализировал и детализировал требования, превращая их в конкретные шаги и требования к системе
      • Проектировал архитектуру модуля и соответствующую архитектуру БД
      • Имплементировал логику модуля
    • Оптимизировал SQL запросы, что привело к значительному ускорению, в отдельных случаях до 10 раз
    • Учавствовал в работе над внутренними проектами компании, таких как утилита для переноса БД PostgreSQL <-> MSSQL
    Высшее образование
    Университет Иннополис
    Иннополис
    Август 2016—Июнь 2018 (1 год и 10 месяцев)

    Магистр (Big Data)

    Проходил практику в Лаборатории ITS университета Иннополис, занимался проектом анализа дорожного трафика, для которого разрабатывал систему распознавания и трекинга автомобильных номеров. В дальнейшем там же в составе команды написал магистерскую диссертацию в области computer vision и vehicle localization, а также опубликовал 2 статьи: 
    https://dl.acm.org/citation.cfm?doid=3175603.3175622
    https://ieeexplore.ieee.org/abstract/document/8500404
    в которых мы предложили метод уточнения позиционирования автомобиля при помощи информации о дорожных знаках.

    Казанский федеральный университет
    Казань
    Факультет: Высшая школа информационных технологий и информационных систем (ВШ ИТИС)
    Сентябрь 2013—Июнь 2016 (2 года и 9 месяцев)

    Бакалавр

    Во время обучения писал в основном на C++, темой бакалаврского диплома было автоматическое извлечение информации из html-страниц (фио, контактные данные)