Data scientist
Требования
Местоположение и тип занятости
Компания
Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек
Описание вакансии
Условия работы
Мы делаем:
- бота для текстового чата с розничными клиентами;
- бота, который заменит кнопочное меню в колл-центре на голосовой ввод.
МЫ ИЩЕМ:
- DS, которые будут разрабатывать модели и встраивать их в движок ботов. Движком занимается дружественная команда.
ЧТО НУЖНО ДЕЛАТЬ:
- строить и дорабатывать существующие модели для чат- и голосового бота:
определение интента, slotfilling, sentiment analysis; - внедрять разработанные модели в прод;
- анализировать поведение пользователей по логам чата с ботом и оператором, предлагать варианты доработок сценариев бота;
- предлагать направления развития движка ботов;
- дополнительно для голосового бота: настраивать и писать модули для системы распознавания голоса.
ЧТО НУЖНО УМЕТЬ:
- писать понятный рабочий код настроить и дорабатывать существующие модели для чат- и голосового бота:
- определение интента, slotfilling, sentiment analysis;
- внедрять разработанные модели в прод;
- анализировать поведение пользователей по логам чата с ботом и оператором, предлагать варианты доработок сценариев бота;
- предлагать направления развития движка ботов;
- дополнительно для голосового бота: настраивать и писать модули для системы распознавания голоса.
- писать понятный рабочий код на python. быть знакомым c unittest, git;
- парсить логи и работать с данными: sql, pandas, numpy, regex, json. Знакомство с Spark будет плюсом;
- иметь базовые знания статистики и ML, владеть: sklearn, statsmodel, xgboost, как плюс: catboost/ligthgbm;
- нужно уметь работать с текстом: spelling, лемматизация, морфологический и синтаксический анализ, эмбединги:
nltk/spacy, pymystem3, pymorphy2, gensim, udpipe, fasttext - иметь опыт использования нейросетеввых фреймворков (не только keras) для анализа текста;
- опыт оптимизации производительности моделей для внедрения в прод будет весомым плюсом.
- с. быть знакомым c unittest, git;
- парсить логи и работать с данными: sql, pandas, numpy, regex, json. Знакомство с Spark будет плюсом;
- иметь базовые знания статистики и ML, владеть: sklearn, statsmodel, xgboost, как плюс: catboost/ligthgbm;
- нужно уметь работать с текстом: spelling, лемматизация, морфологический и синтаксический анализ, эмбединги:
nltk/spacy, pymystem3, pymorphy2, gensim, udpipe, fasttext - иметь опыт использования нейросетеввых фреймворков (не только keras) для анализа текста;
- опыт оптимизации производительности моделей для внедрения в прод будет весомым плюсом.