Data scientist

29 ноября 2018

Требования

Москва • Полный рабочий день

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

DS, которые будут разрабатывать модели и встраивать их в движок ботов. Движком занимается дружественная команда.

строить и дорабатывать существующие модели для чат- и голосового бота:
определение интента, slotfilling, sentiment analysis;
внедрять разработанные модели в прод;
анализировать поведение пользователей по логам чата с ботом и оператором, предлагать варианты доработок сценариев бота;
предлагать направления развития движка ботов;
дополнительно для голосового бота: настраивать и писать модули для системы распознавания голоса.

писать понятный рабочий код настроить и дорабатывать существующие модели для чат- и голосового бота:

определение интента, slotfilling, sentiment analysis;
внедрять разработанные модели в прод;
анализировать поведение пользователей по логам чата с ботом и оператором, предлагать варианты доработок сценариев бота;
предлагать направления развития движка ботов;
дополнительно для голосового бота: настраивать и писать модули для системы распознавания голоса.

писать понятный рабочий код на python. быть знакомым c unittest, git;
парсить логи и работать с данными: sql, pandas, numpy, regex, json. Знакомство с Spark будет плюсом;
иметь базовые знания статистики и ML, владеть: sklearn, statsmodel, xgboost, как плюс: catboost/ligthgbm;
нужно уметь работать с текстом: spelling, лемматизация, морфологический и синтаксический анализ, эмбединги:
nltk/spacy, pymystem3, pymorphy2, gensim, udpipe, fasttext
иметь опыт использования нейросетеввых фреймворков (не только keras) для анализа текста;
опыт оптимизации производительности моделей для внедрения в прод будет весомым плюсом.

с. быть знакомым c unittest, git;
парсить логи и работать с данными: sql, pandas, numpy, regex, json. Знакомство с Spark будет плюсом;
иметь базовые знания статистики и ML, владеть: sklearn, statsmodel, xgboost, как плюс: catboost/ligthgbm;
нужно уметь работать с текстом: spelling, лемматизация, морфологический и синтаксический анализ, эмбединги:
nltk/spacy, pymystem3, pymorphy2, gensim, udpipe, fasttext
иметь опыт использования нейросетеввых фреймворков (не только keras) для анализа текста;
опыт оптимизации производительности моделей для внедрения в прод будет весомым плюсом.