👀 Дизайнеры, с какой командой вы мэтчитесь по вайбам? Проверяйте на Вайб-чеке→ vibe.habr.com

Data scientist

Местоположение и тип занятости

МоскваПолный рабочий день

Компания

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

Описание вакансии

Условия работы

Мы делаем:

  • бота для текстового чата с розничными клиентами;
  • бота, который заменит кнопочное меню в колл-центре на голосовой ввод.

МЫ ИЩЕМ:

  • DS, которые будут разрабатывать модели и встраивать их в движок ботов. Движком занимается дружественная команда.

ЧТО НУЖНО ДЕЛАТЬ:

  • строить и дорабатывать существующие модели для чат- и голосового бота: 
      определение интента, slotfilling, sentiment analysis;
  • внедрять разработанные модели в прод;
  • анализировать поведение пользователей по логам  чата с ботом и оператором, предлагать варианты доработок сценариев бота;
  • предлагать направления развития движка ботов;
  • дополнительно для голосового бота: настраивать и писать модули для системы распознавания голоса.

ЧТО НУЖНО УМЕТЬ:

  • писать понятный рабочий код настроить и дорабатывать существующие модели для чат- и голосового бота: 
    •   определение интента, slotfilling, sentiment analysis;
    • внедрять разработанные модели в прод;
    • анализировать поведение пользователей по логам  чата с ботом и оператором, предлагать варианты доработок сценариев бота;
    • предлагать направления развития движка ботов;
    • дополнительно для голосового бота: настраивать и писать модули для системы распознавания голоса.

    ЧТО НУЖНО УМЕТЬ:

    • писать понятный рабочий код на python. быть знакомым c unittest, git;
    • парсить логи и работать с данными: sql, pandas, numpy, regex, json. Знакомство с Spark будет плюсом;
    • иметь базовые знания статистики и ML, владеть: sklearn, statsmodel, xgboost, как плюс: catboost/ligthgbm;
    • нужно уметь работать с текстом: spelling, лемматизация, морфологический и синтаксический анализ, эмбединги:
         nltk/spacy, pymystem3, pymorphy2, gensim,  udpipe, fasttext
    • иметь опыт использования нейросетеввых фреймворков (не только keras) для анализа текста;
    • опыт оптимизации производительности моделей для внедрения в прод будет весомым плюсом.
  • с. быть знакомым c unittest, git;
  • парсить логи и работать с данными: sql, pandas, numpy, regex, json. Знакомство с Spark будет плюсом;
  • иметь базовые знания статистики и ML, владеть: sklearn, statsmodel, xgboost, как плюс: catboost/ligthgbm;
  • нужно уметь работать с текстом: spelling, лемматизация, морфологический и синтаксический анализ, эмбединги:
       nltk/spacy, pymystem3, pymorphy2, gensim,  udpipe, fasttext
  • иметь опыт использования нейросетеввых фреймворков (не только keras) для анализа текста;
  • опыт оптимизации производительности моделей для внедрения в прод будет весомым плюсом.