хорошее знание математической статистики, методов дискретной математики, моделирования и других аналитических методов (текстовая аналитика, выявленных неочевидных закономерностей, проверка гипотез и др.);
визуализация данных;
умение структурировать и интегрировать разнородные источники данных;
навыки программирования и работы с базами данных;
приветствуется желание работать с анализом текстовых данных и знание методов обработки естественных языков (компьютерной лингвистики) ;
базовые знания алгоритмов (методы сортировки, деревья решений) .
Чем предстоит заниматься
Изучение, тестирование и внедрение различных алгоритмов анализа цифровых и текстовых данных в спортивной тематике.
Инструменты
Jupyter, SQL, Python (если работали с R, Matlab или SPSS - желание изучить инструменты на Python):
стандартные библиотеки + Pandas, NumPy, SciPy, Matplotlib/Seaborn
библиотеки для интеллектуального анализа и обработки естественного языка: NLTK, Pymorphy2, Mystem, snowballstemmer, MaltParser и других морфологических и синтаксических анализаторов (для предобработки данных), регулярных выражений.
Как мы работаем
пилим проекты дружно, бодро, с огоньком;
уже знаем, как сделать и запустить успешный продукт — Рейтинг Букмекеров, Odds.ru, SocialBet, и готовы делиться великой мудростью;
занимаем удобный офис рядом с метро Калужская;
приходим на работу тогда, когда удобно, уходим, когда закрыли все задачи;
знаем, что важно не сколько часов отработал, а сколько сделал;
знаем, что важен не возраст в паспорте, а мастерство.