Сегодня мы поговорим про такое актуальное направление в сфере IT,как Data Science. Почему это направление так быстро развивается, чем занимаются Data Scientist в компаниях, в чем особенность работы на проектах финтеха? На эти и другие вопросы ответила нам руководитель отдела анализа данных Наталья Смирнова,

1. По твоему мнению, почему Data Science так стремительно развивается сейчас?
Основная причина – это цифровизация общества и, как следствие, неконтролируемый рост генерируемых человечеством данных. Ведь основа Data Science – это именно данные. Вторая причина – это высокая востребованность подобных технологий, они делают нашу жизнь более удобной, а к «хорошему быстро привыкаешь» и сейчас технологии с использованием искусственного интеллекта воспринимаются нами, как что-то само собой разумеющееся, а спрос, естественно, всегда рождает предложение.
2. Кто такой Data Scientist и чем он обычно занимается в компании?
Если объяснять через более понятные специальности, то Data Scientist – это соединение навыков программиста, математика и бизнес-аналитика.
Вне зависимости от сферы деятельности компании, Data Scientist всегда работает с большими объемами данных. Он занимается сбором, обработкой и анализом данных, делает выводы на основе выявленных зависимостей, разрабатывает модели машинного обучения для предсказания событий и обнаружения неочевидных закономерностей и визуализирует результаты своей работы.
Для того, чтобы все это сделать, Data Scientist использует математические алгоритмы, языки программирования и BI-инструменты для анализа и визуализации данных. Работают специалисты Data Science с данными любого формата: текст, таблица, фото, видео, звук.
В качестве примеров работы таких специалистов можно назвать прогнозы погоды, рекомендательные системы в онлайн-магазинах, системы распознавания лиц и отпечатков пальцев, чат-боты и многое другое.
3. Какие технологии необходимо освоить, чтобы стать Data Scientist. Откуда часто приходят в это направление? С чего начать?
Если говорить именно о технологиях, то я рекомендую начать с изучения языков программирования. Самый популярный в Data Science — Python, поэтому в первую очередь имеет смысл изучить его, хотя и другие языки тоже не стоит игнорировать, например, R.
Среди обязательных для изучения — SQL, который нужен для работы с базами данных, поскольку одним из важнейших процессов моделирования является, прежде всего, извлечение данных из различных источников. В большинстве случаев вам нужно будет уметь писать и запускать SQL-запросы к базам данных. С этого уже можно начинать.
Но в процессе изучения технических моментов вы так или иначе будете сталкиваться с теоретической частью, которая стоит за кодом, лучше всего изучать ее без отрыва от практики — так будет намного эффективнее и быстрее.
Если говорить о том, откуда чаще всего приходят в это направление, то я могу выделить три сферы – это анализ данных, статистика или математика и, естественно, программирование – и это вполне объяснимо, поскольку Data science включает в себя все эти три сферы.
Для того, чтобы стартовать, лучше всего начать с практической реализации какого-либо кейса, которых в изобилии на Kaggle. Если вы решите опубликованные там задания лучше остальных – то это будет очень хорошая запись в вашем резюме.
4. Есть ли специфика работы Data Scientist в финтехе? В чем особенность?
Для того, чтобы качественно проанализировать данные, Data scientist должен хорошо разбираться в специфике анализируемого объекта. Поэтому для работы в финтехе нужно знать, как работают те или иные финансовые инструменты, какие есть особенности государственного регулирования этой сферы, важно также разбираться в бухгалтерском и управленческом учете.
5. А какие сложности и преимущества работы на финтех проектах?
Большое преимущество работы в финтех секторе – высокое качество данных. Это связано с тем, что в компаниях этого сектора процессы сбора, проверки и хранения данных очень хорошо отлажены. Качественные данные «на входе» здорово экономят время специалистов Data Science на анализ данных и разработку моделей машинного обучения.
6. Данные захватят вселенную или мы справимся?
Данные сами по себе никого не захватят)) А вот технологии, разработанные на основе этих данных, вполне возможно и будут управлять человечеством. Даже сейчас мы читаем новости, которые нам «подбрасывают» соцсети, смотрим ролики, рекомендованные youtube.
Никто из нас не может с уверенностью сказать, что мысли в его голове – это его собственные мысли, а не навязанные извне. Но мы справимся или, правильнее сказать, адаптируемся к новой реальности.