Особенности профессии Data Scientist
Покупки в супермаркетах, транзакции клиентов банков, активность пользователей в соцсетях, лайки, подписки, плотность транспортного потока, рождаемость, смертность – это все большие данные, или Big Data. Их количество каждый день увеличивается в геометрической прогрессии.
Результаты проведенного анализа используются для создания кода, или прогнозных моделей, с помощью которых определяются бизнес-стратегии компаний.
Но обработкой информации дата сайентист занимается не самостоятельно – такие массивы данных, к сожалению, неподвластны человеческому мозгу Специалист создает нейронные сети, обладающие запредельными вычислительными мощностями, и обучает их находить связи и закономерности среди загруженной информации.
Для создания искусственного интеллекта data scientist должен обладать следующими профессиональными навыками:
- Математический анализ. Некоторые считают, что достаточно просто уметь писать код. Однако это не так. Без знания математики обучить нейронные сети невозможно, а без логики не получится сделать правильные выводы. Не переживайте, новичку уровня junior хватит основ, но по мере погружения в профессию знания придется постепенно совершенствовать.
- Mashine Learning, или обучение машин. Поскольку первичную обработку массивов данных data scientist поручает компьютеру, сначала он создает нейронку. После чего с помощью кода учит ее самостоятельно анализировать поступающую информацию.
- Языки программирования. Обязательные – Phyton и R. Еще могут понадобиться C, C++, Java Script. Этот перечень дополняют SQL, библиотеки и фреймворки.
- Работа с Big Data. Редко когда дата-сайентисту предоставляют готовую для анализа информацию. Как правило, специалист добывает данные самостоятельно: на соответствующих ресурсах, в социальных сетях, от сторонних поставщиков, в научных публикациях. Каждый data scientist формирует личный перечень каналов.
Это только базовые навыки. В зависимости от специфики деятельности компании их перечень значительно расширяется. Кроме того, исследователь данных должен обладать специфическим набором soft skills. Среди самых востребованных личных качеств – наблюдательность, любопытство, многозадачность, терпеливость, находчивость.
Где учиться на Data Scientist
Если вы новичок в области анализа данных и интересуетесь, как стать data scientist с нуля, то смеем вас заверить – это вполне реально.
План действий по освоению новой профессии напрямую зависит от вашего бэкграунда:
- Программистам и веб-разработчикам на переквалификацию потребуется потратить всего 5-6 месяцев. Любая IT-профессия уже предполагает наличие базовых математических знаний. Если вы входите в эту категорию, будет достаточно пройти 1-2 профильных курса.
- Людям с техническим образованием придется сначала посвятить время изучению информатики и программирования. После чего – заняться повышением квалификации.
- Гуманитариям необходимо начинать с изучения математики и программирования и только потом переходить непосредственно к курсам по Data Science. В общей сложности на обучение понадобится много времени и финансов, поэтому советуем сразу получить соответствующее высшее образование. Сегодня на базе вузов можно освоить много специальностей, связанных с большими данными.
- Сложнее всего придется тем, кто думает, как стать data scientist без какого-либо образования. Однако сейчас разработано много курсов специально для новичков, включающих все необходимое для начинающего дата сайентиста. Но учтите, чтобы обучиться исследованию данных с нуля, потребуется затратить много времени и постоянно подтягивать знания.
Стоит отметить, что многое зависит от поставленной цели. Если вы планируете пополнить ряды специалистов уровня джуниор и обладаете достаточной мотивацией, у вас получится освоить профессию самостоятельно. При этом главная проблема – выбрать правильные ресурсы из обилия источников.
Начинать нужно с основ математики, поэтому рекомендуем прочитать «Математический анализ» Липмана Берса. Материал изложен доступным языком и подходит для новичков. Из российской литературы советуем книгу Ильи Виосагмира «Высшая математика для чайников. Производные и дифференциалы».
После изучения азов приступайте к прохождению соответствующих онлайн-курсов. Вот несколько бесплатных вариантов:
- Основы статистики;
- Data Science: будущее для каждого;
- Питонтьютор;
- Phyton: основы и применение;
- Нейронные сети;
- Ускоренный курс машинного обучения;
- Практики оперативной аналитики в MS Excel.
Тем, кто планирует достичь уровней middle и senior придется учиться по более углубленным программам. Для прокачки базовых навыков рекомендуем выбрать одну из следующих образовательных платформ:
В интернете есть еще много содержательных программ по изучению Data Science. Если осваивать профессию с нуля, то через 2-3 года можно приступать к просмотру вакансий.
Как устроиться на работу
Итак, вы прошли соответствующее обучение, закрепили знания на практике, собрали портфолио с кейсами… Что делать дальше?
Кроме того, к дата сайентистам предъявляются достаточно высокие требования. Поэтому на трудоустройство обычно уходит от 2 до 6 месяцев, а иногда и целый год. Чтобы не терять времени даром, рекомендуем выполнить несколько последовательных действий:
Шаг 1. Составьте резюме. При устройстве в крупную компанию для заполнения лучше использовать онлайн-конструктор.
Шаг 2. Ищите подходящие вакансии и оставляйте отклики. При этом корректируйте свою анкету под требования каждого конкретного нанимателя.
Шаг 3. Пока ищете работу, продолжайте практиковаться. В идеале нужно каждый день становиться более продвинутым специалистом. Решайте датсеты, участвуйте в хакатонах и соревнованиях по Data Science. Кстати, подобный опыт будет дополнительным преимуществом в вашем резюме.
Как правило, это интервью с рекрутером, тестирование на hard и soft skills, встреча с руководителем проекта. В зависимости от внутренней политики компании вы можете столкнуться с дополнительными испытаниями.
Если же работодатель отдал предпочтение другому претенденту, не отчаивайтесь. Вместо этого спросите у рекрутера, чего вам не хватило для получения должности. Как правило, HR-специалисты готовы предоставить каждому соискателю письменное обоснование отказа в трудоустройстве — это поможет сделать выводы и провести работу над ошибками.
В случае неудачи продолжайте оставлять отклики на вакансии. Помните, что кто ищет, тот всегда найдет. Чем больше собеседований вы пройдете, тем лучше отточите нужные навыки, и тем более уверенно будете себя чувствовать во время прохождения испытаний.
Когда можно с уверенностью сказать, что вы стали классным специалистом? Ответ прост. Когда вы понимаете бизнес-процессы, умеете структурировать информацию, делать прогнозы, находить ошибки и неявные закономерности. А если не можете самостоятельно справиться с поставленной задачей – знаете, куда обратиться за подсказкой.