it Новости 5 мифов о специальности Data Scientist
5 мифов о специальности Data Scientist

5 мифов о специальности Data Scientist

1 027
20 октября 2020 в 14:38

Эта профессия относительно новая, поэтому она пока остается овеянной мифами. Мы решили рассказать вам о самых популярных заблуждениях относительно Data Science и заодно окончательно их развеять.

Без специального образования нельзя стать исследователем данных 

Это один из наиболее распространенных предрассудков – что Data Scientists обязательно должны быть специалистами в математических науках и статистике. Конечно, базовое понимание необходимо, но у многих разработчиков оно и так есть благодаря курсам, прослушанным еще в вузе. Вы можете работать в сфере Data Science и без степени в статистике либо математике. Тем не менее, если вы хотите заниматься серьезными проектами, вам будет необходимо постоянно расширять свои знания.


Чтобы попасть в эту профессию, нужен диплом

На самом деле, освоить все знания, умения и навыки, необходимые Data Scientist, можно самостоятельно. Главное понимать, что специалисты этой сферы бывают двух типов: те, кто работает с прикладной наукой, и те, кто занимается исследовательской. 


Первая подразумевает работу с уже существующими алгоритмами, а значит нужно понимать их особенности. Основная задача прикладных специалистов – применять методы науки о данных в конкретных программах и проектах. Главным образом в профессии необходимы именно специалисты-прикладники.



Но если вам хочется стать исследователем, тогда диплом кандидата наук очень пригодиться: скорее всего, вам понадобятся навыки создания уникальных алгоритмов, умение их тестировать, оптимизировать, а также писать научные статьи и пр. Так что если вы планируете достичь больших высот в карьере, получить ученую степень – замечательная идея. 


Но обратим ваше внимание: получение степени требует больших затрат: и времени, и финансов, и моральных сил. Так что первым делом хорошо подумайте: в каком направлении вы стремитесь развиваться? Прежде чем идти в Data Scientist, обязательно задумайтесь над этим!


В Data Science нуждаются исключительно крупные организации, располагающие большими ресурсами 

Большинство предпринимателей неправильно понимают Data Science. К сожалению, очень распространено заблуждение, будто эта наука необходима лишь крупным фирмам. В его основе лежит неправильное представление, какие существуют требования к сфере обработки данных, и какую ценность она представляет для бизнеса. На самом деле, аналитическая структура не обязательно должна быть большой – чаще всего достаточно лишь группы людей и вполне разумных финансовых вложений, чтобы точно и эффективно обрабатывать данные.


Еще один популярный миф о Data Science в бизнес-проектах: многие считают, что с помощью науки о данных можно найти решение любой проблемы. В результате заказчики ожидают получить от команды результаты, которые просто нереально достичь. 


Суть Data Science заключается лишь в построении моделей

Довольно распространено мнение, что Data Science = создание моделей, значит, Data Scientist занимается только их построением, видоизменением и оптимизацией. 


В действительности же работа этих специалистов включает гораздо больше аспектов: это и поиск данных, и отсеивание ненужной информации, проверка, обработка, исследовательский анализ, прочее. Т.е. построение моделей – всего лишь один из множества уровней, которые составляют весь жизненный цикл любого проекта. А выглядит он приблизительно так:

  1. Формулировка задач.
  2. Выдвижение гипотезы.
  3. Поиск и сбор данных.
  4. Фильтрация, очистка информации.
  5. Исследовательский анализ.
  6. Разработка проекта модели.
  7. Тесты или верификация модели.
  8. Повторная проверка и доработка в случае выявления ошибки.
  9. Развертывание модели – старт производства.


В будущем на смену Data Science придет ИИ

Чем дальше, тем больше сфера Data Science автоматизируется. Поэтому и возникло популярное заблуждение, что совсем скоро ИИ полностью заменит человека. В качестве главного аргумента часто называют то, что компьютер, как правило, умеет находить закономерности лучше любых профессионалов. Но на самом деле это не играет ключевой роли.



Скорее всего, ИИ действительно доверят выполнение определенных рутинных задач, например, очистку данных или их подготовку. Но с основными интеллектуальными операциями способен справиться только человек. 


Естественно, что большинство задач в Data Science хотят автоматизировать, поэтому разрабатываются все более совершенные и сложные алгоритмы, которые обладают достаточным потенциалом, чтобы прийти на замену Data Scientists. Но полное замещение все еще остается маловероятным, ведь какой бы продвинутой ни была информационная система, ей все равно необходимо человеческое руководство и готовый набор базовых инструкций.

Больше интересных новостей

Комментарии для сайта Cackle