Разделы

Новое в СХД

Лучший способ организовать Data Science в компании. Взгляд NetApp

После того, как мир взорвался потоком больших данных, компании по всему миру начали исследования последствий этого «большого взрыва». Наука о данных, призванная обеспечить бизнес не просто информацией, но знаниями, дошла и до России. С одной стороны, местные корпорации начинают строить свои собственные дата-центры, желая получить самые новые технологии по самой низкой цене. С другой стороны, игроки разных сфер рынка открывают собственные отделы, занимающиеся Data Science. Данные становятся одним из главных активов для бизнеса, а профессия специалиста по исследованию данных – особо привлекательной и высокооплачиваемой.

Если ваша компания решила открыть свой отдел по работе с Data Science и привлечь соответствующих – и при этом весьма дорогих – специалистов, то первое, о чем стоит задуматься, это о вопросе организации работы отдела и его связке с ИТ-департаментом. Чем более эффективно будет работать эта связка, тем больше шансов на успешность проектов, которыми занимается отдел по изучению данных.

В соответствии с недавним отчетом международной консалтинговой компании McKinsey, который она представила в декабре 2016 г., организационная проблема – это основное препятствие, мешающее бизнесу извлекать максимальную выгоду из потока данных. По мнению аналитиков McKinsey, многие компании до сих пор борются за то, чтобы внедрить в повседневные бизнес-процессы те крупицы знаний, которые были получены из неструктурированной информации.

Итак, скажем несколько слов об организации работы отдела по исследованию данных и его связи с ИТ-департаментом. Существует, как минимум, 5 моделей того, как можно устроить такое взаимодействие.

Модели взаимодействия ИТ и Data Science

  • ИТ отдельно, Data Science – отдельно. В этой модели сотрудники из ИТ-отдела помогают специалистам по работе с данными только в той части, которая касается повседневных нужд в жизни организации. И на этом их функция заканчивается. Аналитики трудятся каждый над своей проблемой.
  • Data Science внутри ИТ-отдела. Эта модель прямо противоположна описанной выше. Здесь исследователи работают внутри ИТ-отдела, являясь его непосредственной частью. Они сотрудники этого отдела, и анализ данных – только часть их обязанностей, помимо, например, программирования.
  • Data Science как отдельная компания. В этом случае отдел по работе с данными функционирует как самостоятельная дочерняя структура под управлением отдельно выделенного директора.
  • «Бродячие» консультанты. Ваши сотрудники по работе с данными могут работать в самых разных отделах, включая и ИТ-отдел. Объединены они будут только общим названием – data scientists, однако работать будут порознь, собираясь вместе для того, чтобы определить дальнейшую судьбу очередного проекта.
  • Data Science как Центр компетенций. Это смешанная модель, в которой исследователи данных работают с конкретными бизнес-задачами компании, а ИТ-отдел, в свою очередь, направляет и поддерживает эту деятельность, служа центром, в котором объединяются все проекты по исследованию информации.

В NetApp задумались над тем, какая модель будет наиболее полезна бизнесу. Пытаясь ответить на этот вопрос, там обратились не только к опыту и к культуре, принятой в компании, но также провели отраслевые исследования и проконсультировались с экспертами. В результате пришли к выводу, что именно последняя, пятая модель наиболее полно отвечает запросам бизнеса.

Когда компания организует у себя отдел по работе с данными, то лучший вариант – это сделать Центр компетенций, то есть место, где будет проводиться анализ, разработки и где аккумулируется самый ценный опыт и лучшие примеры из практики. Здесь управляют проектами, исследуют данные и обучают коллег. Таким образом, никто из сотрудников не будет оторван от реальности: они смогут консультироваться с теми, кто хорошо разбирается в бизнес-процессах компании, смогут получать локальные данные из всех источников, к которым компания имеет доступ, а кроме того, получат техническую поддержку ИТ, когда построенные модели будут подготавливаться к использованию.

Что конкретно может дать такой Центр компетенций тем, кто исследует данные? Во-первых, это работа в команде. «Data Science – командная игра. И результат в ней зависит не только от компетенции сотрудников разных отделов внутри компании, но и от их совместной работы, – сказала Татьяна Бочарникова, глава представительства NetApp в России и странах СНГ. – На наш взгляд, рецепт успеха в данной сфере – это создание команд, где будут присутствовать как навыки Data Science и инженерии данных, так и четкое понимание бизнес-процессов».

Джуниорам, новичкам в Data Science часто не хватает знаний, особенно тех, что лежат за пределами их функциональных обязанностей. Они могут иметь очень слабое представление о бизнес-процессах внутри компании, обо всех нюансах и подводных камнях, которые скрываются за деятельностью разных отделов. Тем не менее, эти знания нужны им, чтобы результаты работы даже джуниоров использовались, в том числе, и другими командами. Работая в Центре компетенций Data Science, младшие исследователи могут устранить свой недостаток знаний в обсуждениях со старшими специалистами и обучиться недостающим навыкам под руководством ИТ-совета, который будет направлять их. В России это особенно актуально, так как, согласно опросам, проведенным здесь компанией JetBrains в 2018 году, уровень образования отечественных аналитиков больших данных ниже, чем общемировой, при этом возрастные категории совпадают.

Впрочем, не обязательно быть джуниором, чтобы не разбираться в конкретных бизнес-процессах отдельно взятой компании. Каждая организация имеет свои тонкости работы, в то время как специалист по Data Science получил образование вовсе не в рамках программ MBA, а на математическом факультете, на курсах по статистике и языкам программирования Python или R. Именно поэтому Центр компетенций может стать местом, где разного рода специалисты, встречаясь и обсуждая насущные проблемы, смогут восполнять пробелы в знаниях друг друга. Исследователю необходим эксперт в бизнес-процессах именно той корпорации, где этот исследователь занимается обработкой данных. В противном случае он не сможет быть полезен компании на 100 процентов. Много аналитиков Data Science качают свои виртуальные мышцы на соревнованиях Kaggle и решают там сложнейшие задачи, однако практика в реальной жизни предъявляет к ним другие требования: как в интерпретации результатов, так и в надежности.

Во-вторых, Центр компетенций – это своего рода стартовая площадка для тех, кто хочет в принципе углубить свои знания и вырасти как профессионал в определенной области. В нашем случае в области Data Science. Это, на самом деле, командный вид спорта, и специалисту будет очень полезно находиться в среде, где происходит живой обмен знаниями.

Согласно уже упоминаемым опросам от JetBrains, средняя сумма заработной платы data scientist с опытом работы от 6 до 10 лет в нашей стране составляет p221 тыс. в месяц. При этом средняя зарплата специалиста, который не работает с Big Data – p127 тыс. Разница почти в 2 раза. В таких условиях нанять человека, что называется, «два в одном», который бы не только работал с данными, но и знал при этом саму отрасль, сферу бизнеса компании изнутри, представляется предельно затратным, а то и вовсе невозможным предприятием. Для компании, которая хочет сэкономить, свой Центр компетенций может стать хорошим ответом.

Именно так организована команда IT Enterprise Architecture (EA) внутри компании NetApp. Она отвечает за определение направлений, в которых будут развиваться информационные технологии нашего предприятия, за стратегию и за организацию многообещающей аналитики больших данных.

Плюсы от организации Центра компетенций

  • Повышается прозрачность процессов внутри компании.
  • Налаживается коммуникация и сотрудничество между бизнес-командами и ИТ-отделом.
  • У сотрудников формируется общее видение каждого отдельного проекта, что помогает избегать «изобретения велосипедов» разными отделами.
  • Обеспечивается доступ к данным из разных ресурсов компании, а также улучшается соответствие нормативным требованиям внутри организации.
  • Модели данных проверяются и обсуждаются разными специалистами.
  • ИТ-ресурсы консолидируются в одном месте, что помогает улучшать технологии и развивать платформу для эффективного использования Data Science.
  • Появляется возможность предоставлять мощности компании в аренду тем бизнесам, которые желали бы, но пока не могут иметь собственные команды аналитиков по работе с большими данными.
  • Нарабатывается хороший опыт, успешные решения внедряются в практику быстрее.