ГРАЖДАНСКИЕ ДАТА-САЙЕНТИСТЫ – КТО ОНИ?

(Русский) Как работать с Big Data, не нанимая в штат специалиста по data science

Sorry, this entry is only available in Russian. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.

Большие данные становятся ключевым компонентом стратегии успешного бизнеса. Проекты Big Data требуют серьезных капитальных вложений. Набирающий популярность феномен citizen data science упрощает данный процесс. Он про то, как использовать потенциал своих сотрудников с максимальной отдачей, привлекая их для решения задач предсказательной аналитики.

 

Big Data и перспективы умного бизнеса

Про роль Big Data в организации современных стратегий бизнеса написаны сотни статей. Согласно последним опросам, 59% компаний по всему миру в 2018 году применяют технологии анализа больших данных в своей работе. В 2015 году их было 17%. Почти 80% руководителей предприятий считают Big Data важным компонентом построения умного бизнеса. Наибольший процент использования подобных технологий показали компании, связанные с телекоммуникациями, страхованием и рекламой.

Телекоммуникации, Страхование, Реклама, Финансовые сервисы, Медицина, Технологии, Образование, Государственные услуги, Ритейл, Производство.

 

Вариантов применения Big Data и построения на их основе решений по оптимизации бизнес-процессов множество: от персональных рекомендаций клиентам в области электронной коммерции, автоматизированного поиска сотрудников до улучшения работы производственных линий.

В России проекты больших данных успешно внедряют Новолипецкий металлургический комбинат, СИБУР и группа компаний «Русагро». Технологии помогают решать задачи сервисного обслуживания оборудования, оптимизации расходов сырья, настройки режимов работы систем производства.

Понятно, что позволить себе внедрение Big Data могут далеко не все. Средняя стоимость проекта оценивается в 7,5 млн. долларов. Основные статьи затрат – платформы хранения и обработки данных, средства интеграции, инструменты анализа и интерпретации.

Одно из главных препятствий на пути внедрения Big Data – дефицит высококлассных специалистов в области data science. Кто-то же должен вести и поддерживать проекты больших данных, данные необходимо готовить и приводить к правильному формату.

 

Citizen data science: демократизация больших данных

Оказывается, использовать Big Data для решения насущных задач бизнеса можно и не прибегая к услугам дорогостоящих специалистов по data science. В последнее время компании все чаще берут на вооружение стратегию citizen data science, когда анализом больших данных на предприятии занимаются сотрудники внутри отдельных подразделений без специального образования.

По сути, речь идет о демократизации больших данных, вернее даже «коммунизации». Поскольку подобный феномен явно противоречит классической теории формирования организационной структуры управления. Он, скорее, совпадает с тем, как видел дальнейшее развитие трудовых отношений Карл Маркс – в преодолении разрыва между физическим (выполнение повторяемых операций) и умственным трудом.

Сам термин citizen data science в 2016 году запустил Gartner для описания возможностей, которые небольшие компании могут извлечь из больших данных без привлечения специалистов по business intelligence, создания сложных систем аналитики, своими силами, с помощью доступных сервисов и приложений. 

В 2017 году аналитики Gartner пришли к выводу, что спрос на «гражданских» дата-сайентистов будет расти в 5 раз быстрее, чем на специалистов с профильным образованием и навыками в этой области.

Американский ритейлер Sears недавно наделил 400 сотрудников дополнительными функциями для проведения операций по сегментации клиентов на основе больших данных. Раньше подобной работой занимались в компании специалисты по data science с докторской степенью. В результате были сэкономлены сотни тысяч долларов.

Прежде всего, само использование Big Data подразумевает наличие в компании этих самых больших данных и переориентацию от прогнозирования, основанного на традиционных статистических моделях, к предсказательной (predictive) аналитике с применением машинного обучения и AI.

Существующие приложения для анализа производственной цепочки и цепочки поставок предприятия помогают отслеживать кучу полезных индикаторов – от временных затрат до наличия востребованных позиций товаров на складе. Есть задачи, которые подобные инструменты не в состоянии решить.

Для примера возьмем транспортную компанию. Интуитивно руководитель кадрового отдела понимает, что водители меняются с определенной периодичностью. Каждый раз приходится тратить время, чтобы найти им замену, что ведет к простою техники и финансовым потерям. Инструменты предиктивной аналитики способны переводить все это в цифры, следовательно, оптимизировать затраты.

На рынке представлены инструменты автоматизированной аналитики, которые позволяют людям без специальных знаний извлекать полезную информацию из Big Data. Например, в Envision применяют программный пакет Sisense, который выдает предупреждения о статистически важных изменениях в заданных метриках.

Наивно думать, что гражданские дата-сайентисты способны полностью заменить специалистов по data science. Сегодня это, скорее, дополнение к масштабным проектам крупных компаний в данной области. Они помогают заполнить пробел между желанием иметь полную картину происходящего и ограниченными возможностями, беря на себя ряд задач, связанных с аналитикой больших данных:

  • ручной ввод информации в ситуации, когда эти операции нет возможности быстро автоматизировать;
  • просмотр наборов данных на предмет ошибок;
  • техническая поддержка аналитических инструментов;
  • тестирование и проверка полученных результатов.

 

Как организовать работу с Big Data в компании

Работа с данными и статистическими моделями – не очень привлекательное занятие для большинства людей. Если человек интересуется этим направлением, вероятней всего, он станет профессиональным специалистом по data science. Для того чтобы привлечь часть своих сотрудников к работе с Big Data потребуется мотивация и минимальное обучение.

Блог Syncsort предлагает к реализации следующую стратегию.

1. Сделайте рабочие данные открытыми, когда это позволяют соображения безопасности.

Наборы данных, в принципе, может просматривать любой сотрудник внутри компании. Многие же с интересом изучают движение биржевых индексов, не имея брокерских счетов. Возможно, знакомство со статистическими показателями работы организации даст стимул рядовым работникам работать над их улучшением.

2. Обучайте.

Нет смысла тренировать каждого сотрудника пользоваться Hadoop или писать R-скрипты. Можно просто выложить в открытый доступ обучающие материалы и видео, как работают применяемые в компании инструменты анализа данных.

3. Позаботьтесь о мотивации.

Стимулы могут быть как материальные, в виде денежных поощрений, так и нематериальные. Полезно объяснять цели и задачи, которые реализуются с помощью проекта.

4. Обновите политику управления данными.

Это не противоречит первому пункту. Если вы предоставляете доступ непрофессионалам к операциям с данными, необходимо убедиться, что они будут использованы по назначению.

5. Сделайте операции с данными проще.

Работа с данными и аналитикой в любом случае подразумевает наличие определенных навыков. Операции с данными можно облегчить для обычных сотрудников, если упорядочит весь процесс. Здесь на помощь приходят инструменты автоматизации.

Citizen data science – это возможность применять в бизнесе инструменты аналитики Big Data, не дожидаясь пока появятся средства для найма специалиста по дата-сайенс и реализации масштабного проекта.

В будущем успех компаний будет зависеть от умения извлекать максимум пользы из всего массива имеющейся информации. Но научный подход требует слишком много времени и ресурсов. Более эффективно – использовать потенциал собственных сотрудников и готовые инструменты и приложения для предсказательной аналитики.