В кульминационном фильме «Скрытые фигуры», номинированном на премию «Оскар», математик Кэтрин Джонсон призвана проверить расчеты координат посадки космической капсулы Джона Гленна «Дружба 7. Технология» только что заменила человеческие компьютеры, вычисляющих данные людей, выполнивших сложные уравнения до появления компьютерной системы, но данные с машины имели несоответствия, которые должен был решить человек.
Это была наука о данных в 1961 году. В наши дни все немного по-другому. Сложные системы сбора данных позволяют компаниям в каждом секторе узнать больше о своем бизнесе, клиентах и будущих перспективах. Но, как и в «Скрытых фигурах», людям все еще нужно найти важные истины в данных.
Здесь вы найдете информацию о том, как мы ежедневно используем науку о данных, и об основных навыках, которые необходимы вам, чтобы стать успешным ученым, инженером или аналитиком.
Наука о данных везде
Потенциал для ученых данных далеко за пределами финансовой и технической отраслей процветает. «Во всех секторах растет осознание того, что навыки работы с данными стали необходимыми для конкуренции и совершенствования на современном рынке», - говорит Майкл Галвин, исполнительный директор компании Data Science Corporate Training для Metis, компании по обучению навыкам работы с данными, работающей с частными лицами и предприятиями.,
Подумай о печенье. Нет, не те, которые вы добавляете в молоко - мощные инструменты сбора данных, которые помогают аналитикам данных, ученым и инженерам узнавать о привычках потребителей в Интернете и информировать алгоритмы, основанные на принципах «как они знали, я просто думал» -то-что ?! »реклама, которую мы показываем на Facebook. Их цель? Оценить интересы и поведение потребителей и использовать эту аналитику для принятия ключевых бизнес-решений - для компаний во всех секторах.
«Существует широкое понимание науки о данных в мейнстриме. Наука данных затрагивает все, от покупок Amazon до разгула Netflix, затрагивает больше людей, чем когда-либо прежде », - говорит Галвин.
Как вы вписываетесь
С ростом областей науки о данных возросло частичное совпадение ролей исследователя данных, аналитика данных и разработчика моделей.
Но, по словам доктора Флавио Вильянустре, вице-президента по технологиям и системам HPCC для LexisNexis Risk Solutions, различие между различными позициями на самом деле совершенно уникально и предоставляет возможности для одаренных в конкретных областях.
«Аналитики данных традиционно специализируются на методах манипулирования данными, которые требуют обучения всему, от языков запросов до графических моделей данных», - говорит Вилланустре. «Тем временем разработчики моделей анализируют числовые данные на предмет корреляций и закономерностей».
Когда дело доходит до науки данных, Вилланустре объясняет, что идеальные кандидаты должны продемонстрировать расширенный набор этих двух типов навыков в сочетании с предметными и бизнес-знаниями. «Специалисты по данным обычно обладают более глубокими знаниями, чем аналитик данных о методах программирования, и более широкими знаниями, чем разработчики статистических моделей, о методологиях анализа данных с использованием более сложных методов».
При подаче заявления на эти должности важно отметить, какие задачи действительно хочет выполнить компания.
«Шум вокруг науки о данных привел к тому, что многие компании нанимают ученых, занимающихся данными, для выполнения работы аналитика данных, который заканчивает очисткой и подготовкой данных и тратит очень мало времени на изучение фактических данных», - объясняет Ник Крамер, старший директор по данным и аналитике в SSA & Company, консалтинговая фирма, которая специализируется на превращении анализа больших данных в операции для компаний.
Новые инструменты позволяют создавать аналитические модели для людей с более низким уровнем знаний, поэтому разносторонние, связанные с ними навыки, такие как знание бизнеса и эффективные навыки общения, важны для того, чтобы выделить ищущих работу. При проведении собеседования обязательно задавайте вопросы, чтобы точно определить, что именно ищет компания, а затем продемонстрируйте свои сильные стороны соответствующим образом.
Наш офис
Что нужно для успеха
Старая пословица о том, что не нужно видеть лес за деревьями, очень важна для запоминания, когда вы работаете в качестве ученого, аналитика или инженера. В то время как точность основных данных важна, она также признает общую картину проблем, которые компания надеется решить.
«Среди исследователей данных существует тенденция слишком усложнять вещи и погружаться в черную дыру деталей», - предупреждает Галвин. «Вместо этого им следует подумать о бизнес-проблеме, которую они пытаются решить, заставить что-то работать, а затем повторить».
Кроме того, интерес к тому, что вы делаете - как и к любой другой работе - также важен.
«Компании работают с различными видами данных (например, изображения, текстовые и финансовые данные) по разным проблемам. Вы должны быть заинтересованы и понимать, с какими данными вы будете работать, чтобы добиться успеха », - сказал Гальвин. «Например, специалисты по обработке данных, работающие с медицинскими изображениями, обычно сами не являются врачами, но их конечный пользователь или клиент будет врачом. Можете ли вы понять, какие проблемы они пытаются решить? Вы заинтересованы в решении этих проблем? »
А потом есть общение. Говорят, что специалисты в области данных, аналитики и инженеры говорят на своем родном языке, но чтобы добиться успеха на рабочем месте, вам необходимо иметь возможность четко общаться с теми, кто будет использовать ваши навыки и извлекать наибольшую пользу.
«Сотрудничество с заинтересованными сторонами становится все более важным», - сказал Крамер.
Наука о данных и связанные с ней карьеры прошли долгий путь с 1960-х годов, когда НАСА нуждалось в человеческих компьютерах для использования и проверки работы новых компьютерных машин. Но блестящие умы, заинтересованные в том, как данные могут формировать то, как мы живем, работаем и ведем бизнес, по-прежнему так же важны, как и раньше - без человеческого эксперта, который бы мог интерпретировать как входные данные, так и результаты, науку о данных можно было бы дико неправильно использовать или просто ввести в заблуждение.