Si en otro post del blog de nuestra consultora informática hablábamos de la creciente demanda de expertos en Big Data, en esta entrada nos queremos centrar en un perfil más específico aún: el científico de datos o data scientist.
Es un perfil profesional que lo que hace es traducir los grandes volúmenes de información disponibles, el llamado Big Data. Datos que vienen de toda clase de fuentes de información masivas. Lo que hace el data scientist es convertirlos en respuestas.
El científico de datos trabaja en cualquier tipo de negocio e industria con el fin de obtener respuestas fiables a problemas cotidianos. Por ejemplo, para predecir los gustos de los usuarios y mostrarles las mejores opciones para que se acaben convirtiendo en clientes. Mejorando así la tasa de conversión de la que tanto se habla en el campo del marketing digital.
Estos perfiles destacan por tener amplios conocimientos matemáticos y estadísticos. Además, han de dominar el software estadístico, la programación y los sistemas de análisis de datos masivos como, por ejemplo, el machine learning. También controlan la tecnología y las bases de datos para ser capaces de aportar cambios y mejoras.
Un campo con mucho futuro
El Big Data se refiere a los sistemas capaces de manejar grandes cantidades de información, variada y a gran velocidad. Cuatro conceptos (las “V”) explican la base del Big Data: volumen, velocidad, variedad y veracidad.
El data scientist (científico de datos) no sólo obtiene los datos de una única fuente como puede hacer un analista de datos. Además, debe extraer y examinar mucha información y ser capaz de disponer de una visión amplia y global del problema y sin excluir ninguna solución si los datos empujan a adoptarla.
El científico de datos en las empresas
Su cometido no es solo extraer datos sino también valorarlos. Su metodología de trabajo suele ser la siguiente:
- Extraer datos sin atender a la fuente ni al volumen.
- Limpiar los datos.
- Procesar los datos con métodos estadísticos.
- Rediseñar los datos si es necesario.
El Científico de Datos, además de explorar continuamente nuevas fuentes de información, da valor a los datos y busca nuevas ideas a través del Big Data.
El data scientist ha de tener una gran capacidad de aprendizaje, ser creativo y establecer sinergias entre los distintos departamentos de la empresa donde preste servicios. Además, debe tener visión de negocio.
Es básico que tenga conocimientos informáticos, matemáticos y estadísticos para codificar, crear hipótesis, comprender y comparar los distintos modelos, manejar la probabilidad y resolver varios cálculos.
De hecho, en Imagar somos conscientes de que muchas empresas ya tienen un data scientist en sus plantillas. La demanda de estos profesionales está creciendo exponencialmente. Gigantes como Amazon, American Express o Caixabank ya apuestan por este perfil. Entre otras cosas, para potenciar sus departamentos comerciales y de gestión. Como ves, hoy la interpretación de datos es de vital importancia para las entidades. Por eso, la de data scientist es una profesión con futuro.
Podríamos decir que son una especie de mezcla entre matemáticos, científicos en computación y observadores de tendencias. Muchos empezaron su carrera como estadísticos o analistas de datos. Pero según comenzaron a crecer el Big Data y las tecnologías de almacenaje y procesamiento, esos roles evolucionaron.
Trabajan en tres campos de actividad principalmente:
- Describir los datos (análisis descriptivo): por ejemplo, para responder a preguntas como ¿quiénes son mis clientes?
- Predecir qué pasará en el futuro (análisis predictivo): conocer cómo evolucionará la compañía. Por ejemplo, ¿qué clientes generan mayor valor? o ¿qué acciones de marketing implementar?
- Prescribir (análisis prescriptivo): el objetivo es llevar a cabo acciones que se derivan del análisis. El científico de datos participa en la toma de decisiones y define procesos a partir del análisis de datos.