Data Science (la ciencia de los datos) y Big Data son términos en boga. Muchos proyectos de investigación se centran únicamente en la recolección de datos y su posterior almacenamiento en enormes repositorios. Sin embargo, el verdadero valor que puede potenciar el despegue de los datos como ciencia no es su recolección tal cual sino en la disponibilidad de herramientas de análisis, integración, búsqueda y transformación de datos que sepan operar con grande volúmenes de datos complejos, de tipos distintos y contextos variados, como los que se encuentran en Big Data. El termino ciencia en Data Science se refiere pues a la necesidad de encontrar nuevos algoritmos de integración que sepan unir (no reescribir en otro lenguaje otra vez) piezas ya existentes, ponerlas a trabajar en arquitecturas basadas en módulos integrables y compatibles con los requisitos de Big Data, y que ademas sepan sacar el máximo jugo a esos datos. Complicado? Mejor reutilizar y convertir formatos de datos que escribir miles de algoritmos de nuevo, no? Todo esto nos lo cuenta Chris A Mattman, jefe del proyecto para iniciativas de Big Data de la NASA en el comentario de abajo.
C.A. Mattman. A vision for data science. Nature 493:473-475. doi:10.1038/493473a
No hay comentarios:
Publicar un comentario