Los arquitectos de soluciones OSS y BSS hacen todo lo posible para diseñar y crear las canalizaciones ETL (de extracción, transformación y carga) de datos. Es un trabajo bien intenso de ingeniería: desde la consideración de diversas fuentes de datos hasta los canales para moverlos adonde sea necesario para la solución general.
A menudo se trata de identificar las fuentes y simplemente asumir que, si los datos están allí, deben de extraerse, transformarse y cargarse en la base de datos OSS/BSS. Sin embargo, muchos de los datos que se recopilan para el OSS/BSS nunca se utilizan. No se comprende ni la intención de datos, ni cómo se utilizarán, ni cómo podrán utilizarse. Tampoco se piensa mucho en todas las formas innovadoras en las que podrían utilizarse.
Puede que todo esto tenga sentido ya que el ingeniero de datos tendrá objetivos completamente diferentes a los del equipo de ciencia de datos. Los ingenieros de datos construyen las tuberías; los científicos de datos buscan cómo extraer de ahí la información comercial.
Linaje de datos ETL antes y después de la entrada en la base de datos OSS/BSS
Dentro de este marco, el linaje de datos se convierte en un concepto interesante. El linaje significa la capacidad de rastrear el historial de datos, o en este caso, su cadena ETL. El linaje puede revelar:
- ¿Dónde empezó?
- ¿Cómo se transformó?
- ¿Dónde / cómo se cargó?
- ¿Cómo se combinó con otra información para formular unas conclusiones adicionales?
- Etc.
En el sentido típico, el linaje de datos significa tener la capacidad de registrar el sistema o la dirección de origen (p.ej. un sistema de gestión de elementos particular, el EMS) y hacer referencia a eso con el punto de datos cargado en la base de datos OSS o BSS. Es decir, poder rastrear su linaje antes de llegar a la base de datos OSS/BSS.
Sin embargo, a nosotros nos parece que el linaje también deba rastrearse después de la entrada en una base de datos OSS/BSS. Entonces surgen las preguntas como:
- ¿Qué ideas identificó?
- ¿Se utilizaron los datos? ¿O quizás tan solo se recopilaron y nunca se volvieron a tocar, ni por un ser humano, ni por una interacción con máquina?
- ¿Con qué otras fuentes de información se alimentó?
- ¿Quién lo usó?
- ¿Interactuaron con él los seres humanos o máquinas (particularmente IA/AA)?
- ¿Se formó una línea de base / punto de referencia a partir del cual se podrían identificar futuras perturbaciones y desarrollar circuitos de retroalimentación?
- ¿Es lo suficientemente importante como para aparecer en los tableros ejecutivos?
- ¿Pierde su relevancia con el paso de tiempo?
- ¿Se aplican políticas de envejecimiento?
- ¿Se interviene (y actualiza) con el paso de tiempo? O bien, ¿la relevancia que tienen los datos es de un solo uso?
- Etc.
El linaje es relevante para el ingeniero de datos hasta la carga inicial. Después, tiene mayor relevancia para los científicos de datos. Opinamos que, igualmente, tiene potencial de informar al ingeniero de datos y ayudar en sus diseños, especialmente si grandes cantidades de datos nunca se usan y solo hacen que aumenten los costos de ETL (y conservación).
La amplitud de cobertura proporcionada por la suite SunVizion (mire el diagrama a continuación) significa que hay una gran diversidad de datos disponibles para alimentar otros puntos de datos. Están recopilados en un formato común, lo que lo hace muy adecuado para el entrecruzamiento.
De hecho, las herramientas de generación de informes de SunVizion brindan a los usuarios y administradores las posibilidades de cruzar fácilmente los datos de muchas formas, con el fin de sacar las conclusiones importantes.
El siguiente diagrama proporciona un mapa de calor de la cantidad de puntos de dirección dentro de una región determinada.
A nivel alto, esto se realiza mediante unas referencias cruzadas de los datos BSS (puntos de dirección) con los datos OSS (áreas de servicio) y puede enriquecerse para proporcionar varias conclusiones más.
Por ejemplo:
- Podría enriquecerse con los datos que indiquen si los puntos de dirección representan a los clientes presentes, hogares que están a lo largo de la ruta de la conexión —pero no conectados todavía—, los que no se encuentran cerca de la infraestructura aún, los que recibirán pronto la infraestructura planificada, si contienen clientes perdidos recientemente, y muchas otras consideraciones. Es información poderosa para los grupos que trabajan de cara al cliente, como marketing y ventas.
- Podría enriquecerse con los datos recientes de estado/eventos de la red, tendencias históricas, niveles de utilización, objetivos de aumento de la red y muchos otros. Esto se vuelve muy importante para los grupos centrados en operaciones, tales como planificación, ingeniería y operaciones.
- También se convierte en una fuente atractiva de datos para respaldar el análisis algorítmico que extrae más información en todo el negocio.
Si desea analizar el linaje de sus datos, antes y después de la carga inicial de la base de datos OSS/BSS, solicite una consulta con nosotros para averiguar cómo las soluciones y herramientas de generación de informes de SunVizion pueden ayudarle.