Skip to content

architecture-it/Integracion.Esquemas.Trazas

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Integracion.Esquemas.Avro

avro tools

Este repositorio contienen:

  • Archivos de protocolo necesarios para la generacion de schemas avro in formato idl.
  • Archivos para la generacion de librerias necesarias para trabajar con los esquemas desde los distintos lenguajes de programacion.

Por que debemos generar schemas Avro?

Los esquemas Avro son generados para poder ser incorporados en la registry que utilizaremos como fuente de validacion de los mensajes que publicaremos en los topicos de Kafka.

Como se generan los schemas Avro?

Los esquemas Avro que son incorporados a la registry se generan a partir de los archivos .avdlque se encuentran en la carpeta ./idl, estos archivos de protocolo estan escritos en un lenguaje de alto nivel llamado idl que sirve para crear schemas Avro en formato json. Aqui se puede ver un ejemplo de como queda un schema declarado en idl.

  record EnvioEntregado{
    
    Traza traza;
    Integracion.Esquemas.Referencias.TipoDeEntrega tipoDeEntrega;
  }

Una vez que tenemos definidos nuestros esquemas en el archivo .avdl se debera usar una herramienta para la generacion de esquemas en formato json los cuales utilizaremos para incorporar a la registry. Para la generacion de los schemas se utiliza el siguiente comando:

java -jar avro-tools-{version}.jar idl2schemata {archivo}.idl ./{carpeta destino}

Este comando nos generar tantos archivos .avsc como tipos tengamos declarados en el archivo .avdl. Luego podremos utilizar estos archivos para agregar o actualizar los esquemas en la registry.

Como se genera el codigo fuente incluido en las librerias?

Por el momento solo se esta generando codigo fuente en el lenguaje C#. Para la generacion del mismo partiremos nuevamente del archivo .avdl para generar un archivo de procolo pero esta vez en formato json con la extension .avpr. Para la generacion de este archivo se utiliza el siguiente comando:

java -jar avro-tools-{version}.jar idl {archivo}.idl {archivo}.avpr

Una vez obtenido el archivo .avpr usaremos una netcore tool llamada avrogen para generar codigo fuente C#.

avrogen -p {archivo}.avpr ./{carpeta destino}

Este comando nos generar tantos archivos .cs como tipos tengamos declarados en el archivo .avdl. Luego utilizaremos estos archivos para genera un paquete nuget el cual utilizaremos dentro de nuestros desarrollos.

Generacion Automatica de Schemas y librerias

La generacion de schemas, su posterior sincronizacion con la registry y la generacion de librerias para los lenguajes de programacion se realiza automaticamente utilizando Github Actions. Por lo cual, cada vez que generemos un pull request con cambios en los archivos .avdl, una accion de github generara los esquemas y realizara una validacion contra la registry. Este proceso nos dira si algunos de los esquemas fue modificado y dejo de respetar las reglas de validacion y compatibilidad que tenemos establecidas en la registry.

Una vez que la validacion sea exitosa, se procedera con el merge del pull request (Operacion manual). Terminado el merge se ejecutara otra accion de Github que se encargara de:

  • Registrar nuevos esquemas en la registry.
  • Actualizar esquemas existentes solo si se realizaron cambios.
  • Generacion de paquete Nuget y publicacion del mismo dentro de Github Packages.

Headers

Con el modelo anterior, al ser un modelo jerarquico donde eventos heredan de otros, era facil trasladar propiedades a todos los eventos, por ejemplo todos los eventos que heredan de EventoDeNegocio heredan todas sus propiedades. Avro no soporta herencia por lo cual trasladar esos campos comunes no es tan simple. Por ese motivo las propiedades que anteriormente se encontraban en EventoDeNegocio en el modelo actual se agregaran como headers del evento a publicar.

<complexType abstract="false" name="EventoDeNegocio">
  <sequence>
    <element name="timestamp" type="date" minOccurs="1"
      maxOccurs="1" />
    <element name="remitente" type="string" minOccurs="1"
      maxOccurs="1" />
    <element name="destinatario" type="string" minOccurs="0"
      maxOccurs="1" />
    <element name="numeroDeOrden" type="string" maxOccurs="1"
      minOccurs="0" />
    <element name="vencimiento" type="date" minOccurs="0"
      maxOccurs="1" />
  </sequence>
</complexType>

A continuacion se detalle el futuro de cada uno de estos campos:

  • timestamp: La metadata de los eventos en kafka ya poseen esta propiedad por lo cual este propiedad no sera mantenida.
  • remitente: Esta propiedad se debera publicar como header
  • destinatario: Esta propiedad se usaba para especificar si este mensaje va a una cola especifica. En este modelo no sera necesaria y se descartara.
  • numeroDeOrden: Esta propiedad posiblemente pueda ser el offset del topico. (A definir)
  • vencimiento: Se descarta ya que el vencimiento de los mensajes no es como en mq.

Bitácora

La idea de esta seccion es mencionar eventos o decisiones tomadas durante el proceso de reingenieria:

Subject Name Strategy

Como se menciona aqui existen 3 tipos de estrategias que usan los Serializer para registrar esquemas en la registry. Al momento de crear este repositorio, el cual registra los esquemas automaticamente, el tema de la estrategia no se tomo en cuenta por desconocimiento, y los esquemas se registran con el nombre del evento. La idea es utilizar la estrategia RecordNameStrategy y asi registrar cada esquema con su nombre completo incluido el namespace. Entonces el evento EnvioEntregado que se registraba con el mismo nombre, debera ser registrado como Integracion.Esquemas.Trazas.EnvioEntregado, todo estos datos pueden ser tomados del archivo .avsc que se genera en cada build. Actualmente las Github Actions asociadas a este repo toman el nombre del evento del archivo, lo cual debe ser modificado para tomar nombre y namespace para asi formar el nombre completo con el cual se debe registrar el esquema en la registry.

CustomSchemaAvroSerDes

Al seleccionar la estrategia RecordNameStrategy nos encontramos con un problema en la libreria Streamiz.Kafka.Net. La clase AvroSerDes<T> utilizada para la serializacion de eventos que se publican en los topicos no permite cambiar de estrategia, siendo la TopicNameStrategy la utilizada por dafault. Esto nos obliga por el momento a utiliza un CustomSchemaAvroSerDes<T> donde forzamos el uso de la estrategia que necesitamos usar. En paralelo se genero el PR #58 el cual corrige esto. Hasta que el PR no sea mergeado y una nueva version liberada, debemos utilizar el ``CustomSchemaAvroSerDes`. El mismo se utiliza actualmente en el nuevo Publicador de Integra basado en Stream.

Namespace obligatorio en todos los esquemas usando en la Regitry Apicurio

Trabajando con la Registry Apicurio, los esquemas y los serializer surgio otro problema. Al tener bien seteada la estrategia de busqueda de schemas en el serializar y tener bien registrado los esquemas, nos encontramos en que muchas veces al querer publicar algun evento en un topico, el serializar lanzaba una exception que dicia que no podia encontrar el esquema con un codigo, un 404 not found. Luego de verificar que el esquema estaba bien registrado y que la estrategia era la correcta, detectamos que no nos pasaba con todos los esquemas, por lo cual se realizaron pruebas para verificar que parte del esquema era el que no producia el error. Luego de las pruebas, se determino que la propiedad namespace faltaba en el evento Traza, pero este a nivel esquema no es obligatorio ya que pertenece al mismo namepace del evento. Al parecer, si bien esto es correcto a nivel avro, no es algo que le guste a la registry, por este motivo, al evento Traza se le agrega un atributo para que se le defina un namespace distinto. Esto hace que al generar el archivo .avsc que se envia a la registry, la definicion de Traza dentro de un evento, tenga un namespace diferente. Al parecer el serializer busca el esquema en la registry enviando todo el esquema actual que posee y no solo con el nombre. Esto hace que se interprenten diferente y por eso el error. Esto parece ser un problema de como la registry interpreta los esquemas y existen algunos issues dando vueltas con esto. Hasta que esto no se solucino a nivel registry, debemos tener muy encuenta esto al momento de trabajar con schemas y la registy.

  @namespace("Integracion.Esquemas")
  record Traza{
    string codigoDeEnvio;
    union { null, string } nombre=null;
    timestamp_ms cuando;
    string codigoDeContratoInterno;
    union { null, string } estadoDelEnvio=null;
    union { null, string } cicloDelEnvio=null;
    union { null, string } operador=null;
    union { null, string } estadoDeLaRendicion=null;
    union { null, string } comentario=null;
    union { null, Integracion.Esquemas.Referencias.DatosSucursal } sucursalAsociadaAlEvento=null;
  }

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages