Integrações — OpenMetadata
Visão geral das integrações
O chart tdp-openmetadata pode executar um Job pós-install/upgrade que registra serviços externos no OpenMetadata quando datasourcesIntegration.enabled=true.
Além disso, o OpenMetadata pode executar pipelines de ingestão em dois modos: por Kubernetes Jobs (por omissão) ou por Airflow.
Visão geral
- Implantar o OpenMetadata.
- O Job aguarda o OpenMetadata ficar pronto, autentica na API e registra os serviços habilitados.
Habilitar o Job
datasourcesIntegration:
enabled: true
Acesso à API do OpenMetadata em datasourcesIntegration.openmetadata.*. Se datasourcesIntegration.openmetadata.auth.passwordSecret.enabled=true, informe o nome do Secret e a chave da senha no arquivo de valores.
Configuração por serviço
Cada integração possui enabled e um bloco connection sob datasourcesIntegration.*.
Exemplo (Trino + ClickHouse)
datasourcesIntegration:
enabled: true
openmetadata:
apiEndpoint: "http://<openmetadata-service>.<namespace>.svc.cluster.local:8585/api"
auth:
provider: "basic"
username: "admin@open-metadata.org"
passwordSecret:
enabled: true
name: "<openmetadata-admin-secret>"
key: "<password-key>"
trino:
enabled: true
connection:
host: "<trino-service>.<namespace>.svc.cluster.local"
port: 8080
username: "<username>"
scheme: "http"
clickhouse:
enabled: true
connection:
host: "<clickhouse-service>.<namespace>.svc.cluster.local"
port: 8123
username: "<username>"
passwordSecret:
name: "<clickhouse-secret>"
key: "password"
scheme: "http"
Airflow, Superset e Kafka
Airflow, Superset e Kafka são tipos suportados pelo Job (Pipeline, Dashboard, Messaging): habilite o bloco correspondente e preencha connection e credenciais no arquivo de valores (veja helm show values).
Instalação típica com valores extras (exemplo genérico):
helm upgrade --install <release> \
oci://registry.tecnisys.com.br/tdp/charts/tdp-openmetadata \
-n <namespace> \
-f <arquivo-base>.yaml \
-f <arquivo-integracoes>.yaml
Use arquivos de valores do seu pacote Helm ou um único -f com todo o conteúdo necessário.
Execução de pipelines: Airflow ou K8S
O OpenMetadata pode executar pipelines de ingestão usando dois modos:
- Kubernetes Jobs (
k8s): modo por omissão, em que os pipelines correm como Jobs nativos no cluster, sem dependência de Airflow - Airflow (
airflow): modo em que os pipelines são executados por integração REST com o serviço Airflow
O modo de execução é controlado pelo campo pipelineServiceClientConfig.type, que aceita os valores k8s ou airflow.
Modo Kubernetes Jobs (type: k8s)
Quando o modo k8s está ativo, os pipelines são submetidos como Jobs Kubernetes. Os parâmetros mais comuns neste cenário são:
- imagem utilizada na execução
- namespace onde os Jobs serão criados
- service account
- recursos de CPU e memória
- TTL e política de backoff
nodeSelector,annotationsesecurityContext
Modo Airflow (type: airflow)
Quando o modo airflow está ativo, o OpenMetadata delega a execução dos pipelines ao serviço Airflow. Os parâmetros mais comuns neste cenário são:
- endpoint do Airflow
- utilizador
- palavra-passe via Secret
- verificação SSL
Como alternar
- altere apenas o valor de
pipelineServiceClientConfig.typepara trocar o modo de execução - mantenha os parâmetros específicos alinhados com o modo escolhido
- o modo
airflowexige que o serviço Airflow esteja ativado e acessível nas dependências do chart
Verificação
Após o Job concluir, os serviços devem aparecer na UI do OpenMetadata em Settings → Services.
Resolução de Problemas
kubectl -n <namespace> get jobs
kubectl -n <namespace> logs job/<release>-register-datasources