Terminologias
Ação (Action)
Uma "ação" consiste numa tarefa ou tarefas numa máquina ou um grupo de máquinas. Cada ação é rastreada por um ID e os nós reportam o status da mesma pelo menos no granularidade da ação. Uma ação pode ser considerada uma etapa em execução. Nesta documentação, um estágio e uma ação têm correspondência dum para um, a menos que especificado o contrário. Um ID de ação será uma bijeção de request-id para stage-id.
Componente (Component)
Um serviço consiste dum ou mais componentes. Por exemplo, o HDFS tem 3 componentes: NameNode, NameNode Secundário e DataNode. Os componentes podem ser opcionais. Um componente pode abranger vários nós (por exemplo, instâncias do componente DataNode em vários nós).
Estágio (Stage)
Um estágio refere-se a um conjunto de tarefas necessárias para concluir uma operação e são independentes entre si. Todas as tarefas no mesmo estágio podem ser executadas em diferentes nós em paralelo.
Função (Role)
Uma função mapeia um componente (por exemplo, NameNode) ou uma ação (por exemplo, rebalanceamento do HDFS, smoke test do HBase e etc.).
Manifesto (Manifest)
O manifesto refere-se à definição de uma tarefa que é enviada a um nó para execução. O manifesto deve definir completamente a tarefa e deve ser serializável. O manifesto também pode ser persistido no disco para recuperação ou registo.
Metadado Taxonômico:
Usado para criar um sistema de categorização, ou seja, para ter um vocabulário controlado de termos que definem um item.
Modelos Forenses
Focados em risco corporativo, com a identificação, compreensão e detecção de eventos ou crimes, detecção de anomalias, monitorização de sistemas, etc.
Modelos Prescritivos
Soluções de auto-aprendizado baseado em algoritmos que identificam padrões e otimizam a decisão, sugerindo "como fazer oportunidades diagnosticadas acontecer". Um exemplo de análise prescritiva incluem a análise de preferencias de usuários para priorização de negócios.
Nó (Node ou Host)
Nó refere-se a uma máquina (física ou virtual) no Cluster. Nó e host são usados de forma intercambiável nesta documentação.
Operação (Operation)
Uma operação refere-se a um conjunto de mudanças ou ações executadas num Cluster para satisfazer uma solicitação do usuário ou para obter uma mudança de estado desejável no Cluster. Por exemplo, iniciar um serviço ou executar um smoke test são operações. Se uma solicitação do usuário para adicionar um novo serviço o Cluster inclui a execução dum smoke test também, todo o conjunto de ações para atender à solicitação do usuário irá compor uma Operação. Uma operação pode consistir de em múltiplas “ações” ordenadas.
Plano de Estágio (Stage Plan)
Uma operação normalmente consiste em várias tarefas em várias máquinas e elas geralmente possuem dependências que exigem que sejam executadas numa ordem específica. Algumas tarefas devem ser concluídas antes que outras possam ser agendadas. Portanto, as tarefas necessários para uma operação podem ser divididas em várias etapas, na qual cada etapa deve ser concluída antes do próximo estágio, mas todas as tarefas no mesmo estágio podem ser programadas em paralelo em diferentes nós.
Serviço (Service)
Serviço refere-se aos serviços da Plataforma de Serviços, como HDFS, YARN, Spark, Kafka, entre outros. Um serviço pode ter vários componentes (por exemplo, o HDFS tem NameNode, DataNode e etc.) ou ser apenas uma biblioteca cliente (por exemplo, o Sqoop não tem nenhum serviço de daemon, apenas uma biblioteca cliente).
Tarefa (Task)
Tarefa é a unidade de trabalho enviada para execução num nó. Uma tarefa é o trabalho que o nó tem derealizar como parte de uma ação. Por exemplo, uma “ação” pode se composta pela instalação dum DataNode no nó N1 e a instalação dum DataNode e um NameNode Secundário no nó N2. Neste caso, a “tarefa” para N1 será instalar um DataNode e as “tarefas” para N2 serão instalar um DataNode e um Namenode Secundário.