Criação do Cluster e Instalação dos Componentes
Após a instalação do serviço do Apache Ambari, o próximo passo é a criação do Cluster de Big Data, incluindo a instalação dos demais serviços/componentes desejados.
Vamos Começar!
-
Utilize um browser para aceder a interface web do Ambari disponível no IP/hostname da máquina do Ambari Server, porta 8080. Por exemplo:
http://192.168.56.100:8080
Figura 1 - Página de login do AmbarinotaPor padrão, o usuário / palavra-passe de acesso são, respectivamente, admin / admin.
- Instruções
- Vídeo
-
No primeiro acesso será exibida uma página inicial de boas-vindas. Para iniciar o processo de implantação do Cluster, clique no botão LAUNCH INSTALL WIZARD:
Figura 2 - Página de Boas Vindas do Ambari -
Informe um nome para o Cluster e clique em NEXT:
Figura 3 - Nome do Cluster
Seleção da Versão
-
Selecione a versão do TDP desejada:
Figura 4 - Versão do TDP -
Selecione o tipo do repositório de pacotes (Public ou Local) e informe a URL para Components (TDP-3.0) e Utils (TDP-UTILS-3.0):
Figura 5 - Repositórios de pacotes -
Na sequência, clique em NEXT.
importantCaso opte pela utilização do Repositório Público de Pacotes da Tecnisys, as credenciais de acesso (usuário e palavra-passe) devem ser informadas diretamente na URL, conforme demonstrado na imagem acima.
Opções de Instalação
-
Em Target Hosts, informe o Fully Qualified Domain Name (FQDN) dos hosts (máquinas) que irão compor o Cluster.
O Ambari Server precisa ter acesso às máquinas informadas. Certifique-se de que a resolução do FQDN das máquinas ocorra corretamente, seja através de um Servidor de DNS (recomendado) ou localmente (ficheiro
/etc/hosts).
Figura 6 - Informação dos hosts do ClusterdicaEm Target Hosts, é possível informar as máquinas usando Expressões (Pattern Expressions). O exemplo apresentado na figura acima ficaria assim:
big-tdp[1-7].dev-geep.local. -
Em Hosts Registration Information, selecione como as máquinas do Cluster serão registradas.
-
Caso opte por fornecer a chave SSH privada da máquina do Ambari Server para o registro automático das máquinas do Cluster, cole o seu conteúdo no campo de texto abaixo ou faça o upload de seu ficheiro. Na sequência, confirme o usuário e a porta SSH a serem utilizados. Além disso, certifique-se de que a Relação de Confiança (a troca das chaves SSH) tenha sido realizada corretamente, sendo possível, a partir da máquina do Ambari Server, aceder todas as máquinas via SSH sem a informação da palavra-passe do usuário do daemon do Ambari Server (por padrão, root).
Figura 7 - Registro dos hosts -
Caso opte por realizar o registro manual das máquinas, faça você mesmo a instalação do Ambari Agent em todas as máquinas antes de prosseguir.
dicaA chave SSH privada do tipo RSA pode ser obtida executando o seguinte comando:
Terminal inputcat ~/.ssh/id_rsanotaPara instalar manualmente o Ambari Agent:
Terminal inputyum install ambari-agent
-
-
Na sequência, clique em REGISTER AND CONFIRM.
Configuração da Relação de Confiança
-
Na máquina do Ambari Server, gere uma chave SSH privada:
Terminal inputssh-keygen -
Copie a chave SSH para TODAS as máquinas do Cluster. Por exemplo:
Terminal inputssh-copy-id tdp-mn01.tecnisys.com.br -
Teste o acesso via SSH à TODAS as máquinas do Cluster sem a informação da palavra-passe do usuário. Por exemplo:
Terminal inputssh root@tdp-mn01.tecnisys.com.br
Confirmação dos Hosts
Após a instalação do Ambari Agent em todas as máquinas informadas na etapa anterior, o Ambari realiza uma série de verificações para garantir que os pré-requisitos foram atendidos (JDK, Firewall, THP, entre outros).

Eventuais erros precisam ser corrigidos e a verificação reexecutada para prosseguir.
Clique em NEXT para avançar.
Alertas do tipo Package Issues, referentes aos pacotes do PostgreSQL já instalados, podem ser desconsiderados.
Seleção dos Serviços
-
Selecione o serviço responsável pela camada de armazenamento do Cluster.
Figura 9 - Seleção do serviço da camada de armazenamento -
Selecione os demais serviços do Cluster.
Figura 10 - Seleção dos demais serviços do ClusterdicaRecomendamos, inicialmente, a seleção dos serviços básicos, como YARN + MapReduce2, Tez, Zookeeper, Infra Solr e Ambari Metrics. Os demais serviços, caso necessário, podem ser adicionados após a criação do Cluster. Assim é mais fácil lidar com possíveis problemas na instalação dos componentes.
notaO Cluster requer determinados serviços para operar plenamente, como por exemplo, o Apache Ranger para a camada de segurança e o Apache Atlas para a camada de governança de dados. Logo, o Ambari apresentará alertas caso alguma funcionalidade venha a ser limitada pela não instalação de um serviço específico. Ignore o alerta (clique no botão PROCEED ANYWAY) caso o serviço em questão venha a ser instalado futuramente, ou caso esteja ciente de tal limitação.
-
Na sequência, clique em NEXT.
Atribuição dos Componentes Masters
-
Indique a máquina de cada um dos componentes Masters (em geral, componentes de gerenciamento e coordenação) dos serviços selecionados. Observe que à direita da página é apresentada a organização dos componentes por máquina.
Figura 11 - Atribuição dos componentes MastersnotaA organização deve ser feita considerando as necessidades de cada componente e os recursos disponíveis em cada máquina. Algumas recomendações podem ser observadas:
- Evite instalar na máquina do Ambari Server serviços que não sejam de Edge ou Gateway. Se possível, deixe uma máquina dedicada para o Ambari Server.
- Componentes responsáveis pela alta disponibilidade de serviços devem ser instalados em máquinas distintas. Por exemplo, NameNode e Secondary NameNode (SNameNode).
- Instale o Zookeper em número ímpar de máquinas, maior que um (01). Ou seja, inicialmente, em pelo menos 3 máquinas.
-
Na sequência, clique em NEXT.
Atribuição dos Componentes Slaves e Clients
-
Indique em quais máquinas serão instalados os componentes Slaves (em geral, componentes de armazenamento e processamento) e Clients.
Figura 12 - Atribuição dos componentes Slaves e ClientsnotaSempre que possível, evite instalar componentes Slaves em máquinas de componentes Masters.
-
Na sequência, clique em NEXT.
Customização dos Serviços
Nessa etapa devem ser definidas as credenciais de acesso, dados de conexão a bases de dados, diretórios, usuários, entre outras informações próprias de cada serviço e necessárias para a instalação.
Resolva as pendências de todas as seções dessa etapa e clique em NEXT para avançar.
Credenciais
Ilustrando essa seção, temos o Grafana, componente do Ambari Metrics, que requer a definição do usuário e palavra-passe de administração da ferramenta:
