Criação do Cluster e Instalação dos Componentes
Após a instalação do serviço do Apache Ambari, o próximo passo é a criação do Cluster de Big Data, incluindo a instalação dos demais serviços/componentes desejados.
Vamos Começar!
-
Utilize um browser para acessar a interface web do Ambari disponível no IP/hostname da máquina do Ambari Server, porta 8080. Por exemplo:
http://192.168.56.100:8080
| Por padrão, o usuário / senha de acesso são, respectivamente, admin / admin. |
-
No primeiro acesso será exibida uma página inicial de boas vindas. Para iniciar o processo de implantação do Cluster clique no botão LAUNCH INSTALL WIZARD:
-
Informe um nome para o Cluster e clique em NEXT:
Seleção da Versão
-
Selecione a versão do TDP desejada:
-
Selecione o tipo do repositório de pacotes (Public ou Local) e informe a URL para Components (TDP-2.1.0) e Utils (TDP-UTILS-2.1.0):
-
Na sequência, clique em NEXT.
| Caso opte pela utilização do Repositório Público de Pacotes da Tecnisys, as credenciais de acesso (usuário e senha) devem ser informados diretamente na URL, conforme demonstrado na imagem acima. |
Opções de Instalação
-
Em Target Hosts, infome o Fully Qualified Domain Name (FQDN) dos hosts (máquinas) que irão compor o Cluster.
O Ambari Server precisa ter acesso às máquinas informadas. Certifique-se que a resolução do FQDN das máquians ocorra corretamente, seja através de um Servidor de DNS (recomendado) ou localmente (arquivo /etc/hosts).
| Em Target Hosts, é possível informar as máquinas usando Expressões (Pattern Expressions). O exemplo apresentado na figura acima ficaria assim: big-tdp[1-7].dev-geep.local |
-
Em Hosts Registration Information, selecione como as máquinas do Cluster serão registradas.
-
Caso opte por fornecer a chave SSH privada da máquina do Ambari Server para o registro automático das máquinas do Cluster, cole o seu conteúdo no campo de texto abaixo ou faça o upload de seu arquivo. Na sequência, confirme o usuário e a porta SSH a serem utilizados.
Além disso, certifique-se que a Relação de Confiança (a troca das chaves SSH) tenha sido realizada corretamente, sendo possível, a partir da máqina do Ambari Server, acessar todas as máquinas via SSH sem a informação da senha do usuário do daemon do Ambari Server (por padrão, root). -
Caso opte por realizar o registro manual das máquinas, faça você mesmo a instalação do Ambari Agent em todas as máquinas antes de prosseguir.
-
-
Na sequência, clique em REGISTER AND CONFIRM.
|
A chave SSH privada do tipo RSA pode ser obtida executando o seguinte comando:
|
|
Para instalar manualmente o Ambari Agent:
|
Configuração da Relação de Confiança
-
Na máquina do Ambari Server, gere uma chave SSH privada:
ssh-keygen -
Copie a chave SSH para TODAS as máquinas do Cluster. Por exemplo:
ssh-copy-id tdp-mn01.tecnisys.com.br -
Teste o acesso via SSH à TODAS as máquinas do Cluster sem a informação da senha do usuário. Por exemplo:
ssh root@tdp-mn01.tecnisys.com.br
Confirmação dos Hosts
Após a instalação do Ambari Agent em todas as máquinas informadas na etapa anterior, o Ambari realiza uma série de verificações para garantir que os pré-requisitos foram atendidos (JDK, Firewall, THP, entre outros).
Eventuais erros precisam ser corrigidos e a verificação reexecutada para prosseguir.
Clique em NEXT para avançar.
| Alertas do tipo Package Issues, referentes aos pacotes do PostgreSQL já instalados, podem ser desconsiderados. |
Seleção dos Serviços
-
Selecione o serviço responsável pala camada de armazenamento do Cluster.
-
Selecione os demais serviços do Cluster.
| Recomendamos, inicialmente, a seleção dos serviços básicos, como YARN + MapReduce2, Tez, Zookeeper, Infra Solr e Ambari Metrics. Os demais serviços, caso necessário, podem ser adicionados após a criação do Cluster. Assim é mais fácil lidar com possíveis problemas nas instalação dos componentes. |
| O Cluster requer determinados serviços para operar plenamente, como por exemplo, o Apache Ranger para a camada de segurança e o Apache Atlas para a camada de governança de dados. Logo, o Ambari apresentará alertas caso alguma funcionalidade venha a ser limitada pela não instalação de um serviço específico. Ignore o alerta (clique no botão PROCEED ANYWAY) caso o serviço em questão venha a ser instalado futuramente, ou caso esteja ciente de tal limitação. |
-
Na sequência, clique em NEXT.
Atribuição dos Componentes Masters
-
Indique a máquina de cada um dos componentes Masters (em geral, componentes de gerenciamento e coordenação) dos serviços selecionados. Observe que à direita da página é apresentado a organização dos componentes por máquina.
|
A organização deve ser feita considerando as necessidades de cada componente e os recursos disponíveis em cada máquina. Algumas recomendações podem ser observadas:
|
-
Na sequência, clique em NEXT.
Atribuição dos Componentes Slaves e Clients
-
Indique em quais máquinas serão instalados os componentes Slaves (em geral, componentes de armazenamento e processamento) e Clients.
| Sempre que possível, evite instalar componentes Slaves em máquinas de componentes Masters. |
-
Na sequência, clique em NEXT.
Customização dos Serviços
Nessa etapa devem ser definidas as credenciais de acesso, dados de conexão à bancos de dados, diretórios, usuários, entre outras informações próprias de cada serviço e necessárias para a instalação.
Resolva as pendências de todas as seções dessa etapa e clique em NEXT para avançar.
Credenciais
Ilustrando essa seção temos o Grafana, componente do Ambari Metrics, que requer a definição do usuário e senha de adminsitração da ferramenta:
Bancos de Dados
Ilustrando essa seção temos o Hive, o qual requer um banco de dados para persistência de metadados. Nesse exemplo, informamos os dados de conexão para uma instância PostgreSQL existente:
| Clique no botão TEST CONNECTION para testar a conexão com o banco de dados informado. |
Diretórios
Nesta seção é possível customizar os diretórios dos serviços, como por exemplo, os diretórios de dados dos DataNodes, os diretórios da namespace do NameNode, diretórios de log, etc.
| Se possível, use dispositivos de armazenamento (discos, SSD, entre outrs), volumes e diretórios exclusivos para os arquivos dos DataNodes, NameNodes, JournalNodes, NodeManagers, Timeline Services e Zookeeper. |
Usuários dos Serviços
Nesta seção é possível customizar os usuários de sistema operacional que serão criados para cada serviço.
Todas as Configurações
Esta última seção dá acesso a todas as configurações dos serviços a serem instalados. Aproveite para conferir e ajustar o que for necessário.
Caso tenha esquecido alguma configuração, não se preocupe. Após a instalação todas essas configurações também estarão disponíveis para alteração via Ambari.
Revisão das Configurações
Nessa etapa, a última antes da criação do Cluster, é apresentada uma revisão das configurações definidas. Verifique cuidadosamente todas as informações e, sendo necessário alterar alguma configuração, utilize a área de navegação lateral esquerda para retornar na etapa desejada.
| Utilize o botão PRINT para gerar um relatório da instalação e o botão GENERATE BLUEPRINT para gerar um arquivo XML com todas as configurações definidas e que, futuramente, pode ser utilizado para recriar o Cluster via Ambari REST API. |
Para iniciar a implantação do Cluster, clique no botão DEPLOY.
Instalação, Iniciação e Teste dos Serviços
Nessa etapa os serviços serão instalados, iniciados e testados, respeitando as dependências e integrações de cada um.
| Clique no link do texto da coluna Message para visualizar as tarefas programadas para cada máquina. |
Na ocorrência de falhas, o Ambari pode interromper a implantação, sendo possível retomá-la após a correção do problema clicando no botão RETRY.
No entanto, de acordo com o progresso já realizado, o Ambari pode concluir a implantação e disponibilizar o Cluster como ele está, mesmo que nem todos os componentes de um determinado serviço tenham sido instalados, iniciados ou testados com sucesso. Nesse caso, após criado o Cluster é possível, pelo próprio Ambari, alterar as configurações ou remover e instalar novamente apenas o serviço problemático.
Finalizada a implantação, clique em NEXT.