AWS series XIV: Elastic MapReduce (EMR)
Serie de artigos sobre Amazon Web Services.
Lab 12 - Elastic MapReduce
Em este lab sobre EMR aprenderemos alguns conceitos da plataforma de Big Data as a Service da AWS:
- Criação de cluster
- Acesso via WEB e SSH/CLI
- Monitoramento
Configuração do serviço
-
Acessar o serviço EMR:
-
Iniciar a criação do cluster:
-
Escolher um nome para o cluster, um bucket do S3 para armacenar os logs, versão do EMR e conjunto de aplicações solicitado:
-
Escolha de flavor, número de instâncias e chave SSH para acessar o cluster. Quem tiver usando a conta do AWS Educate, lembre-se que só os seguintes flavors estão disponíveis:
t2.small
,t2.micro
,t2.nano
,m4.large
,c4.large
,c5.large
,m5.large
,t2.medium
,m4.xlarge
,t2.nano
,c4.xlarge
,c5.xlarge
,t2.2xlarge
,m5.2xlarge
,t2.large
et2.xlarge
. -
Aguardar a criação do cluster:
Acessando o serviço
-
Acessar a interface web do YARN timeline server:
-
Acessar a interface web do Tez:
- Acessar via SSH no master node e fazer uma consulta no Hive. É necessário liberar a porta 22 no
security group
associado às instâncias criadas no EC2:% ssh -i fiap.pem hadoop@ec2-3-81-126-78.compute-1.amazonaws.com The authenticity of host 'ec2-3-81-126-78.compute-1.amazonaws.com (3.81.126.78)' can't be established. ECDSA key fingerprint is SHA256:Bavwz+doMGvtdOwhJM7+IGCrURgDCL/a/6ISfjROYLM. Are you sure you want to continue connecting (yes/no/[fingerprint])? YES Warning: Permanently added 'ec2-3-81-126-78.compute-1.amazonaws.com,3.81.126.78' (ECDSA) to the list of known hosts. Last login: Sun Sep 20 20:36:00 2020 __| __|_ ) _| ( / Amazon Linux 2 AMI ___|\___|___| https://aws.amazon.com/amazon-linux-2/ 33 package(s) needed for security, out of 90 available Run "sudo yum update" to apply all updates. EEEEEEEEEEEEEEEEEEEE MMMMMMMM MMMMMMMM RRRRRRRRRRRRRRR E::::::::::::::::::E M:::::::M M:::::::M R::::::::::::::R EE:::::EEEEEEEEE:::E M::::::::M M::::::::M R:::::RRRRRR:::::R E::::E EEEEE M:::::::::M M:::::::::M RR::::R R::::R E::::E M::::::M:::M M:::M::::::M R:::R R::::R E:::::EEEEEEEEEE M:::::M M:::M M:::M M:::::M R:::RRRRRR:::::R E::::::::::::::E M:::::M M:::M:::M M:::::M R:::::::::::RR E:::::EEEEEEEEEE M:::::M M:::::M M:::::M R:::RRRRRR::::R E::::E M:::::M M:::M M:::::M R:::R R::::R E::::E EEEEE M:::::M MMM M:::::M R:::R R::::R EE:::::EEEEEEEE::::E M:::::M M:::::M R:::R R::::R E::::::::::::::::::E M:::::M M:::::M RR::::R R::::R EEEEEEEEEEEEEEEEEEEE MMMMMMM MMMMMMM RRRRRRR RRRRRR [hadoop@ip-172-31-42-29 ~]$ hive Logging initialized using configuration in file:/etc/hive/conf.dist/hive-log4j2.properties Async: false hive> show databases; OK default Time taken: 0.086 seconds, Fetched: 1 row(s) hive>
- Conferir a aba de monitoramento:
Comments