LIneA Bootcamp: Uma experiência bem sucedida

09 de outubro de 2019 | LIneA

Durante a semana de 2 a 6 de setembro (Figura 1) foi realizada a reunião LIneA Bootcamp promovida pelo INCT do e-Universo para o treinamento de novos membros associados a projetos astronômicos como o SDSSDES, DESILSST e TON. Foi uma intensa semana com mais de 40 atividades entre apresentações, tutoriais e sessões práticas sobre o LIneA, seus serviços e suas ferramentas. A reunião contou com mais de 30 participantes de diferentes estados e instituições brasileiras, como Espírito Santo (UFES), Brasília (UnB), Paraná (UFTPR, UEPG), São Paulo (USP, UNESP) e Rio Grande do Sul (UFRGS, UFSM). A reunião foi organizada para atender a um pedido expresso por membros do comitê executivo do LIneA e por vários participantes da enquete realizada pelo LIneA no começo do ano.

Figura 1: Agenda do encontro das 44 atividades programadas. O número da sessão deve ser usado para identificar a apresentação disponível no site.

O objetivo principal do primeiro dia foi apresentar o LIneA como um todo e procurar conhecer mais sobre seus afiliados. Uma das palestras de introdução ao LIneA foi dividida em duas partes sendo que no primeiro dia o foco foi sobre a experiência da equipe em projetos de grande porte, sua história, organização, projetos internacionais apoiados e a estratégia adotada para promover a participação de pesquisadores brasileiros nestes projetos baseada na oferta de serviços e de sistemas de software.

Também foi apresentada a missão do INCT do e-Universo, sua relação com o LIneA e seu impacto na consolidação do trabalho sendo executado pelo laboratório. Esta apresentação foi seguida de um tutorial de como se filiar ao laboratório, explicando o porquê das informações solicitadas no processo de registro sendo construído. Esta informação é usada para alimentar as interfaces de gestão do LIneA e do INCT e o sistema de autenticação/autorização sendo implantado. Este sistema é fundamental para permitir a gestão de recursos e acesso a dados e serviços em função do projeto e do tipo de usuário. Em particular, foi apresentado o projeto em andamento para a implantação de uma nova landing page que permitirá o acesso rápido, seguro e controlado a todos os serviços e aplicações disponíveis para usuários filiados ou não a partir do site do LIneA. Também houveram apresentações sobre a arquitetura da infraestrutura computacional do LIneA e sobre os serviços disponibilizados. A figura 2 mostra um mosaico dos apresentadores que representaram o LIneA durante este primeiro dia. Estas apresentações, como todas as outras da semana, podem ser encontradas no site do LIneA.

Figura 2: Fotos das palestras realizadas no primeiro dia de reunião pelos seguintes membros do LIneA: 1) Carlos Adean (LIneA), 2) Adriano Pieres (INCT/ LIneA), 3) Julia Gschwend (ON/ LIneA), 4) Luiz Nicolaci (LIneA), 5) Guilherme Soares (LIneA), 6) Adriano Pieres (INCT/LIneA), 7) Fernanda Massena (LIneA) e 8) Cida Silveira (LIneA). Créditos das imagens: Fernanda Massena e Isadora Bicalho.

Complementando as apresentações feitas pela equipe do LIneA, os participantes de fora foram convidados a falar brevemente sobre seus projetos científicos, suas necessidades e sobre como o LineA poderia ser útil ao seus trabalhos. Isto foi feito para levantar tópicos que serviram de insumos para uma atividade programada para o último dia do evento (vide abaixo). Foram 14 palestras (uma remota), realizadas pelos pesquisadores apresentados na figura 3. O final do dia consistiu de uma sequência de tutoriais e atividades práticas relacionadas ao uso de Jupyter Notebooks.

Figura 3: Apresentações feitas por participantes de fora: 1) Remotamente Rafael Cirolini (UFSM), 2) Tassia Fereira (UFES), 3) Rodrigo Silva (UFES), 4) Maria Gabriela Moreira (UNESP), 5) Gabriela Ilha (UFSM), 6) Rafael Gomes (USP) , 7) Pedro Baqui (UFES), 8) Otavio Alves (UNESP), 9) Altair Gomes (UNESP), 10) Sandro Vitenti (UnB), 11) Derisnei Reis (UEPG), 12) Mariana Vitenti (UnB), 13) Diogo Souza (UFRGS) e 14) Daniel Gomes (USP). Crédito das imagens: Fernanda Massena.

O segundo dia do evento também foi dividido em duas partes – a primeira com apresentações feitas pela equipe do LIneA e a segunda com a realização de atividades práticas. Pela manhã, a segunda parte da palestra de introdução ao LIneA incluiu:

i) uma apresentação do esforço feito na área de desenvolvimento de software descrevendo as ferramentas e os portais desenvolvidos;

ii) uma rápida descrição das interfaces de gestão criadas para monitorar as finanças e as métricas usadas para monitorar o desempenho do LIneA e do INCT;

iii) uma descrição sobre os projetos apoiados e publicações acumuladas ao longo dos anos;

iv) informações sobre a formação de pessoal e as atividades de divulgação feitas para cientistas e para o público em geral; e

v) o que é esperado dos afiliados em termos de contribuições que podem dar para o funcionamento do LIneA.

Esta palestra foi seguida por apresentações e tutoriais sobre as ferramentas colaborativas e aquelas desenvolvidas para os projetos DES e DESI como Quick Reduce, o LIneA Science Server e o Quick Look Framework.

O final do segundo dia foi dedicado a criação e uso de Jupyter notebooks, considerando diferentes aplicações. Esta atividade foi particularmente de interesse para o LIneA já que este é um serviço previsto para ser oferecido não só para os membros das diferentes colaborações mas também para o público em geral. Os apresentadores e coordenadores das sessões de hack podem ser vistos na figura 4.

Figura 4: 1) Michel Aguena (INCT/LIneA), 2) Luiz Nicolaci (LIneA), 3) Glauber Costa (LIneA), 4) Slide mostrando a interface LIneA Science Server, 5) Rodrigo Boufleur (ON/LIneA), 6) Cristiano Singulani (LIneA), 7) Andrea Nunes (LIneA), 8) Felipe Oliveira (INCT/UNESP/LIneA) e 9) Adriano Pieres (LineA). Crédito das imagens: Fernanda Massena.

O terceiro dia foi dedicado ao uso da infraestrutura do LIneA para processamento usando seus clusters e o tempo do LIneA no supercomputador Santos Dumont, para avaliar qual seria a melhor distribuição das tarefas. O portal científico desenvolvido para o projeto DES, que servirá de base para o LSST, também foi apresentado e um tutorial para a integração de novos algoritmos nesta arquitetura foi feito, introduzindo os conceitos básicos para a criação de um pipeline científico. Um caso de interesse para ser integrado ao portal foi apresentado por Sandro Vitenti, da Universidade de Brasília (UnB), que descreveu a biblioteca NumCosmo: Numerical Cosmology Library, desenvolvida pelos pesquisadores da Universidade de Brasília, que complementa as bibliotecas COSMOSIS e CCL desenvolvidas para o DES e LSST.

Um dos importantes projetos do LIneA é usar a experiência adquirida com o processamento dos dados do DES para desenvolver um novo portal para o LSST resolvendo problemas de desempenho encontrados atualmente e o salto quantitativo no volume de dados. Neste sentido, ao longo do último ano problemas com o atual portal vem sendo levantados e reportados à Comissão de Controle de Mudanças que, em geral, têm sido traduzidos em requisitos para um novo portal. Os requisitos já levantados para o desenvolvimento do Portal 2ª Geração foram apresentados, procurando familiarizar todos participantes com os desafios que serão enfrentados para processar eficientemente o grande volume dados do LSST que em um ano de observação será da ordem de 50 vezes maior do que os dados de seis anos do DES.

Para facilitar o trabalho dos novos membros, uma visão geral da organização da documentação do LIneA também foi apresentada, onde destacaram a importância de manter estes documentos como um legado para as próximas gerações de pesquisadores.

Os palestrantes do terceiro dia podem ser vistos na Figura 5 (a ordem das fotos não representa a ordem das apresentações).

Figura 5: Os palestrantes do terceiro dia da reunião foram os seguintes:. 1) Cida Silveira (LIneA), 2) Carlos Adean (LIneA), 3) Maria Luiza Sanchez (LIneA), 4) Cristiano Singulani (LIneA) e Lucas Nunes (LIneA), 5) Adriano Pieres (INCT/LIneA), 6) Carlos Adean (LIneA) e Valter Lima (LIneA), 7) Michel Aguena (INCT/LIneA), 8) Sandro Vitenti (UnB), 9) Adriano Pieres (INCT/LIneA),10) Hugo Camacho (USP), 11) Valter Lima (LIneA) e Julia Gschwend (ON/LIneA). Crédito das imagens: Fernanda Massena.

Na reunião foram distribuídas camisetas que foram usadas para a foto oficial do evento (Figura 6).

Figura 6: Foto com os participantes do 1º LIneA Bootcamp. Créditos da imagem: Christianne Garnier.

No quarto dia do evento foram feitas apresentações por pesquisadores envolvidos nas diferentes colaborações científicas (DESI, SDSS, TON, DES e LSST), descrevendo os objetivos científicos dos diferentes projetos e a estrutura e funcionamento dos respectivos grupos de participação. Estas apresentações foram complementadas por outra descrevendo todas as atividades científicas promovidas pelo LIneA como lunch talks, webinars, hotspot para resumo de telecons e a reunião semanal de alinhamento, onde um resumo das novidades e atividades da semana é feito por diferentes membros da equipe.

A parte da tarde foi dedicada a familiarizar os novos membros sobre o processo de redução de imagens da câmera DECam utilizada no levantamento DES com uma apresentação do pesquisador Robert Grundl do NCSA, descrevendo em grande detalhe todo o tratamento feito e os produtos primários criados pelo time que gerencia os dados do DES no NCSA. Em seguida foram feitas apresentações pela equipe do LIneA sobre o processo de preparação do dados que antecede a criação de catálogos prontos para análise científica conduzidas no LIneA usando o portal científico. Isto foi feito usando como motivação a quarta e última liberação de dados para os colaboradores. Neste release o conjunto de dados inclui pela primeira vez o sexto e último ano do projeto DES. O dia terminou com três sessões hands-on envolvendo a validação de imagens do DES Y6 e de catálogos do mesmo levantamento usando a ferramenta LIneA Science Server.

Figura 7: 1) Felipe Oliveira (INCT/UNESP/LIneA), 2) Jaderson Schimoia (UFSC), 3) Julio Camargo (ON), 4) Basílio Santiago (UFRGS), 5) Adriano Pieres (INCT/LIneA), 6) Luiz Nicolaci (LIneA), 7) Adriano Pieres (INCT/LIneA), 8) Robert Gruendl (NCSA), 9) Julia Gschwend (ON/LIneA), 10) Adriano Pieres (INCT/LIneA) e 11) Michel Aguena (INCT/LIneA). Créditos das imagens: Fernanda Massena.

No último dia foram abordados temas de interesse no contexto do LSST associados ao grande volume de dados que serão gerados por este projeto como:

i) a transferência de grandes volumes de dados, quando foram reportados testes sendo realizados entre nos trechos LNCC-NCSA e LNCC-Santiago;

ii) a utilização de máquinas virtuais, containers e kubernetes que possam permitir o uso de diferentes plataformas para a análise de dados em particular para avaliar a possível integração do portal científico e o Santos Dumont para processos envolvendo simulações e MPI; e

iii) a ciber infraestrutura para apoio à e-ciência, contando com a participação de Alex Moura da RNP.

Em particular, a ideia da criação de um centro de suporte de e-ciência é um elemento importante na discussão da implantação de um centro independente de acesso aos dados do LSST no Brasil.

Outro tema abordado no evento foram as atividades de educação e divulgação científica, e um assunto de particular interesse foi a apresentação do projeto de construir uma rede nacional de telescópios instalados em escolas de ensino médio espalhadas pelo território nacional, para participar de experimentos de ocultação estelar. Como o projeto terá que envolver pessoas nas diferentes localidades, este será um bom modelo para promover a ciência cidadã.

Finalmente, na última palestra do evento foi apresentado o plano de longo prazo do LIneA que vem sendo discutido há alguns anos com um Grupo de Trabalho indicado pelo MCTIC. Tendo em vista as características particulares do trabalho desenvolvido pelo LIneA, que diferem das missões dos institutos de pesquisa existentes, está sendo proposta a criação de uma associação para levar adiante este trabalho. Na palestra foram apresentadas as propostas sobre organização, órgãos colegiados, equipe e planos futuros com foco no apoio a ser dado para os novos projetos científicos como DESI e LSST.

Figura 8: 1) Alex Moura ( RNP), 2) Remotamente Gustavo Rossi (LIneA), 3) Erica Nogueira (LIneA), 4) Luiz Nicolaci (LIneA) 5) Slide da apresentação LIneA: Future por Luiz Nicolaci (LIneA), 6) Jeferson Souza (LIneA /RNP). Crédito das imagens: Fernanda Massena.

A reunião terminou com uma atividade de grupo que dividiu os participantes em pequenos grupos com interesses científicos similares, com cada grupo ficando responsável por elaborar em separado um projeto de pipeline para futura implementação no portal científico. Os projetos foram então apresentados para todos os participantes. A ideia foi mostrar na prática e de forma informal o que o time de TI espera quando solicitado a integrar um novo algoritmo no portal, o que exige um documento específico.

Figura 9: Apresentação dos resultados da dinâmica de grupo para modelar novos pipelines científicos. Nas fotos estão os cinco grupos que participaram da atividade e uma das coordenadoras da sessão. As fotos mostram: 1) Maria Gabriela Moreira (UNESP) e Tassia Ferreira (UnB), 2) Felipe Oliveira (IUNESP) e Martin de Los Rios (ICTP-SAIFR), 3) Pedro Baqui (UFES), Rafael Gomes (USP), Otavio Alves (UNESP) e Mariana Vitenti (UnB), 4) Gabriela Ilha (UFSM), Jaderson Schimoia (UFSC) e Isadora Bicalho (INCT/LineA), 5) Julia Gschwend (ON/LIneA), 6) Daniel Gomes (USP) e Rodrigo Silva (UFES), 7) Sandro Vitenti (UnB) e Hugo Camacho (UNESP), 8) Bruno Morgado (ON), Altair Gomes (UNESP), Marcelo Emílio (UEPG), Rodrigo Boufleur (ON/LIneA) e Derisnei Reis (UEPG). Crédito das imagens: Fernanda Massena.

A experiência da semana foi muito positiva por várias razões. Em primeiro lugar, permitiu que todos interagissem por uma semana, facilitando futuras colaborações. Segundo, foi uma oportunidade de todos conhecerem de perto o trabalho de fundo do LIneA, seus métodos de trabalho e como cada um pode colaborar para o sucesso do empreendimento. Além disso, foi uma oportunidade de todos avaliarem de perto como podem se beneficiar da infraestrutura do laboratório nos seus estudos e nas suas atividades de pesquisa. O sucesso da reunião mostrou a importância de organizar eventos semelhantes periodicamente, e ao fim do evento foi circulado uma enquete de avaliação do evento e de sugestões que serão levadas em consideração nas próximas edições.

LIneA e o INCT do e-Universo tem como missão apoiar a participação de pesquisadores associados a instituições brasileiras em grandes levantamentos astronômicos, como os projetos Dark Energy Survey (DES), Sloan Digital Sky Survey (SDSS), Dark Energy Spectroscopic Instrument (DESI), e o LargeSynoptic Survey Telescope (LSST). O LIneA, criado em 2010, é um laboratório apoiado pelo Observatório Nacional (ON), pelo Laboratório Nacional de Computação Científica (LNCC) e pela Rede Nacional de Ensino e Pesquisa (RNP). As atividades do LIneA vem sendo apoiadas ao longo dos anos pelo MCTIC, FINEP, FAPERJ, FAPERGS e a FAPESP. O programa INCT tem o apoio do CNPq, CAPES, e FAPERJ.

Deixe um comentário