Workshop gratuito ensina programação para biocientistas

Por Larissa Graciano Braga e Renato Augusto Corrêa dos Santos


Iniciativa do Workshop de Python para Dados Biológicos partiu do biólogo Renato A. Corrêa dos Santos, membro da RedeComCiência


O aumento exponencial na quantidade de dados biológicos, associado à diversidade e complexidade característica desse tipo de dado requer cada vez mais o uso de computação para organização e análise. O trabalho de exploração e de extração de informações é essencial e pode ser otimizado com uso de uma linguagem de programação. Atualmente, a linguagem Python é uma das mais utilizadas no mundo para essa finalidade.


Partindo da alta demanda por análise de dados biológicos e da necessidade de habilidades de programação por biocientistas, criamos o Workshop de Python para Dados Biológicos. Nosso intuito é ensinar os conceitos introdutórios de programação usando Python e os primeiros passos da análise de dados biológicos, para alunos de graduação, pós-graduação e pesquisadores sem formação na área de ciências da computação.


Crédito da imagem: Mars Sector-6 em Unsplash

Em 2017, ocorreu a primeira edição do evento realizado no Departamento de Bioquímica do Instituto de Química da Universidade de São Paulo (IQ-USP), na cidade de São Paulo. Em 2020, o evento passou a ocorrer de forma remota por causa da pandemia de COVID-19. Em 2022, nós teremos a 5ª edição do workshop, que continua sendo gratuito e online, com interações ocorrendo em plataformas digitais como o Slack e o Google Meet. Esse formato permite a participação de interessados de diversas classes sociais e regiões, sem trazer risco à saúde e sem demandar gastos com viagens e alojamento.


Colocando a mão na massa


O principal foco do evento são as sessões de ensino de programação que acontecem ao vivo, chamadas de participatory live coding. Elas tornam o ensino mais dinâmico e permitem que o instrutor e os monitores respondam a perguntas e a situações inesperadas que surgem enquanto os alunos estão digitando seus códigos.


Nessa etapa, a nossa intenção é que os alunos realmente coloquem a mão na massa para escrever os próprios códigos e documentar as linhas de comando. Durante o evento, o instrutor, os monitores e os alunos conversam sobre os dados e os contextos biológicos de cada dia. Palestras abordam o uso da programação na pesquisa acadêmica, especialmente em ciências da vida. Alunos selecionados também têm a oportunidade de apresentar o chamado “flash talk” (1). Ao longo da semana, há resolução de exercícios individuais e em grupo. Ao fim da semana, os participantes devem ser capazes de executar tarefas básicas utilizando um conjunto de dados, compreender códigos escritos na linguagem Python e se comunicar com cientistas de dados e bioinformatas.


Seleção dos participantes


Os critérios para selecionar os interessados incluem a análise do currículo Lattes e o preenchimento de um formulário. Esperamos que os participantes tenham envolvimento em pesquisa científica e pouco ou nenhum conhecimento de programação. Para alunos de graduação, o critério mais importante é a carta de motivação, já que queremos incluir pessoas que, apesar de ainda não terem tanta experiência em pesquisa, têm interesse de sobra em aprender sobre o assunto.


Prezamos pela diversidade, por isso a seleção busca igualar o número de participantes por gênero e maximizar o número de participantes de diferentes regiões do país. Desde 2020, realizamos uma pesquisa de caracterização dos participantes em relação à formação, às necessidades de programação e às perspectivas anteriores e posteriores ao curso. As avaliações, principalmente as negativas, são consideradas no planejamento da próxima edição para aprimorar o evento. Os resultados da pesquisa sobre a edição realizada em 2020 foram publicados na forma de um artigo científico em um periódico internacional.


Novidades para a próxima edição


A edição deste ano está sendo realizada com o apoio de diferentes instituições e foi formalmente vinculada à ESALQ e ao CENA, ambos na USP, campus Piracicaba. Desta vez, queremos uniformizar o número de selecionados por área de conhecimento, levando em consideração os eixos de ciências biológicas, agrárias e de saúde.


Também pretendemos realizar a nossa primeira vaquinha beneficente: os participantes poderão doar voluntariamente para um grupo dedicado à promoção de ciência e de programação na linguagem Python. Outra inovação é que a comissão organizadora está realizando encontros quinzenais para estudar Python - chamados code club - em preparação para o evento. Nessas reuniões, treinamos e discutimos as melhores formas de ensino e de elaboração de exercícios de fixação.


Desde 2021, nossa equipe das redes sociais promove divulgação científica em nossas contas do Instagram e do Twitter, onde postamos atualizações sobre o workshop e discutimos assuntos relacionados à linguagem de programação, dando dicas de recursos úteis para quem está se familiarizando com o assunto.


Nossa história


O Workshop de Python para Dados Biológicos foi uma iniciativa que partiu do biólogo e doutor em bioinformática Renato A. Corrêa dos Santos, que em 2017 teve apoio de seu co-orientador de mestrado, Diego M. Riaño Pachón, e da pesquisadora no IQ-USP Flávia Vischi Winck, bem como de outros colegas que “abraçaram” a ideia de ministrar um workshop para ensinar programação para outros biocientistas.


Hoje, a comunidade de workshops se estendeu para iniciativas na área de microbiologia e de biologia vegetal, com a criação de outros eventos paralelos (Workshop de Python para Dados de Microbiologia e Workshop de Python para Dados de Biologia Vegetal), com a intenção de que estes também sejam realizados anualmente, mas com um olhar mais específico para pesquisadores nestas áreas.


Membros anteriores da comissão organizadora relatam como o evento impactou sua formação:


“A minha experiência com o WPDB abriu minha mente para a necessidade de aproximar as ferramentas de análises de dados disponíveis às morosas etapas de tratamento de dados produzidos diariamente na bancada do laboratório. Eu trabalho majoritariamente com análises moleculares para fins de pesquisa e diagnóstico e, assim como grande parte dos nossos alunos, sentia a necessidade de uma apresentação mais adequada ao "universo biológico" e espaço para práticas e resolução de questões. Eu acompanhei esta iniciativa desde sua conceitualização inicial, edições subsequentes e, mais recentemente, uma excelente publicação, e os resultados reforçam que se trata de algo factível e reprodutível”

Leonardo Martins
Institute of Medical Biology, Polish Academy of Sciences
Centro de Pesquisa e Diagnóstico Molecular de Doenças Genéticas, Unifesp

 

“Ter participado da edição 2020 do Workshop de Python para dados Biológicos foi uma experiência ímpar. O evento foi, para mim, uma grande oportunidade para colaborar, interagir e aprender com alunos e profissionais de renomadas instituições; bem como criar laços de amizade com aqueles que se dedicaram desde as primeiras reuniões. A chance de ministrar os cursos também me instigou a buscar melhores formas de transmitir o conhecimento, trabalhar a autocrítica e entender as demandas dos alunos em seus projetos. A repentina mudança devido à pandemia nos desafiou enquanto organização, mas certamente foi uma edição onde colhemos muitos frutos, principalmente tendo nossos esforços registrados na forma de um artigo científico.”

Fernando Correr
Plant Sciences and Plant Pathology Department, Montana State University

 

"A oportunidade de ter participado das diferentes edições como parte da organização do Workshop de Python para dados biológicos me possibilitou a observação dos resultados e a execução das melhorias que se desenvolveram ao decorrer das edições futuras. As melhorias incluiam desde o cronograma do workshop, a criação do material didático, até a escolha das abordagens soluções-problemas que tentavam chegar ao mais próximo da realidade do participante. E tudo isso foi possível através de muito trabalho e encontros semanais da equipe de organização. Agradeço pelo crescimento pessoal-profissional que adquiri através desta oportunidade!"

Franciele Grego Esteves
Laboratório de Biologia Estrutural e Zooquímica, Unesp, Rio Claro

 

(1) Flash talks se refere a um modelo de apresentação curta, em que o participante selecionado tem a oportunidade de apresentar os seus resultados científicos (ou dados públicos) e de discutir com os colegas sobre possíveis aplicações da linguagem de programação Python no seu projeto de pesquisa (ou em dados público de seu interesse).