Caracterização de Sustentabilidade e Abertura do Software para Pesquisa na Universidade

Apresentação para banca de qualificação de mestrado do Programa de Pós-graduação em Ciência da Computação da Universidade Federal da Bahia.

Daniela Soares Feitosa

Orientadora: Dra. Christina von Flach G. Chavez

Salvador/BA, 15 de Janeiro de 2024



Definições

Definições

Ciência Aberta

Prática da Ciência na qual outros podem colaborar e contribuir, com publicações, dados, software e outros artefatos de pesquisa disponíveis online e gratuitamente, no longo prazo, com base em termos que permitam a sua reutilização e redistribuição, e a reprodução da pesquisa.

Recomendação da UNESCO sobre Ciência Aberta (UNESCO, 2021).

Definições

Software para Pesquisa

O software desenvolvido durante o processo de pesquisa e inclui (mas não está limitado a) código-fonte, algoritmos, scripts, fluxos de trabalho computacionais e executáveis.

GRUENPETER et al., 2021.

Definições

Sustentabilidade do Software para Pesquisa

O software para pesquisa para ser considerado sustentável deve permanecer disponível e funcional para a comunidade científica durante períodos de tempo significativos, permitindo a reprodutibilidade dos estudos que o utilizaram..

Recomendação da UNESCO sobre Ciência Aberta (UNESCO, 2021).

Definições

Abertura do Software para Pesquisa

Aderência aos princípios FAIR (FAIRness), tornando-os mais fáceis de encontrar, acessíveis, interoperáveis e reutilizáveis (Findable, Accessible, Interoperable, Reusable ).

WILKINSON et al., 2016.

Reformulação dos princípios FAIR para dados abertos, definindo 17 Princípios FAIR para Software de Pesquisa (FAIR4RS)

LAMPRECHT et al., 2020; HONG et al., 2022; BARKER et al., 2022

Problema

Problema

Impacto na confiabilidade e reprodutibilidade de pesquisas

A sustentabilidade e a abertura (aderência aos princípios FAIR) dos artefatos de pesquisa, incluindo software, são consideradas essenciais para a confiabilidade e a reprodutibilidade da pesquisa.

Recomendação da UNESCO sobre Ciência Aberta (UNESCO, 2021)

Problema

Indisponibilidade de artefatos de pesquisa em projetos de pesquisa financiados

Informações importantes como dados, fluxos de trabalho, código-fonte do software e outros artefatos da pesquisa nem sempre estão disponíveis, mesmo para projetos de pesquisa financiados por agências e fundações de pesquisa.

A Survey of the state of the practice for Research Software in the United States (CARVER et al., 2022)

Problema

Falta de conhecimento sobre a prática atual em universidades

É importante conhecer e reportar a prática atual em universidades, laboratórios de pesquisa e na indústria sobre o desenvolvimento de software para pesquisa e avaliar sua sustentabilidade e abertura para pesquisas de longo prazo.

Software Sustainability: Beyond the Tower of Babel (VENTERS et al.) A Survey of the state of the practice for Research Software in the United States (CARVER et al., 2022)

Objetivo Geral

Caracterizar grupos de pesquisa de diferentes áreas do conhecimento da Universidade Federal da Bahia (UFBA), com respeito ao uso de práticas de Ciência Aberta e à abertura e sustentabilidade do software para pesquisa desenvolvido por pesquisadores de tais grupos, no contexto de uso crescente de princípios e práticas da Ciência Aberta e valorização do software para pesquisa.

Objetivos Específicos

01. Compreender como conceitos, princípios e práticas de Ciência Aberta são percebidos por líderes de grupos de pesquisa.

Objetivos Específicos

02. Compreender como conceitos de sustentabilidade, abertura, e práticas relacionadas ao desenvolvimento de software para pesquisa sustentável e aberto são percebidos por líderes de grupos de pesquisa.

Objetivos Específicos

03. Caracterizar software para pesquisa desenvolvido pelos grupos de pesquisa em relação a sustentabilidade e abertura.

Objetivos Específicos

04. Disseminar conceitos, princípios e práticas da Ciência Aberta, recomendações e boas práticas para o desenvolvimento de software para pesquisa aberto e potencialmente sustentável.

Questões de Pesquisa

Questões de pesquisa

Q1: Qual é a percepção de líderes de grupos de pesquisa da UFBA sobre Ciência Aberta e software para pesquisa?

Q1.1: Qual é a percepção sobre conceitos, princípios e práticas de Ciência Aberta?

Q1.2: Qual é a percepção sobre conceitos e práticas para o desenvolvimento de software para pesquisa sustentável e aberto?

Q1.3: Quais são os incentivos e desafios para o grupo de pesquisa na adoção de práticas Ciência Aberta e para o desenvolvimento de software para pesquisa?

Questões de pesquisa

Q2: Quão sustentável e aberto é o software para pesquisa desenvolvido nos grupos de pesquisa da UFBA?

Q2.1: Quão sustentável é o software para pesquisa desenvolvido nos grupos de pesquisa da UFBA?

Q2.2: Quão aberto é o software para pesquisa desenvolvido nos grupos de pesquisa da UFBA?

Visão Geral da Pesquisa

Fluxo da pesquisa

Contribuições Esperadas

Contribuições Esperadas

Gestores da UFBA

Servir como ponto de partida para um planejamento institucional sobre Ciência Aberta e condições necessárias para sua adoção na UFBA.

Contribuições Esperadas

Grupos de pesquisa da UFBA

Estimular auto-avaliação e melhorias no software para pesquisa desenvolvido pelo grupo.

Contribuições Esperadas

Pesquisadores

Estimular o reuso e adaptação para diferentes contextos e instituições, e auto-avaliação do software para pesquisa desenvolvido.

Contribuições Esperadas

Sociedade

Estimular a disseminação de conceitos, princípios e práticas da Ciência Aberta, conforme recomendação da UNESCO.

Estratégia de Pesquisa

01. Entrevista

02. Avaliação de Software

03. Síntese de Resultados

Entrevista

Entrevista

Seleção de Participantes

Líderes de grupos de pesquisa com envolvimento direto no desenvolvimento de software utilizado em seus grupos de pesquisa;

Busca no Diretório dos Grupos de Pesquisa no Brasil do CNPq

Citações de software na seção Programas de computador registrado ou Programas de computador sem registro do currículo do pesquisador na Plataforma Lattes.

Entrevista

Guia de Entrevista

Entrevistas semiestruturadas com perguntas abertas;

Informações sobre o que é esperado de cada pergunta e questões de acompanhamento.

Entrevista

Análise dos Dados

Codificação qualitativa descrito por Schreier (2012) para identificação de padrões combinando duas estratégias:

(i) orientada por conceitos, ou seja, com base no que já sabemos;

(ii) orientada pelos dados, ou seja, deixando a codificação emergir das respostas.

Avaliação do Software

Avaliação do Software

Seleção do Software

O líder de pesquisa entrevistado será solicitado a sugerir projetos de software para pesquisa para avaliação e análise.

Avaliação do Software

Avaliação de Sustentabilidade

Avaliação de sustentabilidade baseada em práticas Avaliação de sustentabilidade do software para pesquisa baseada em práticas (FLACH et al., 2023).

Avaliação do Software

Avaliação de Abertura

Localizável (Findable)

Avaliação de abertura baseada nos princípios FAIR Princípios FAIR para Software (BARKER et al., 2022).

Avaliação do Software

Avaliação de Abertura

Acessível

Avaliação de abertura baseada nos princípios FAIR Princípios FAIR para Software (BARKER et al., 2022).

Avaliação do Software

Avaliação de Abertura

Interoperável

Avaliação de abertura baseada nos princípios FAIR Princípios FAIR para Software (BARKER et al., 2022).

Avaliação do Software

Avaliação de Abertura

Reusável

Avaliação de abertura baseada nos princípios FAIR Princípios FAIR para Software (BARKER et al., 2022).

Avaliação do Software

Análise dos dados

Faremos uma análise qualitativa de todas as tabelas preenchidas na avaliação de Sustentabilidade e Abertura do software para pesquisa para respondermos a questão Q2

Síntese de Resultados

Por grupo de pesquisa: síntese e discussão com base no cruzamento das entrevistas e a análise de documentos.

Todos os grupos: discussão geral sobre as práticas mais/menos utilizadas considerando todos os grupos.

Estudo Piloto

Desafios, Aprendizados e Ajustes

Duração e Disponibilidade do Participante

Priorização de perguntas

Formulação de Perguntas Abertas

Falta de Domínio dos Conceitos

Avaliação manual do software

Resultados Parciais

Resultados Parciais

Publicações

“Understanding Practices and Challenges of Developing Sustainable Research Software: A Pilot Interview”
[Artigo] OpenScienSE, 2023. DOI: https://doi.org/10.5753/opensciense.2023.235677
“Understanding Practices and Challenges of Developing Sustainable Research Software: A Pilot Interview”
[Artigo] OpenScienSE, 2023. DOI: https://doi.org/10.5753/opensciense.2023.235707
“Princípios e Práticas para Sustentabilidade do Software de Pesquisa”
[Capítulo de livro] JAI, 2023. DOI: https://doi.org/10.5753/sbc.12853.0.3

Resultados Parciais

Depósito de artefatos de pesquisa

Os artefatos da pesquisa, incluindo o guia da entrevista, a estrutura de codificação e a planilha com os grupos de pesquisa encontrados segundo a estratégia de seleção de participantes estão disponíveis no Zenodo:

DOI: https://doi.org/10.5281/zenodo.10467948

Cronograma

Cronograma

Caracterização de Sustentabilidade e Abertura do Software para Pesquisa na Universidade

Daniela Soares Feitosa (PGCOMP-UFBA)

dfeitosa@ufba.br

Disponível em: https://danielafeitosa.github.io/caracterizacao-sustentabilidade-abertura-software-pesquisa

Licença Creative Commons



Créditos

Imagens utilizadas nesta apresentação

Storyset: https://stories.freepik.com