Redes de Colaboração Científica a partir do Currículo Lattes

Fiz um pequeno experimento visando avaliar o alcance da minha rede de colaboração científica através da plataforma Lattes do CNPQ.

Escrevi um programinha em Java que recebe como entrada um ou mais identificadores de currículos lattes e percorre a rede de colaborações científicas formada a partir destes currículos, gerando um grafo de colaborações científicas.

O programinha é um parser bem simples que extrai de um currículo lattes todas as referências para outros currículos lattes e percorre em amplitude a rede gerada por essas referências. Em outras palavras, ele visita primeiro todos os currículos com distância 1 do currículo inicial (colaboradores diretos do currículo inicial) antes de visitar os currículos com distância  2 (colaboradores dos colaboradores do currículo inicial) e assim por diante.

Forneci o identificador do meu currículo na plataforma Lattes (1982919735990024) e botei o programa para rodar.

O programa encontrou outros 69 currículos lattes diretamente referenciados no meu currículo. Alguns desses currículos possuem também referências entre si, dando origem a uma rede com 70 nós e 137 arestas, ilustrada na figura abaixo.

alexandre-er1

Continuando a percorrer a rede de colaboração, no nível 2, ou seja, incluindo na rede os currículos referenciados pelos meus colaboradores diretos, chegamos a uma rede com 982 nós e 2821 arestas, ilustrada abaixo:

alexandre-er2No nível 3, a rede passou a ter 7784 nós e 25797 arestas.

alexandre-er3

Neste ponto, utilizei a ferramenta de visualização e análise (Gephi) para extrair algumas métricas sobre a rede formada.

Número de conexões por nó (grau): o nó mais bem conectado da minha rede é um pesquisador 1A do CNPQ e seu currículo possui referências para 190 currículos. O número médio de referências por currículo foi de 6,6.

Número de comunidades: a análise de modularidade identificou 35 comunidades (possíveis grupos de pesquisa) entre os currículos alcançáveis. É possível ver claramente vários desses grupos na figura acima. O maior desses grupos, representado na parte central da figura, possui mais de 700 colaboradores, entre pesquisadores e alunos de graduação e pós-graduação.

Distâncias entre nós na rede: A distância média entre dois currículos nesta rede foi 4,7

Um dado adicional interessante é que dos 7784 currículos incluídos na rede 1100 (14,1%) são de bolsistas em produtividade do CNPQ.

Minha ferramenta ainda percorreu mais dois níveis na rede gerada a partir do meu currículo lattes, chegando até pesquisadores que estão a 5 saltos de distância de mim, porém, a ferramenta que estou utilizando para gerar essas vizualizações (Gephi) abriu o bicho e não consegui mais processar a rede gerada.

Com 4 saltos de distância a rede tem 57169 nós e 132898 arestas e com 5 saltos de distâncias estes números sobem para 227353 nós e 918475 arestas.

É importante notar que estes números representam limites inferiores para o número de nós e arestas nesta rede pois só consideram as referências explicitamente definidas nos currículos lattes, ou seja, aquelas em que o pesquisador identifica os currículos lattes de seus colaboradores.

O programinha que eu escrevi está disponível no GitHub e você pode utilizá-lo e modificá-lo a vontade.

Não espere suporte de minha parte mas eu gostaria de ouvir sugestões de melhorias ou alterações no código.

 

Comentários

  1. Nazareno diz:

    Alexandre: quando tive problema com o tamanho do grafo, o Cytoscape resolveu pra mim: http://www.cytoscape.org/

  2. alexandre diz:

    Oi Nazareno,

    Eu já baixei o cytoscape mas ainda não testei. Vou tentar abrir os grafos maiores por lá para ver se o bicho aguenta o rojão. :-)

  3. Ih. Dá pra fazer muita análise interessante em cima disso, rapaz. Descobrir características sobre os hubs, os leechers, brokers, mensurar (em parte) a comunidade citada mas que não está no Lattes, integrações entre grupos, show de bola. Ideia boa não vai faltar, eis um começo: http://www.orgnet.com/sna.html.

  4. alexandre diz:

    Com certeza Jemerson! Tenho um aluno de mestrado trabalhando em cima disso. Temos algumas hipóteses bem interessantes para testar. :-)