defenestrando idéias
Mario Barbatti


  Início
  Índice de textos
  Gotas de Sabedoria

  

  Seus comentários
 Avise quando atualizado

  

  Física molecular
  Você conhece o Mario?
   
Defenestrando idéias
   
O dia a dia na terra das bananas & naquelas d´além mar.

[18/set/2006] Entre iguais, se sorteia

A idéia é simples e está completamente expressa no título-slogan, "entre iguais, se sorteia". Resta apenas construir meu argumento, o que começo a fazer a partir de um exemplo.

Imagine, o leitor, tendo que decidir a contratação de uma pessoa para assumir uma função específica em uma empresa. Para o processo de seleção, aparecem, digamos, vinte interessados qualificados, ou seja, todos aqueles sem os requerimentos mínimos para assumir a função, por exemplo, a falta de formação profissional adequada para a área, já foram descartados. Os vinte que sobraram preenchem os requisitos mínimos para o emprego. Como fazer para prosseguir com a seleção e eventualmente chegar ao melhor resultado, que neste exemplo significa escolher o melhor profissional para assumir o cargo?

Você junta sua equipe de especialistas e prepara uma série de testes. Dinâmica de grupo, perfil psicológico, prova de conhecimentos específicos e gerais. A partir dos resultados, os vinte candidatos são classificados e, claro, aquele com a melhor pontuação é escolhido.

Mas foi a escolha realmente a melhor possível? Afinal, quão confiáveis foram os testes aplicados? Uma nota levemente melhor num teste de dinâmica de grupo é realmente relevante para distinguir entre dois candidatos? E se na prova de conhecimentos gerais, um candidato teve melhor performance porque por pura coincidência havia, na noite anterior, assistido a um programa de TV sobre um tema abordado no teste? E se o candidato mais adequado ao cargo teve uma noite ruim e não conseguiu se concentrar no teste de conhecimentos específicos?

Provavelmente, você estará correto em analisar que como os vinte eram minimamente qualificados, o conjunto dos resultados dos testes muito provavelmente ajudou a pelo menos a escolher um dos melhores candidatos, dentro da incerteza gerada por questões como as do parágrafo anterior.

Olhe, porém, por um outro ângulo: sabendo que o conjunto dos testes possui uma incerteza intrínseca, seria possível aumentar a chance de escolher realmente o melhor dentre os melhores?

Suponha que as notas dos cinco candidatos mais bem classificados foram, de 0 a 10, A = 9,9, B = 9,8, C = 9,5, D = 9,1 e E = 7,0. Olhando tais números, parece óbvio que a escolha do candidato A com 9,9 foi a mais bem acertada. O candidato B com 9,8 também seria uma boa escolha, mas - fazer o quê? - só havia uma vaga.

Bom, a validade desta análise depende, sobretudo, da incerteza dos testes. Digamos otimisticamente que eles possam distinguir entre candidatos com uma margem de erro de mais ou menos 0,1 ponto. Neste caso, as notas 9,8 ± 0,1 e 9,9 ± 0,1 se sobrepõem e a escolha de A ou B seria estatiscamente equivalente. Contudo, se a incerteza dos testes for 0,5, o candidato C com 9,5 ± 0,5 também teria sido uma boa escolha, talvez a melhor.

O primeiro problema é que normalmente não temos a menor idéia da incerteza dos testes. Este é um número que para ser definido precisaria de um controle metodológico muito além do requerido numa simples seleção profissional. Os testes teriam que ser repetidos várias vezes com os mesmos candidatos e com outros, sob diversas situações, com grupos de controle e estratégias de duplo-cego.

O segundo problema é que mesmo que conhecêssemos a incerteza, nossa intuição numérica nos faz nos concentrar nos números principais e desprezar os erros. Mesmo que soubéssemos que a incerteza do teste é, por exemplo, ± 2,0, teríamos uma enorme dificuldade em aceitar que tanto faz escolher o candidato A com 9,9 ou o candidato D com 7,0. Escolheríamos o candidato A de forma subjetiva e sem nenhum embasamento metodológico.

(Um exemplo desta atitude são notícias como:

"Ibope: Alckmin sobe mas Lula venceria no 1º turno (...) Segundo a pesquisa tucano cresce dois pontos e passa para 27%. (...) foi o único candidato a subir na mais recente pesquisa (...) Passou de 25% para 27%, variando dentro da margem de erro de dois pontos." O Globo, 10 de setembro de 2006.

Apesar de que neste caso, a motivação parece ser mais a de criar uma notícia que venda mais jornais, do que um honesto engano de análise.)

O terceiro problema é que mesmo que soubéssemos a incerteza dos testes e estivéssemos dispostos a levá-la em conta na seleção, qual seria a melhor forma de fazê-lo?

Uma possível solução seria criar um novo nível de seleção. Por exemplo, com uma incerteza de 0,5, os candidatos A, B e C seriam chamados para uma nova bateria de testes. Mas novos problemas surgem a esta altura, os novos testes também teriam suas incertezas e potencialmente ainda teríamos vários candidatos estatisticamente equivalentes. Incidentalmente, novos níveis de teste tendem se concentrar em questões cada vez mais irrelevantes. Além de tudo - não menospreze este ponto - novos níveis de seleção aumentam o custo do processo.

Não existe solução perfeita para a questão. Mas aquela que reúne as melhores qualidades é o simples sorteio da vaga entre os candidatos A, B e C (mesmo que a incerteza do exame não seja conhecida, é possível estimá-la de forma aproximada). É uma decisão qualificada, por levar em consideração apenas os melhores candidatos. É uma decisão justa, por levar em conta a incerteza intrínseca dos testes. É uma decisão objetiva, por evitar os artificialismos criados por testes cada vez mais refinados e "limpar" a escolha de eventuais subjetividades introduzidas ao longo do processo de seleção. É, finalmente, uma decisão barata, por não exigir muito mais que papéis dobrados no fundo de um copo.

Em resumo, A, B e C são iguais e entre iguais, se sorteia.

Consigo imaginar uma boa variedade de situações nas quais seria vantajoso se usar o critério de sorteio. Os mais óbvios seriam concursos públicos e vestibulares. Quanto aos concursos públicos, o exemplo anterior já deve ter deixado claro quais seriam as vantagens de se sortear vagas entre os mais bem qualificados candidatos. Ainda posso reforçar o argumento, lembrando que algumas vezes as avaliações de concursos não são elaboradas por profissionais e os critérios acumulam muitas falhas.

Isto ocorre, por exemplo, na seleção de novos professores para universidades públicas. Nestes concursos, os candidatos são avaliados por professores seniores, cujos interesses pessoais são afetados de forma diversa pelos candidatos (candidato A será parceiro, mas B será um competidor...) e normalmente incluem uma "prova de aula", cuja avaliação é extremamente subjetiva. Em casos como estes, os examinadores deveriam ser chamados apenas para qualificar os candidatos, ou seja, dizer quais teriam condições de ser bons professores universitários. O sorteio da vaga entre os candidatos qualificados simplesmente eliminaria as escolhas subjetivas e outras imperfeições do processo amador de seleção.

Em relação aos vestibulares, há ainda um ponto sobre o qual quero estender a discussão. Me lembro que quando fiz a prova de ingresso para o curso de física da UFRJ, nos distante ano de 1990, uma das questões da prova de história (não específica) pedia para dissertar sobre a Guerra dos Boers na África do Sul. O episódio é uma boa ilustração da barbárie do Império Britânico no século 19, mas, convenhamos, é extremamente específico e localizado para ser relevante para uma prova de ingresso no curso de física. Os avaliadores poderiam ter perguntado sobre alguma questão mais geral e relevante, como, por exemplo, a situação geopolítica que levara à Primeira Guerra Mundial, porém preferiram a específica, por quê?

Simples: se tivessem feito a questão geral, a maior parte dos candidatos teria respondido adequadamente e o resultado da prova teria sido de pouco valor para a seleção. Provavelmente, no ano seguinte, os cursinhos pré-vestibulares incrementaram sua agenda, incluindo uma boa revisão das guerras de partilha imperialistas. Mas se os candidatos agora sabem detalhes sobre tais assuntos, os avaliadores têm que descobrir uma nova seara de assuntos específicos.

Pronto, estão criadas as condições para uma corrida armamentista entre avaliadores e avaliados. E como bem sabemos, corridas armamentistas sempre resultam em monstros hipertrofiados, como armas de destruição em massa, caudas de pavão e provas de vestibulares.

Fosse adotado o critério do sorteio, a situação poderia ser bem diferente. Os exames perderiam a função de classificar os candidatos. A sua função seria de qualificar os candidatos. Ou seja, ao final do exame, não teríamos uma lista ordenada de nomes, da mais invejável até a mais miserável nota. Ao invés, teríamos os nomes agrupados em duas categorias: os candidatos qualificados e os não qualificados. As vagas seriam então sorteadas entre os qualificados.

Há alguns parágrafos, introduzi a idéia do sorteio qualificado como possível resposta à questão de, dada a incerteza do exame, como aumentar a chance de escolher o melhor dentre os melhores. Mas na verdade, este método de sorteio qualificado não mira no melhor. Mira na média dos melhores. Ao mirar no centro da média qualificada, o sorteio qualificado adquire o potencial para corrigir distorções na metodologia de seleção e mesmo algumas causadas por ela.

Em um dos textos anteriores do Defenestrando Idéias (Fraude em ciência: exceção ou regra?), discuti como a fraude e outros mau-comportamentos em ciência eram fenômenos comuns que decorriam dos processos de avaliação. As agências de fomento científico tendem a adotar critérios de avaliação classificatórios, baseados em avaliação por pares, contagem de número de publicações ou algum outro critério mais sofisticado, como o fator h. Periodicamente, cientistas são avaliados pelas agências e o que entra em jogo é a renovação de suas bolsas de pesquisa, o financiamento de seus estudantes e o orçamento de seus laboratórios. Diante da pressão da avaliação, eles tendem a comportamentos que vão do simples "assinar sem ler" as publicações produzidas por seus pós-graduandos e pós-docs, passando pela formação de comunidades de auto-citação, pela flexibilização do rigor metodológico, até as mais descaradas fraudes.

(Claro que cientistas diferentes sob a mesma pressão podem ter comportamentos éticos complemente distintos. Esta questão foi também recentemente discutida aqui no Defenestrando Idéias (Violência, corrupção e outros bois), num contexto diferente.)

O sorteio qualificado, ao mirar a média dos melhores e não o melhor dentre os melhores reduz o excesso de pressão que leva à fraude e produções hipertrofiadas de artigos e citações. A avaliação, neste caso, passa incentivar a média qualificada. Premia o bom trabalho, mas não o excepcional. Não que não se deva premiar o trabalho excepcional, o profissional acima da média. Pelo contrário, isto deve ser feito com freqüência, pompa e circunstância. Não deveria ser simplesmente relegado às avaliações de rotina.

O sorteio qualificado poderia de forma vantajosa ser aplicados aos mais variados processos de seleção e avaliação. Como argumentei ao logo deste texto, ele tende a produzir melhores resultados do que a seleção por exame classificatório porque lida de forma adequada com a incerteza intrínseca a toda avaliação; elimina distorções nos exames, como aquelas introduzidas por critérios subjetivos; e minimiza distorções causadas pelos exames, como a corrida armamentista entre avaliadores e avaliados. Diante de todas estas vantagens, alerto o leitor que o sorteio qualificado não resolveria todos os males que afligem a humanidade. Restaria ainda achar a cura do câncer, mas isto deixo para outro texto.

(Texto de Mario Barbatti)  


Leia também no Defenestrando Idéias:
Fraude em ciência: exceção ou regra?


gun.gif (5899 bytes)

Gotas de Sabedoria