Defenestrando idéias
Mario Barbatti


  Início
  Índice de textos
  Gotas de Sabedoria

  

  Seus comentários
 Avise quando atualizado

  

  Física molecular
  Você conhece o Mario?
   
Defenestrando idéias
   
O dia a dia na terra das bananas & naquelas d´além mar.

[04/mai/2004 As palavras e as regras (I)  

1. Contando a história da língua

A idéias é simples: às vezes a linguagem trabalha usando palavras memorizadas outras por regras que geram palavras. Esta é a hipótese básica que perpassa Words and Rules, livro de Steven Pinker, e que tenta conciliar as duas grandes escolas de teorias lingüísticas, a gramática generativa e o conectivismo. Pinker, que é Professor do departamento de psicologia da Universidade de Harvard, usa o fenômeno dos verbos e plurais regulares e irregulares para mostrar a natureza dupla da linguagem, sua dependência das palavras e das regras.

Pinker, antes de se embrenhar pela discussão central, gasta alguns capítulos explicando ao leitor não especialista a origem histórica e fonética da língua inglesa e os fundamentos da lingüística. E aí, aquelas coisinhas estranhas a respeito da linguagem, como o porquê de existir verbos irregulares, vão se clareando.

Por exemplo, que brasileiro não se intriga com o fato da língua inglesa possuir apenas o verbo be para ser e estar? Pinker explica que no antigo inglês, falado entre os anos de 450 e 1100 d.c., havia três verbos para designar existência: beon (estado permanente, ou ser), wesan e esan (estado temporário, ou estar). Ao longo da história, restou apenas o verbo be, derivado de beon. Mas os outros dois deixaram sua marca: esan forneceu am, is e are, e wesan, was e were.

Steven Pinker

Aprendemos que no antigo inglês, falava-se e ouvia-se "Christ Mass" (Missa de Cristo, com i longo, como /ái/) e com o tempo as novas gerações falavam e ouviam "Christmas" (Natal, com i curto, como /i/). Em algum momento perdido na história da língua inglesa, havia possivelmente gente falando de uma forma e outros ouvindo da segunda. 

E para nós, latinos, com conjugações verbais para todos os gostos, descobrimos fascinados que o inglês já fora menos monótono. Até o inglês médio (1450 d.c.), a conjugação típica de sing (cantar) seria:

I sang
Thou sunge
He, she sange
We sungon
You sungon
They sungon
Eu canto
Tu cantas
Ele, ela canta
Nós cantamos
Vocês cantam
Eles cantam

Words and Rules é uma obra deliciosa e sente-se a cada momento falta de uma equivalente tratando da língua portuguesa. Mas, infelizmente, dada suas características, é intraduzível. Por isto vou tentar, neste texto, na medida do possível, utilizar exemplos em português, equivalentes aos usados por Pinker.

2. Regras ou Palavras?

Aprendemos cedo na escola que os particípios dos verbos amar, vender e partir são amado, vendido e partido. A partir destes paradigmas, sabemos o particípio de qualquer verbo. 

Temos:
Casar, comer, fugir: casado, comido, partido
Gastar, fazer, abrir: gastado, fazido, abrido

Ôpa! Problemas com "fazido"? A professora rápido ensinava que alguns verbos ganham um particípio irregular, ou seja, que não obedece às mesmas regras do paradigma. Assim, gasto, feito, aberto.

Mas e estes "irregulares", obedecem a alguma regra? Afinal, eles aparecem em famílias como abrir, cobrir, descobrir: aberto, coberto, descoberto. Talvez sejam dificuldades fonéticas inerentes à fala portuguesa que nos impeçam de falar "cobrido" ou "vido" e os transforme em "coberto" e "vindo". Ou serão os irregulares idiossincráticos e aleatórios, com o nascimento enterrado na história lusa?

O lingüista Noam Chomsky, pai da gramática generativa, responderia favoravelmente à primeira hipótese. Mesmo que pouco aparentes e extremamente abstratas, haveriam regras para derivação dos particípios irregulares. Chomsky, Halle e Mohanan desenvolveram para a língua inglesa um sistema de apenas três regras, capaz de prever a forma passada de 165 verbos, tanto regulares, como work - worked, quanto irregulares, como drink - drank. Para esta escola lingüística, os nossos cérebros não memorizariam palavras como "amar", "amei", "amamos", ou "amado", mas as construiriam a partir de certas regras partindo de uma forma oculta e abstrata. Estas formas ocultas não seriam nunca faladas e eventualmente poderiam ser bastante diferentes do resultados sonoro. 

No inglês, por exemplo, a forma oculta para buy (comprar) seria "beech" (bír). Segundo as três regras da teoria de Chomsky, Halle e Mohanan, na formação do passado, beech ganha um -t, para isto sofre uma flexão da vogal de e longo para o longo, formando boocht (búrt). Em seguida, o agrupamento cht dispara uma função de encurtamento, que resulta em bócht (bórt). Finalmente, o ch desaparece para dar o resultado final bought (bót).

Esta teoria impressiona pela imensa síntese que faz ao determinar que poucas regras fonéticas são capazes de gerar flexões regulares e irregulares. Mas ao mesmo tempo, a extrema abstração destas regras deixa no ar aquela perguntinha: será que a coisa realmente é assim em nossos cérebros? 

Faça o teste! Sabendo que "lambrir" é o ato de colocar lambris, complete para si mesmo a seguinte questão:

Teste 1

"Estou fazendo uma obra em casa. Comprei azulejos e tenho azulejado todo o banheiro. Também comprei lambris e tenho .............. todo o teto."

Você respondeu lambrido ou lamberto? Repita o teste com os amigos. Vai ser um verdadeiro sucesso numa mesa de bar.

Bom, se a sua resposta é lamberto, você está dando subsídios para a teoria de Chomsky. Pois neste caso, ele argumentaria que seu cérebro utilizou as mesmas regras que utiliza em abrir e cobrir (aberto e coberto). Mas se a resposta é lambrido, como muito possivelmente foi, isto deixa Chomsky com um problema. Por que a regra funciona em alguns casos e não em outros, já que a estrutura fonética das palavras é a mesma (todas terminam em -brir)?

Talvez, portanto, este papo de regras seja balela. Nossos cérebros não estariam construindo as palavras se utilizando de regras abstratas, mas poderiam estar fazendo associações por semelhança!

Abrir é parecido com cobrir, por isto aberto e coberto. Lambrir, palavra estranha, não foi imediatamente associada, por isto, lambrido. Chomsky continuaria se defendendo dizendo que a estrutura fonética não era exatamente idêntica, afinal, lambrir tem um som nasal antes do b, que abrir e cobrir não têm.

Mas o pessoal do conectivismo continuaria argumentando que o cérebro não usa regras, mas sim memoriza palavras e encontra novas flexões verbais, de gênero, de número, etc., por semelhança com as pré-memorizadas. Isto explicaria porque crianças às vezes falam "fazido" ao invés de "feito". Elas ainda não teriam memorizado a forma correta.

Uma forma de testar a hipótese do conectivismo é empregar simulações computacionais com redes neurais. Nestas simulações, as unidades de entrada da rede são os sons do radical do verbo numa forma abstrata. Por exemplo, seriam entradas: 1) nasal-consoante-vogal, 2) consoante-vogal, 3) vogal - vogal, etc. As saídas seriam os sons da forma flexionada, com a mesma classificação que a anterior. 

Exemplo hipotético de uma rede neural para 
simulação de flexões verbais.

Cada caminho na rede estabelece uma regra de flexão. Na figura acima, a primeira regra seria: "Se a raiz do verbo é do tipo nasal - consoante - nasal, então a forma flexionada é nasal - consoante -nasal." Na rede da figura, temos três entradas e três saídas, portanto apenas 3 x 3 = 9 regras. No trabalho pioneiro de David Rumelhart e James McClelland publicado em 1986, eles simularam a flexão do passado em língua inglesa usando uma rede de 460 x 460 = 211600 regras.

A partir de uma lista básica de verbos e suas flexões, a rede é treinada e se estabelece uma certa probabilidade de ocorrência para cada regra. Por exemplo, se na lista de verbos para treinamento nenhum verbo segue a regra "vogal - vogal resulta em vogal - vogal", isto implica que esta regra terá probabilidade zero de ocorrência. A rede de Rumelhart e McClelland fora treinada com 420 verbos. Ao utilizar a rede para produzir as formas passadas de novos verbos regulares e irregulares, que não estavam na lista de treinamento, a rede se saiu bastante bem, apesar de não ser perfeita.

Mas perfeição poderia significar apenas que mais unidades devem ser adicionadas à rede ou a própria arquitetura da rede deve mudar para otimizar certas redundâncias.

Seria a teoria do conectivismo mais adequada que a gramática generativa? O problema é que nem todos os esforços de reformulação das redes neurais conseguiram eliminar os seus problemas, como o de dar conta de verbos que soam parecidos, mas flexionam diferentes, como ring - rang e wring - wrung ou break - broke e brake - braked. Em poucos anos, o conectivismo e suas simulações com redes neurais decaiu de uma maravilha que, segundo o Times Literary Supplement, faria a lingüística tradicional se tornar algo como a alquimia, para má-ciência que deveria ser guardada no mesmo baú que os Raios N ou a fusão a frio, segundo o matemático A. K. Dewdney.

Isto nos deixa o seguinte cenário: uma teoria prevê que os processos de flexão na linguagem são determinados por regras abstratas, a outra teoria prevê que estes processos se dão por associação de palavras semelhantes pré-memorizadas. Ambas explicam parte do fenômeno lingüístico e ambas possuem problemas difíceis de resolver. Qual delas seria a "mais correta"? A resposta de Pinker é simples: ambas, dependendo do caso.

Mas esta história fica para o próximo Defenestrando Idéias.

(texto de Mario Barbatti)


Leia também no Defenestrando Idéias:
As palavras e as regras (II)
As palavras e as regras
(II
I) 

Que dirá de uma sociobiologia?  
Frijof Capra: Não li e não gostei
Oito anos desde Sokal


gun.gif (5899 bytes)

Gotas de Sabedoria