ABRUPTO

28.4.05


IDENTIFICAR TEXTOS ANÓNIMOS

Alguém conhece qualquer programa que sirva para identificar, ou definir com uma certa probabilidade, a autoria de um texto anónimo? Não se assustem (ou assustem-se a sério) os autores anónimos, que coisas deste tipo já existem certamente nas polícias e nos serviços de informação, mas não a público. Um programa que permita realizar uma base de dados de textos assinados, e a partir daí encontrar semelhanças vocabulares, lexicais, estilísticas e outras com textos não assinados, de modo a indicar com probabilidade o seu autor. Tenho uma ideia como isso se pode fazer e parece-me bem simples para quem tenha um mínimo de experiência de programação, mas admito que algo já possa existir poupando-me o trabalho.

Eu explico a necessidade: trabalhando nos meus estudos com textos quase exclusivamente anónimos – artigos da imprensa clandestina, relatórios, etc. – ser-me-ia útil poder precisar ou ter uma indicação de probabilidade de autoria. Como muitos dos autores desses textos – Bento Gonçalves e Cunhal por exemplo – são autores de muitos textos publicados com o seu nome, seria interessante poder identificar textos anónimos. Um exemplo: saber se foi Cunhal que escreveu no Avante! dos anos trinta um artigo sobre o aborto na URSS ou resolver a controvérsia sobre o relatório atribuído a Bento Gonçalves ( ou feito por “Pável”?) apresentado em 1935 à Internacional.

*
O professor Eric Johnson, da Universidade Estatal do Dakota, é autor de um texto sobre identificação de autores anónimos, "Comparing Texts and Identifying Authors" e também escreveu um software, chamado Ident, precisamente para esse fim, mas creio que não está disponível online.

(José Carlos Santos)

(url)

© José Pacheco Pereira
Site Meter [Powered by Blogger]