Entrevista com Pierre Lévy. O IEML e a Web Semântica

O Pierre Lévy é um visionário da cibercultura. Mais do que teorizar e propor conceitos para o entendimento do tema, ele mantém também uma postura política de intervir na melhoria das condições de desenvolvimento desta nova forma de cultura. Ele é daqueles cientistas que não não separam produção de conhecimento de política, por que na verdade sabe que toda produação de conhecimento é uma intervenção política. O que ele escreve ou diz deve sim ter efeitos na sociedade, deve contribuir de alguma forma para mudar práticas sociais, para contribuir no desenvolvimento de uma inteligência coletiva, como ele chama.

Um exemplo disso é o projeto que ele está desenvolvendo agora, o IEML. Esse projeto propõe a unificação o conhecimento global através de uma linguagem comum à todas as comunidades da grande rede. Se este projeto se concretizar será uma verdadeira revolução comunicacional, uma verdadeira dissolução da comunidade babélica na qual nós vivemos.

Em entrevista ao G1, Pierre Lévy, conta com detalhes quais são os objetivos desse projeto e as expectativas. Leia abaixo a entrevista na íntegra:

G1 – Você está trabalhando com uma equipe em um projeto novo, o IEML. Qual o problema que o IEML quer resolver?

Pierre Lévy – Digamos que, no curto prazo, há um problema relativamente pequeno, chamado de problema da operabilidade semântica. E também há um objetivo de longo prazo, pra mim, que é resolver o problema da auto-referência e da reflexibilidade da inteligência coletiva.

Então, o primeiro problema é a operabilidade semântica. Obviamente, hoje em dia, todos os documentos e todas as mensagens estão ligadas entre si pela internet, no ciberespaço. Então há uma interconectividade física por conta da internet. Mas ainda há uma divisão semântica, uma fragmentação entre esses documentos.

Essa fragmentação da informação existe, em primeiro lugar, por conta da existência natural de várias línguas. Se alguém escreve um blog em chinês, eu não consigo ler, você não consegue ler e os programas de tradução automática, como do Google, não são muito bons. Portanto, não há comunicação.

Outro aspecto é que temos sistemas diferentes de classificação das informações. Os computadores podem usar um sistema de classificação, e se meu conteúdo é organizado por um sistema diferente, as coisas começam a ficar complicadas. E existem centenas de sistemas diferentes.

Por exemplo, nas bibliotecas, você pode organizar os livros por disciplinas, por ano de publicação, por área geográfica de interesse, e por aí vai. Em outra biblioteca, a divisão será diferente, e aí é uma bagunça.

Os cientistas da computação criaram algo que é bastante poderoso, usado pela famosa “internet semântica”, que é chamado de “ontologia”. A “ontologia” é uma rede de conceitos na qual as relações entre um conceito e qualquer outro da própria “ontologia” é bem definido. Portanto, os computadores são capazes de raciocinar automaticamente sobre os conceitos da ontologia.

Por exemplo, você está lendo um documento e identifica que ele trata sobre os conceitos “x”, “y” e “z”. Se você expressar essas idéias em uma ontologia, o computador é capaz de identificar que este documento está ligado a outros, e te ajudará a filtrar, navegar e expandir seu acesso a conhecimentos correlatos. É algo muito benéfico e poderoso.

O problema é que há muitos sistemas diferentes de ontologias. Todo esse raciocínio automatizado, o uso de filtros e conexões, geralmente é restrito a uma área do conhecimento. E, às vezes, você esbarra em uma situação na qual em um mesmo domínio de informações há várias ontologias diferentes. Diferentes especialistas podem dividir as informações de formas nem sempre compatíveis. E, esse é essencialmente o problema de operabilidade semântica.

A linguagem que estou propondo pode ser traduzida para diferentes línguas naturais, e pode expressar classificações e ontologias de todas as áreas. Além disso, ela é criada originalmente de uma maneira na qual os computadores podem fazer várias operações utilizando esses termos. E não apenas operações lógicas, como raciocínio automatizado, mas também variações, rotações, conexões diferentes, como se uma expressão fosse um número. Desta forma, é possível fazer transformações geométricas com as informações em um espaço semântico. Essa é a idéia básica.

As linguagens naturais são muito irregulares, e têm um léxico muito ambíguo. Há sinônimos, homônimos, etc. A linguagem que proponho é completamente artificial, segue regras bastante estritas, de modo que permita a manipulação automática das informações.

O que eu espero é que, utilizando essa linguagem, sejamos capazes de fazer traduções automáticas com muita facilidade. Ela funcionará como uma “chave” entre duas línguas naturais, e vai facilitar a navegação e a filtragem de informação, buscas e diversas operações que poderiam ser feitas automaticamente. No final, ela vai aumentar a colaboração entre estudantes e pesquisadores de disciplinas, culturas e línguas diferentes.

Mas, como falei no começo, há um segundo objetivo, que é o de ajudar no registro da inteligência coletiva no ciberespaço. Para colocar de uma forma mais simples, o objetivo é ajudar as pessoas a terem acesso a uma representação do que está acontecendo na internet, do que está se falando, quais são os problemas que as pessoas estão tentando resolver naquele momento, etc.

Hoje em dia, não é possível obtermos uma boa representação da inteligência coletiva da internet. Por exemplo, há uma imagem bastante famosa que tenta representar a internet por meio de diversos pontos ligados por traços coloridos brilhantes . As pessoas olham e pensam: “ah, a internet é como um cérebro”. Mas, na verdade, essa imagem representa apenas os nós físicos da estrutura da rede, e como é o fluxo quantitativo de informação entre esses nós.

Mas, pra mim, a representação real da inteligência coletiva não pode ser feita dessa forma, e sim por um mapa qualitativo, que mostre o fluxo de conceitos, ideias, assuntos e tópicos pela rede, e que tipo de relação semântica as pessoas estão criando – por meio de seu comportamento coletivo na internet.

Para essa representação, podemos até repetir a imagem do cérebro e suas conexões, mas em vez de neurônios, temos ideias. No lugar da corrente elétrica entre os neurônios, teremos as relações semânticas de significado entre as ideias. Essas relações são criadas pelas ações dos indivíduos.

É muito fácil criarmos uma representação do que está acontecendo no espaço real, físico, mas no espaço semântico, não sabemos. Não temos um sistema coordenado. Não há uma ferramenta universal para medir, mapear e representar isso. Portanto, o objetivo mais importante dessa linguagem é ser uma espécie de sistema universal coordenado do espaço semântico.

G1 – Isso iria casar bem com o conceito de web em tempo real, que tem como principal representante no momento o Twitter. Você poderia medir como estão se propagando as ideias, mas universalmente. Esse é o plano?

Lévy – Exato. Atualmente você não pode fazer isso, já que há comunicação em diversas línguas. É completamente fragmentado, você não tem uma ideia global da inteligência coletiva.

Aliás, há pesquisas científicas sobre um mesmo assunto que são feitas simultaneamente, mas em línguas diferentes. Essa linguagem não serviria apenas para unificar o conhecimento global, mas você poderia utilizá-la para pequenas equipes, grupos de pesquisa e pessoas interessadas em um assunto comum. Qualquer comunidade iria lucrar com isso.

G1 – E essa linguagem deve funcionar apenas com documentos estáticos ou pode ser aplicada em algo mais dinâmico, como o Twitter?

Lévy – Não sei exatamente quando poderei fazer minha primeira demonstração da linguagem em funcionamento, pode ser em um ano ou em dois anos, mas o plano é fazê-la funcionar inicialmente no Twitter. Criar um filtro colaborativo de pessoas, documentos e sites citados por pessoas no Twitter. Ou seja, ela será bastante útil para o que chamamos de “fluxo de informações” ou “web em tempo real”.

Isso não quer dizer que ela deixará de ser útil para depósitos de informação de longo prazo. Se você parar pra pensar que quase todas as bibliotecas do mundo estão digitalizando seu conteúdo e vão colocá-lo na internet, e que cada uma dessas bibliotecas terá sistemas de organização diferentes, isso pra mim é um problema.

G1 – O senhor afirma que o que estamos vivendo hoje em dia é uma revolução maior do que a que se seguiu à invenção da prensa tipográfica, e que estamos passando por um salto na produção e divulgação de conhecimento. Do ponto de vista da inteligência coletiva, o que fazem sistemas de organização de conteúdo como o Google já não é suficiente para organizar nossas ideias?

Lévy – Na verdade, são coisas diferentes. Mas há uma semelhança importante: o que algoritmo de organização do Google faz, o famoso “Pagerank”, é levar em conta a inteligência coletiva. Ele decide que um conteúdo é mais importante se tiver mais links levando a esse conteúdo, principalmente vindos de páginas igualmente relevantes, com mais links que levam a essa referência. O Google leva em conta, portanto, a inteligência coletiva das pessoas que estão construindo a web.

Também estou tentando fazer isso. Mas de uma forma diferente. O algoritmo do Google é baseado principalmente em estatísticas. Portanto, é uma análise quantitativa. Eu não sou contra uma computação quantitativa, é claro, mas o que eu quero fazer é uma computação quantitativa em um espaço qualitativo. Esse é meu “twist”, por assim dizer.

Talvez eu esteja enganado, e isso nunca aconteça, mas eu creio que se a humanidade realmente quer viver uma fase de crescimento do conhecimento – e, como você apontou, a grande revolução nas ciências naturais na Europa ocorreu após a invenção da prensa. Não foi a única causa, é claro, mas foi a base.

E eu estou convencido de que haverá, na próxima geração, uma nova revolução científica, mas não nas ciências naturais, mas nas ciências humanas. Hoje em dia, todos os dados sobre o comportamento humano podem ser reunidos no ciberespaço, o único problema é que ainda não temos a capacidade de explorar essas informações. E se não tivermos um sistema coordenado no espaço semântico, o espaço dos significados, não seremos capazes de viver essa revolução.

Isso poderia ajudar na cooperação entre disciplinas diferentes das ciências humanas, como psicologia, sociologia, economia, linguística, comunicação, etc. Em todas essas disciplinas, que atualmente têm conceitos diferentes, e às vezes numa mesma disciplina, teorias diferentes, é muito difícil construir algo capaz de abranger o todo e compreender o que está acontecendo na sociedade.

G1 – O senhor usa o termo ciberespaço, que recentemente foi “aposentado” por parte da comunidade acadêmica, que alega que hoje em dia não há necessidade de diferenciar o que ocorre no mundo “real” e na internet. O senhor concorda com essa avaliação?

Lévy – Sinceramente, eu não tenho certeza que essa discussão seja relevante. Por exemplo: hoje em dia ainda usamos escrita em papel. Há alguma relevância em saber que um texto está escrito em papel ou digitalmente? Pra mim, o virtual fez parte do real desde o início, e quando nos comunicamos pela troca de e-mails, por exemplo, não há uma diferença relevante em relação ao tempo em que trocavamos cartas. Continuamos escrevendo, enviando e lendo textos. É sempre parte de nossa experiência. E a manipulação dos símbolos é uma parte importante da experiência humana.

G1 – Como a indexação da inteligência coletiva pode mudar a maneira que lidamos com o conhecimento?

Lévy – Precisamos de uma grande revolução epistemológica. Os dados estão lá, mas em uma quantidade absurda. Portanto, não temos como explorá-los manualmente, lendo tudo, por exemplo. Precisamos, portanto, automatizar a exploração desses dados. Mas se, por exemplo, os dados estão escritos em 300 línguas diferentes, e estão indexadas em 250 metodologias diferentes, essa automatização não vai funcionar.

Portanto, o que precisamos é de uma metalinguagem, que possa ser completamente manipulável por sistemas automáticos e, ao mesmo tempo, possa ser usada para expressar qualquer tipo de ideia, ponto de vista ou teoria. Se ela limitar a expressão de uma teoria, ou de uma interpretação, não serve. Pelo contrário: ela deve ajudar a aumentar a diversidade de pontos de vista. Talvez não seja a língua que eu criei que será a base dessa revolução científica, mas haverá algo nesses moldes. E eu acredito que devemos iniciar em breve as primeiras tentativas.

A dificuldade dessa tarefa é que é necessário ter um conhecimento muito amplo em ciências humanas, estar ciente da complexidade das culturas, dos significados, e ao mesmo tempo ser capaz de lidar com computação. É preciso ter essas duas habilidades para realizar isso. E, geralmente, os engenheiros são muito bons em matemática e em lógica, e às vezes em física. Mas em termos de semântica, não. Eles confundem lógica e semântica, que são coisas bastante diferentes. A lógica é sobre a verdade de uma proposição particular, e a fusão de verdades que são derivadas de uma verdade original. É uma discussão sobre “verdadeiro” ou “falso”. A semântica é muito mais complexa do que isso, do que “verdadeiro” ou “falso”.

Lévy – No momento, eu chamo essa pessoa de “engenheiro semântico”. Há um lado de engenharia e um lado de ciências humanas. É algo que vai requerer um treinamento especial, provavelmente, mas como todas as profissões. Eu reconheço que, no momento, esses profissionais não existem. Algumas pessoas estão se autodenominando “arquitetos da informação” ou “engenheiros de conhecimento”. Então já surgem, de forma dispersa, os primeiros núcleos de profissionais dessa área, o que significa que não vamos partir do zero. Mas, claramente, mesmo esses profissionais de agora precisarão evoluir. Mesmo porque estou falando do futuro, de coisas que não existem ainda agora.

G1 – No futuro, portanto, haverá uma demanda por esse tipo de profissional. Que tipo de formação deve procurar um jovem que tem interesse em trabalhar nesta área?

Lévy – Um velho filósofo não deve dizer a uma criança o que ela deve fazer…No momento, eu é que estou tentando entender o que elas estão fazendo. Mas eu diria que habilidade técnica não é o suficiente, e o conhecimento sobre as relações humanas é importante. Quando você é jovem, você pode se concentrar em entender as questões técnicas, mas quando você envelhece percebe que as questões humanas são muito mais complexas do que você imaginava antes.

G1 – E o presente da internet? Quais são suas ferramentas prediletas no momento?

Lévy – No momento, eu tenho me interessado bastante pelo Twitter, porque é tecnicamente muito simples, mas social e intelectualmente muito complexo. Você tem que escolher quem você segue, precisa descobrir como ler tudo o que essas pessoas escrevem… No momento eu sigo apenas cerca de 115 pessoas, mas já é difícil pra mim ler tudo.

G1 – Que tipo de profissional será capaz de ajudar a criar essa língua? Quem serão as pessoas que vão trabalhar como “bibliotecários” do futuro?

Outro serviço que eu uso é o Delicious. É uma forma de organizar a memória. Porque o Twitter é bom para o fluxo de notícias, para estar sempre antenado no que está acontecendo, mas o delicious é bom para organizar a memória de longo prazo, e também para descobrir pessoas que estão interessadas nos mesmos assuntos que você.

Também participo do Twine, que é um serviço que utiliza tecnologias da web semântica atual. Eles organizam os assuntos por ontologia, e quis observar, em primeira mão, como o site funciona. E eles não resolvem todos os problemas, de certa forma é um pouco decepcionante.

G1 – Minha impressão é de que o Twine ainda não conta com um número suficiente de usuários para inserir e organizar uma quantidade relevante de informações.

Lévy – Durante vários meses eu era uma das cem pessoas que mais adicionava informações ao Twine. Encontrei pessoas interessantes por lá. Em todos esses serviços você tem um aspecto social muito importante, então você descobre indivíduos. E também é muito útil estar registrado em um “twine” de informações, para se manter atualizado sobre aquele assunto específico. Já descobri coisas no Twine que acabei depois postando no Twitter.

Também participo do Facebook, porque hoje em dia você não pode mais ficar de fora. E é algo interessante, porque as pessoas ficam postanto fotos e vídeos delas próprias, acaba sendo um ambiente para amigos, é menos profissional. Meu Twitter é um ambiente profissional, discuto informações científicas. Já meu Facebook é mais para diversão. Também tenho o hábito de testar novos serviços de busca, para ver o que eles oferecem de diferente do Google.

Para mim, é muito importante estar ativo em todas essas ferramentas para poder sentir o que está acontecendo na internet, e não ficar apenas na teoria. Gasto pelo menos duas horas por dia nessas ferramentas sociais e em blogs.

2 opiniões sobre “Entrevista com Pierre Lévy. O IEML e a Web Semântica

  1. Olá, tentei achar seu e-mail, já que no twitter está desabilitada a opção de enviar mensagem. Você conhece mais gente trabalhando com ciberativismo no meio norte?

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s