A era do raciocínio artificial - a inteligência humana e a artificial juntas

As novas tecnologias estão mudando a estrutura da web; organizam-na em torno de padrões, para transformá-la em um grande banco de dados interligado com o mundo real, e dotam-na de inteligência, para que “compreenda” o significado da informação e interaja com os usuários, como mostra esta reportagem.

Ninguém sabe muito bem do que se trata, mas, como disse recentemente Scott Prevost, diretor de desenvolvimento do site de busca Bing, da Microsoft, “seja o que for, a web 3.0 já está aqui”. Ainda nem bem começamos a entender o que é a web 2.0, e “gurus”, tecnólogos, cientistas e empreendedores debatem a respeito dos aplicativos e tecnologias que facilitarão e acelerarão o desenvolvimento da terceira geração da web: uma web aberta, onipresente, inteligente, ligada ao mundo físico, capaz de compreender a linguagem natural, reconhecer o contexto e raciocinar sobre as necessidades do usuário, para oferecer uma experiência personalizada, mais produtiva e intuitiva.

A web semântica –como os especialistas definem essa rede dinâmica e pensante. “Imagine que o texto, os gráficos e as fotos que vemos no navegador não correspondem a uma página estática, mas provêm de diferentes lugares da rede e foram combinados de modo personalizado para o usuário. Essa é sua natureza: reutilização e mashup, ou mistura.

As ideias, os conceitos ou os dados podem ser reunidos e reorganizados de infinitas maneiras, gerando novo significado, segundo as necessidades de cada pessoa”, sugere Jeffrey Pollock, autor de Web semântica para leigos (ed. Alta Books), ex-engenheiro de software do Departamento de Defesa dos Estados Unidos e atual diretor da divisão de middleware da Oracle. Yihong Ding, pesquisador da web semântica e colaborador no site de notícias sobre tecnologia ZDNet, concorda com Pollock. “Estamos em um momento de transição, passando de uma web definida pelo editor a outra determinada pelo usuário.” Ele explica as etapas didaticamente:

Em sua versão 1.0 (1990-1999), os espaços da web eram páginas que representavam a visão da empresa ou da organização proprietária do domínio.
Na 2.0 (2000-2009), os espaços passaram a ser as contas pessoais dos usuários, embora alojadas em sites pensados e desenhados por um editor.
Na 3.0 (2010-2020, segundo previsões), os espaços da web serão uma coleção de recursos de diferentes sites que se organizarão em tempo real, de acordo com a visão do usuário.

Sonho pós-moderno

Embora a web semântica ainda esteja em uma fase preliminar, a ideia não é nova. Na verdade, é tema de discussão desde 1999, quando Timothy Berners-Lee, diretor do World Wide Web Consortium (W3C), organização que promove os standards da web, alcunhou o termo.

Criador da linguagem de hipertexto HTML, do protocolo HTTP e do localizador uniforme de recursos (URL), Berners-Lee afirmou na época: “Sonho com uma web na qual os computadores serão capazes de analisar o conteúdo e entender as transações entre as pessoas e as máquinas. Chama-se ‘web semântica’, mas ainda tem de ser desenvolvida. Quando se tornar realidade, nossa vida será manejada por computadores. O agente inteligente, que a humanidade buscou tanto, por fim se materializará”.

Ele estimou que seu sonho se concretizaria em 2020, mais ou menos a data em que a versão 5 da linguagem de programação da web, o HTML, estará completa (hoje apenas algumas de suas especificações podem ser usadas). Com a evolução das tecnologias 2.0, as funcionalidades sintáticas simplificadas do HTML 5 para codificar conteúdo multimídia estão cumprindo as promessas da web.

Essa linguagem estabelece paradigmas para a programação e fixa regras para o uso de, por exemplo, etiquetas para vídeo, áudio e canvas (recurso para gerar gráficos dinâmicos na mesma página, sem necessidade de recorrer a aplicativos complementares). Desse modo, não só os problemas de interoperabilidade entre sites e aplicativos se resolvem, como também o desenho e o manejo de conteúdo 3D são facilitados e as portas do maravilhoso mundo da realidade virtual se abrem. Redes como SecondLife e uso de avatares ficam comuns. Pollock explica: “Com as novas tecnologias de NLP (processamento da linguagem natural na sigla em inglês), a noção de busca na internet mudará radicalmente: em vez de fazer consultas por palavras-chave, poderão ser pesquisados conceitos ou ideias, porque as máquinas entenderão o significado da palavra escrita”.

Atualmente, os sistemas de NLP são usados em atividades que demandam processamento de grandes quantidades de dados, como detecção de fraudes, prevenção de lavagem de dinheiro e terrorismo, análise de inteligência de negócios, marketing e publicidade, pesquisa científica e medicina. Mediante a aplicação de complexos algoritmos ao texto desordenado, os motores de NLP são capazes de gerar dados estruturados ou modelos de dados.

Os especialistas garantem que esses sistemas são a única tecnologia viável para automatizar a extração de informação valiosa do atual caos da web. Segundo a organização worldwidewebsize.com, a anarquia é grande: 12,830 bilhões de sites registrados em janeiro de 2011. A Peer39 e a Ad Pepper, duas start-ups que fazem uso da tecnologia semântica para desenhar soluções de marketing e publicidade, estão colhendo os benefícios do NLP.

Ambas oferecem serviços de análise de contexto para publicação de anúncios online personalizados. A Peer39, por exemplo, empregou tecnologias de NLP e aprendizagem computacional para desenvolver uma série de algoritmos que escaneiam a web e analisam o conteúdo das páginas em busca do contexto adequado e exato para cada anúncio.

Por sua vez, a Ad Pepper contratou uma equipe de 40 linguistas e lexicógrafos para criar a iSense, rede publicitária semântica. Munidos de dicionários, os profissionais se dedicaram, durante quatro anos, a atribuir palavras a uma série de categorias de conhecimento, com o objetivo de criar um enquadramento conceitual que permitisse ao sistema analisar e entender os termos e temas contidos em uma página da web.

Sem dúvida, o potencial da web semântica é enorme. Pode mudar todos os aspectos da vida humana, o modo de operar empresas, a pesquisa e o desenvolvimento, o acesso a produtos e serviços, a informação e a noção de privacidade. No entanto, ainda há obstáculos significativos a vencer.

Jogo aberto

No centro do ecossistema 3.0 unem-se os dois extremos da corrente tecnológica: de um lado, o front-end, ou os aplicativos que interagem com o usuário; do outro, o back-end, ou os sistemas de administração e processamento de dados que gerenciam os aplicativos. O navegador, por exemplo, é o aplicativo front-end da web por excelência. Embora hoje esse tipo de programa ofereça inumeráveis extensões ou componentes (plug-ins) que melhoram a navegação, o sistema não tem, ainda, inteligência para entender ou organizar a informação que o usuário maneja. Quando os aplicativos e o conteúdo da web se ordenarem em torno de standards semânticos, será dado um grande passo para a rede inteligente.

A Apple foi pioneira em adotar paradigmas e funcionalidades semânticas providos pelo HTML 5 para seu navegador Safari. Também o fizeram o Google para o Chrome e a Mozilla para o Firefox e o Opera. Além disso, em 2009, o Google lançou o Google Squared, ferramenta de categorização semântica de dados que, em segundos, analisa a informação da web, seleciona os resultados da busca e os apresenta em uma folha de cálculo.

Corporações como Oracle, IBM, Microsoft, Salesforce e SAP estão integrando a tecnologia semântica a seus pacotes de software corporativos. A Apple também avança para dominar o espaço móvel e, em abril de 2010, comprou a Siri, assistente pessoal móvel inteligente que usa tecnologia semântica, de reconhecimento de voz e inteligência artificial. Trata-se de um app (como os aplicativos já são chamados corriqueiramente) gratuito conectado a um ecossistema rico em serviços da web. A comida do restaurante não caiu bem? Então, é só pedir para a Siri levar você para casa. O sistema chamará um táxi e dará a ele as coordenadas para chegar lá.

Dezenas de start-ups tentam posicionar-se com produtos e serviços originais para a nova web. Uma lista rápida de exemplos: o inovador buscador de respostas Wolfram Alpha; a rede social de conhecimento Twine; a ferramenta de busca que aprende com o usuário MeaningTool, da Propego; o buscador de pessoas ZoomInfo; e a base de metadados Freebase, da Metaweb, construída por uma comunidade de usuários online e adquirida pelo Google em 2010.

No momento da compra, a Freebase tinha catalogados mais de 12 milhões de “coisas” relacionadas semanticamente entre si. Pouco antes de ficar com essa base de dados, o Google adquiriu a AdMob, empresa de publicidade móvel, e a Aardvark, serviço social de buscas, que permite aos usuários fazer uma pergunta qualquer (por exemplo: “Quero visitar alguns locais não turísticos em Berlim. Alguma sugestão?”) e, em tempo real, obter resposta dos membros conectados à rede.

A Foursquare, criada em 2009, é uma rede social para dispositivos sem fio baseada na localização geográfica. Mediante aplicativos móveis que fazem uso de sistemas de GPS, os usuários se “registram” na rede toda vez que entram em um estabelecimento, seja loja, restaurante, hotel ou museu. Se enviarem informação e comentários sobre o local no qual estão, podem ganhar pontos e prêmios. A rede também funciona como um serviço publicitário que mostra anúncios de acordo com o contexto, como promoções especiais de determinados produtos. A Foursquare está integrada ao Twitter e ao Facebook, de modo que todos os contatos do usuário podem agregar seus comentários.

Outro aplicativo de redes sociais é o GetGlue, barra de ferramentas para navegadores desenvolvida pela rede de entretenimento AdaptiveBlue. Ele dá aos usuários a possibilidade de saber se o conteúdo pelo qual estão navegando já foi consultado por seus amigos e se eles emitiram opiniões a respeito.

O GetGlue também faz recomendações sobre tópicos que poderiam ser de interesse para o internauta, de acordo com o perfil de busca. Por sua vez, o MeaningTool, da Propego, é um aplicativo inteligente que permite ao usuário criar suas árvores semânticas e “ensinar” ao sistema novos conceitos para filtrar e categorizar textos, sites e pessoas.

A Comunidade KDE (K Desktop Environment), grupo internacional de especialistas em tecnologia, criou uma plataforma gráfica aberta e uma série de aplicativos com capacidades semânticas que funcionam em sistemas operacionais tão diversos como Linux, Windows, Mac OS X e Solaris. O grupo visa transformar o “ambiente de trabalho” do computador em um app semântico em si mesmo. Entre outras funcionalidades, o KDE permite que o usuário indexe todos os arquivos de seu computador na web para consultá-los de maneira mais inteligente –por meio de ferramentas semânticas online– e que outros usuários também etiquetem esses arquivos e criem uma ontologia do conteúdo de seu computador.

No jargão do informatiquês “ontologia” refere-se ao vocabulário de metadados, que possibilita ao usuário organizar a informação com etiquetas, de modo a eliminar a ambiguidade da linguagem para que os agentes inteligentes do software –por exemplo, um buscador semântico– interpretem os dados com precisão.

A principal barreira para que a web 3.0 se desenvolva tem a ver, justamente, com a organização dos dados. Quanto maior a densidade de informação, quanto mais dados interligados e etiquetados semanticamente e quanto mais metadados relacionados com os modelos conceptuais, mais significados poderão ser extraídos do conteúdo.

Blogs, wikis, sites, anúncios publicitários, resultados de buscas, vídeos, serviços de notícias, de reservas de viagens, previsão do tempo, dados demográficos, mensagens do Twitter, e-mails, atualizações do Facebook, fotos do Flickr, perfis de usuários –todo o conteúdo da web deve estar codificado com os mesmos padrões e disposto em formatos legíveis pelos computadores.

Igual dade para todos

As primeiras inovações que hoje podem ser definidas como os standards da web 3.0 surgiram do Darpa Agent Markup Language (DAML), programa resultante do esforço secreto do Departamento de Defesa dos Estados Unidos para construir sua versão da web, em 2000.

O projeto, finalmente concluído, deu à luz os standards RDF (Resource Description Framework), a linguagem semântica usada para descrever dados, metadados e outras linguagens; OWL (Web Ontology Language), extensão do modelo RDF desenhada para representar conhecimentos ricos e complexos sobre informações, grupos de informações e relações entre elas; e SPARQL (Protocol and RDF Query Language), a linguagem de consulta para RDF mais poderosa que SQL.

Um dos primeiros passos para os standards semânticos foi dado por um player inesperado: a Microsoft. Em janeiro de 2010, durante uma conferência sobre a web 3.0 na Califórnia, Scott Prevost confirmou os planos da companhia de se concentrar no desenvolvimento de capacidades para a nova geração da web.

Prevost entrou na empresa em 2008, quando a Microsoft comprou, por US$ 100 milhões, a empresa-sinônimo do software de NLP que o tecnólogo fundou em 2006: Powerset. Com isso, a organização criava um motor de busca semântico só para Wikipedia, tecnologia que, em última instância, a Microsoft integrou a seu próprio buscador, o Bing.

Outro player que estabeleceu um marco com seu desenvolvimento de vanguarda foi o Wolfram Research, do físico britânico Stephen Wolfram, criador do Wolfram Alpha, inovador buscador de respostas semântico, lançado em 2009. O sistema trabalha sobre a base de algoritmos matemáticos e estatísticos para responder com precisão às perguntas do usuário.

Suas respostas vêm de um banco de dados próprio, construído por pesquisadores e equipes de especialistas, cuja tarefa parece infinita: sua meta é sistematizar todo o conhecimento humano. O Twine, a “rede social de conhecimento”, segundo seu criador, Nova Spivack, era o produto top da Radar Networks e hoje faz parte do site de buscas semânticas Evri, que adquiriu a empresa em 2010.

A Radar Networks foi fundada em 2003 por Spivack. Empreendedor em série e promotor da web 3.0, ele relata que seu avô, Peter Drucker, o ajudou a imaginar a web do futuro, um espaço onde tudo se relaciona com tudo. Diferentemente de outras redes sociais, o Twine não só interliga pessoas, mas também qualquer elemento que seja interessante para o usuário: locais, companhias, produtos, sites, vídeos, fotos e mensagens.

Além de seu interesse pelo Twine, o Evri queria a Radar Networks por seu produto T2, um projeto tão ambicioso quanto o de Stephen Wolfram: a construção de um índice semântico da web.

Em outro plano está o Calais, da Thomson Reuters. O buscador facilita a consulta de notícias, por ideias ou conceitos definidos pelo próprio usuário, e, depois, as relaciona com outros recursos semânticos disponíveis na web para categorizá-las de acordo com ontologias de conceitos, pessoas, locais, eventos ou qualquer outro dado. O serviço do Calais é interessante especialmente para as corporações, pois muitas delas o usam para detectar tendências e comportamentos do mercado.

Um concorrente do Calais é o Extractiv, que serve para escanear a web em busca de dados “sentimentais”, isto é, informação a respeito do que as pessoas sentem sobre produtos e serviços.

O ZoomInfo, com mais de 45 milhões de pessoas e 5 milhões de companhias registradas em seu banco de dados, se posicionou como um buscador de indivíduos e informações de negócios. Seu motor semântico está constantemente bisbilhotando a web para detectar dados sobre pessoas, companhias, produtos, serviços e setores de atividade, com o propósito de organizá-los em perfis que possam ser consultados por todos. rede “socialista ”

Segundo a organização internacional Internet World Stats, hoje há quase 2 bilhões de indivíduos conectados à internet e um em cada cinco é usuário ativo da web. Daqui a pouco, esses usuários deixarão de ser só um nome para se converter em entidades com características específicas –ano de nascimento, estado civil, estudos, profissão, domicílio, hobbies, amigos e interesses– e conexões precisas com os locais onde trabalham, estudam e vivem, os sites que acessam, os lugares exatos nos quais se encontram, as pessoas com quem se relacionam, as informações pelas quais estão interessados ou as tarefas que estão realizando em tempo real.

Em 2010, várias empresas norte-americanas de rastreio de dados online uniram-se para criar o Open Data Partnership, serviço que permite aos consumidores consultar a informação que as companhias possuem sobre eles, editar seus perfis e até selecionar a opção de não ser rastreado.

A BlueKai, a Lotame Solutions e a eXelate são algumas das que abriram seus bancos de dados ao público. Só a BlueKai lida com informações de mais de 200 milhões de usuários da internet.

Também em 2010, um estudo do Pew Research Center e da Elon University sobre a web 3.0, realizado entre especialistas em tecnologia de diversos países e público em geral, revelou que a privacidade é um tema importante, mas não preocupante. Na opinião de 42% dos especialistas e 41% do total dos usuários pesquisados, o uso de sistemas de identificação como o scanner da retina, das impressões digitais ou do DNA se popularizará em grande quantidade de serviços online até 2020. Além disso, 54% dos especialistas e 55% do total dos participantes acham que a maioria das atividades online continuará sendo feita de maneira anônima.

Ben Ramsey, engenheiro de software da empresa de marketing interativo Schematic e colaborador de várias revistas especializadas, sustenta que, à medida que as pessoas se acostumarem a armazenar seus dados nas “nuvens” e a compartilhá-los, os conceitos e leis sobre propriedade intelectual e privacidade mudarão drasticamente. “O software que se instala no computador será cada vez menos importante quando o ambiente de trabalho se transformar em um cliente com acesso aos serviços livres da web”, diz. Imagine as possibilidades.

No livro Web semântica para leigos, Pollock as ilustra com um exemplo simples. A companhia X cria um serviço a partir de sua vantagem competitiva específica. Outra empresa vê a oportunidade de explorar esse serviço enriquecendo- o mediante uma nova oferta, que parte de sua vantagem competitiva. Uma terceira firma decide fazer o mesmo. E, depois, também algum usuário.

Ao compartilhar paradigmas, todos os produtos e serviços online se converterão em facilitadores de novos serviços, e consumidores e empresas se beneficiarão dessas melhorias contínuas. Quem sabe, no final da década, a propriedade digital passe a ser um bem público ou coletivo. Talvez a web esteja evoluindo de uma rede para um Estado social.

O que a web 3.0 pode fazer?

Infinitas tecnologias abertas: código aberto para desenvolvimento de plataformas e aplicativos; técnicas abertas para compartilhar dados (dados como serviço); identidade pessoal “portátil” (de um site para outro e de um dispositivo para outro).
Infinita inteligência computacional: padrões da web semântica; sistemas de processamento da linguagem natural (NLP); inteligência artificial; agentes de software (aplicativos com capacidade de raciocínio que trabalham para o usuário).
Infinita conectividade onipresente: conexão de banda larga à internet em qualquer momento e em qualquer lugar; sistemas de localização geográfica; desenvolvimento de aplicativos e dispositivos móveis.
Infinita computação em rede: interoperabilidade dos serviços de site; computação em nuvem (SaaS ou software como serviço).
Infinitas tecnologias de realidade virtual: portais e navegadores 3D; avatares.

Fontes: Revista HSM Management