domingo, 28 de janeiro de 2007

Observando o Google


este artigo foi escrito em 2004, antes do vínculo do Google e do Orkut (um produto Google) pela conta Google.


Introdução

Foi assunto no The New York Times. O presidente da Biblioteca Nacional Francesa, Jean-Noel Jeanneney se alarmou em dezembro de 2003, quando soube do projeto da Google Inc, detentora do mecanismo de busca Google: pretende-se digitalizar 15 milhões de livros em inglês e disponibilizá-los como arquivos digitais na Internet. Para Jeanneney, tamanha manobra fortaleceria ainda mais o poder americano de comandar a agenda cultural global. O projeto, denominado Google Print faz parte de uma significativa cadeia de interesses do Google no meio acadêmico: há também o Google Scholar[1] voltado especificamente para a “varredura” de textos acadêmicos. O presidente da França, Jacques Chirac se reuniu, em maio de 2004, com ministros da União Européia para discutir a viabilização de um projeto semelhante para as grandes bibliotecas da França e da Europa.

Este debate se inicia alicerçado num polêmico tema: deter informação (inclusive digital) é deter poder? Quais os limites desta detenção? A quem se dirige? O que é visibilidade e invisibilidade de informação na rede? Uma parte significativa da informação disponível na Internet permanece invisível, mesmo ao mais utilizado motor de busca, o Google, o que revela hiatos entre os formatos da informação disponível e o acesso a esta, pelos mecanismos de busca. O que esta “invisibilidade” narra? O que torna um site invisível a um motor de busca? Como esta acessibilidade/invisibilidade narra a relação de poder/saber presente na rede? Como as regularidades nos resultados de busca descrevem formas de dominação?

O fenômeno Google, inserido no contexto em que a produção, a legitimação e a reprodução da “cultura de massa” ganha proporções gigantescas, na medida em que se torna digital, pode oferecer pistas valiosas de como esta “cultura de massa ameaça não só cretinizar o nosso gosto, mas também brutalizar nossos sentidos, ao mesmo tempo que abre caminho para o totalitarismo’( Rosenberg 1973:22). Ser considerado um bom resultado no Google é, para um site, ter um valor reconhecido. Nesse ponto, citando Dumont, “adotar um valor é introduzir hierarquização”, é preciso discutir: como o Google cria esta hierarquização, e como se vale dela? O que este mecanismo de busca, atualmente o rosto mais conhecido de uma empresa, sediada na Califórnia, grande recrutante de “talentos” de Zurique a Bangalore, como ela mesmo afirma na página do portal em que descreve a “cultura Google[2]”.

Como uma ferramenta de busca gerou uma “cultura”? Que elementos simbólicos o Google incorporou para produzir não apenas capital econômicos, mas uma extensa produção mitológica: há inclusive uma Igreja Googleana das Informações Urgentes[3], um site anedota, que explicita a importância e a rede de significados que este sistema de busca desenvolveu ao longo de sua criação.

Para viabilizar uma problematização destas questões diversas informações foram analisadas: passam por pontos da trajetória do mesmo[4], sua configuração de busca, matérias disponibilizadas acerca do mesmo, os textos de auto-descrição de seu portal, e outros elementos textuais que fazem dele seu objeto: como listas de discussão, comunidades, páginas pessoais. A discussão pretende pensar como as relações presentes entre os links são lidas pelo Google como relações sociais digitalizadas, e como estas espelham mecanismos de determinação, hierarquias, controle e integração social. O Google se autodenomina como uma ferramenta honesta e simples para ordenar a Web. Para quem, e com que finalidades se presta esta organização. Meu desejo é que este texto contribua para a possibilidade desta discussão.


A história do Google

A história do Google principia 1995: na Universidade de Stanford, dois estudantes, Sergey Brin e Larry Page, concebem um sistema chamado BackRub, durante sua pesquisa de doutorado em ciência da computação. Os quartos de ambos serviriam, num primeiro momento, ao embrião do buscador recém-nascido, pelo qual interromperiam seus estudos temporariamente. A tentativa era de responder a um grande hiato dos mecanismos de busca, que, até então se limitavam a varrer a rede localizando as palavras desejadas pelo internauta, sem, no entanto, distinguir a informação “legítima”, ou seja, “de qualidade e autoridade” do restante, usualmente denominado “lixo digital”. Ou seja, antes da “Era Google”, a possibilidade de se encontrar no Yahoo, em sua antiga forma (que sofreu modificações posteriores para tornar-se mais competitivo com o Google), a academia de esportes do seu bairro e a Academia Brasileira de Letras, era praticamente a mesma, se no campo da busca se digitasse somente o termo academia.

Queixava-se, portanto, da falta de um método de validação do conteúdo. Alguns mecanismos[5] foram criados neste sentido, mas as regras que determinavam o ''prestígio'' de um site na Internet não foram dinâmicas o suficiente para acompanhar o crescimento exponencial da rede, nem para capturar a dinâmica própria de legitimação na rede: um site sem importância, num momento, pode passar, rapidamente, a se destacar como “referência” na internet. Tal processo também se desenvolve em sentido contrário, e isso implicava numa mobilidade conceitual para qual os mecanismos não estavam preparados.

Pensando nesta defasagem, Sergey Brin e Larry Page criaram o BackRub: um robot de busca que se utiliza de um sistema, denominado PangeRank[6] que atribui para cada na web uma ‘nota”. Este princípio de classificação das páginas, valida as páginas por uma “hierarquia de links”. Links direcionados por uma “página importante” representam um voto maior, uma melhor classificação. Segundo dados do próprio Google, o sistema PageRank

“confia na natureza excepcionalmente democrática da Web, usando sua vasta estrutura de links como um indicador do valor de uma página individual. Essencialmente, o Google interpreta um link da página A para a página B como um voto da página A para a página B. Mas o Google olha além do volume de votos, ou links, que uma página recebe; analisa também a página que dá o voto. Os votos dados por páginas "importantes" pesam mais e ajudam a tornar outras páginas "importantes."

Esta avaliação de “importância” classifica um site com uma nota, variável de 1 a 10. Assim, os sites oficiais de “grandes” empresas, entidades ou instituições como Nasa, recebem nota dez, e os links que eles atribuírem à outras páginas, na Internet, serão significados pelo Google como valor. É neste universo de páginas, classificado em ordem decrescente de PageRank, que o Google executará a busca digitada pelo usuário. É interessante observar que esta “regra” não vale para todos: o portal da UNICAMP, para citar um exemplo, possui PageRank (da URL) nota 7. O da USP, a versão digital da Folha de São Paulo e o da Globo também recebe a mesma avaliação[7]. O maior provedor de Internet em número de assinantes, o UOL, recebe uma nota 6. O canal de bate-papo do UOL, cujo tráfego inclui milhares de internautas é avaliado em cinco. Em sites de domínios estrangeiros, outros números supreendem: o site do Louvre recebe nota 8, dividindo com o estadunidense Sony, a mega multinacional de entretenimento e eletrônicos e o site oficial do Vaticano a mesma nota.

O Google se descreve como

“um meio fácil, honesto e objetivo de encontrar websites de boa qualidade com informações importantes para a sua pesquisa”. Numa descrição acerca dos motivos pelos quais deve ser utilizado afirma: “Google traz a ordem para a web.”

E ainda
“A intenção do Google é colocar ordem no caos da informação. Isso é o que um serviço de busca deve ser, não um simplesmente um diretório, ou uma lista de resultados que foram vendidos pelo maior lance, mas um método coerente de organizar a Internet de acordo com a sua estrutura. Com o Google os usuários podem pesquisar mais de 1 bilhão de URLs. O índice do Google, o qual contém mais de 1 bilhão de URLs, é o primeiro do seu tipo e representa uma coleção detalhada das páginas mais úteis da Internet.”

Garantir visibilidade no Google é, portanto, garantir legitimidade de qualidade, utilidade, importância. É garantir ainda que estas foram atribuídas de forma honesta, democrática, matemática, e, portanto “científica”.

Surge então um mercado: sites, revistas especializadas, livros textualizam “dicas” de como “crescer” em PageRank. Se “to google” um verbo criado na cultura estadunidense significa pesquisar com eficiência, PageRank, significa acesso: se alto, garantido. Estas “dicas” dividem-se em dois grupos: as que viabilizam notas maiores de PageRank sem levar em conta os links de outras páginas importantes, e as que consideram a segunda hipótese. As sugestões mais comuns no primeiro grupo são: acrescente palavras chaves no título do site[8], e também na URL do site; evite elementos ocultos, como texto branco em fundo branco, descreva imagens com as palavras chaves, utilizando as tags de descrição de imagem ( e ). Outras informações importantes: o Google preferência as páginas mais antigas, as que tem maior número de atualizações, com muitas páginas e pouca informação (texto) por página. No segundo grupo de sugestões alude-se, em geral, que se busque ser linkado pelos sites que possuem maior PageRank, porque seu “voto” vale mais. É importante estar listado em sites de busca, porque se um site é achado por um outro mecanismo de busca ele também recebe mais pontos. Note-se as informações implícitas: os outros robots de busca têm sua importância (e sobrevivência) garantida, e boas relações com os sites do podium PageRank são necessárias. Hierarquizar, organizar, validar, legitimar: a prática Google circunscreve um paradoxo: um site aparece no Google porque tem importância, ou tem importância porque aparece no Google?

O próprio nome Google, cuja pronúncia em português é "gugol", um trocadilho com o termo Googol, criado pelo matemático Milton Sirotta para representar o número 1 seguido de 100 zeros (ou 10 elevado a 100) descreve a idéia sugerida pelo buscador, visando

“refletir a missão da empresa: a de organizar a enorme quantidade de informações disponíveis na Internet.”

A Google Inc., a empresa administradora do Google, oferece serviços na rede: os anúncios Google, denominados de Google AdWords, oferece a “oportunidade” de receber “clientes direcionados” por links no mecanismo de busca. A empresa paga por link clicado, que resultaria numa visita efetiva ao seu site institucional ou de vendas. Um outro produto, o Google AdSense, oferece anúncios contextuais relacionados ao conteúdo dos sites, que serão remunerados por exibi-los. É interessante pensar o panorama de lançamento destes produtos: ao abrir seu capita em agosto de 2004, na Nasdaq, a companhia vendeu 19,6 milhões de ações por US$ 85 cada. Desde então, cada papel chegou a ser comprado por US$ 185[9]. A “cultura” Google descreve seu milagre, a empresa que nascera nos quartos universitários de Sergey Brin e Larry Page torna-se a milionária empresa, garimpadora de talentos e sinônimo de um excelente lugar para se trabalhar[10]. Além disto, visando ampliar seu poder de penetração na internet, o Google adquiriu o mais conhecido dos editores de blogs, o Blogger, que já ultrapassou a casa dos dois milhões de usuários, e a mais famosa lista de discussões, a UseNet, com mais outros tantos milhões de internautas cadastrados. Criou um indexador de imagens Picasa e um provedor de e-mail gratuito: o Gmail[11]. Está por trás do Orkut, a febre que indexa pessoas pelo mundo afora. O que aconteceria se para utilizar-se de toda esta ampla quantidade de informação algum valor começasse a ser cobrado? Ou ainda, que o acesso fosse restringido a pessoas escolhidas por algum “google motivo” ou um outro algoritmo, um “PersonRank”?








[1] http://scholar.google.com
[2] Disponível e, http://translate.google.com/translate?hl=pt-BR&sl=en&u=http://www.google.com/corporate/software_principles.html&prev=/search%3Fq%3Dgoogle%2BCorporate%2BInformation%26hl%3Dpt-BR%26lr%3D%26sa%3DG
[3] Cf. http://www.pintura.com.br/deusgoogle/ Deus, neste site, é o Google.
[4] Brin, Sergey. The Anatomy of a Large-Scale Hypertextual Web Search Engine. Disponível on-line em http://www-db.stanford.edu/~backrub/google.html
[5] Entre os mecanismos que tentaram criar índices de qualidade dos sites, por meio de classificações, como estrelas, e outras formas de pontuação, estiveram, por exemplo, o Magellan, o Excite, uma nova forma do Yahoo!, e o Cadê.
[6] O algoritmo PageRank é uma extensão da idéia de contagem de links, com algumas diferenças: os links não são considerados todos iguais; é feita uma normalização do número de links em cada página. O PageRank é definido da seguinte forma: “Assumimos que existam páginas T1, T2, ..., Tn que contenham links apontando para a página A (ou seja, as páginas T fazem citações à página A). O parâmetro d é um fator redutor que pode assumir valores entre 0 e 1; nós usamos normalmente d como 0.85 (...) C(A) representa o número de links que existem na página A. O PageRank da página A é dado pela expressão: PR(A) = (1-d) + d [PR(T1)/C(T1) + PR(T2)/C(T2) + ... + PR(Tn)/C(Tn)] Observe que os PageRanks formam uma distribuição de probabilidades através de páginas web; assim a soma dos PageRanks de todas as páginas web é igual a um.” Cf. Brin, Sergey. The Anatomy of a Large-Scale Hypertextual Web Search Engine. Disponível on-line em http://www-db.stanford.edu/~backrub/google.html (A tradução do texto é minha.)
[7] Para calcular o PageRank basta baixar uma ferramenta, fornecida pelo próprio Google, ou consultar a mesma disponibilizada em algum site. Utilizamos a oferecida em http://www.supertrafego.com/google_pagerank.asp
[8] Entre as tags . A linguagem html, predominante na construção de sites, utiliza-se de tags para marcar o texto. Cada conjunto de tags determina o início e o fim de uma marcação.
[9] Fonte: Globalink. Disponível em http://www.wnet.com.br/sec_noticias.php?s=7&id=11747
[10] Veja em http://www.google.com/jobs/reasons.html, “dez motivos para você desejar trabalhar na Google” e em http://www.google.com/jobs/benefits.html uma lista dos benefícios oferecidos. A companhia privada anunciou, em junho de 1999, ter assegurado $25 milhões em consolidação de dívida flutuante de patrimônio líquido. Seus sócio incluem Kleiner Perkins Caufield & Byers e Sequoia Capital.
[11] Em gmail.google.com está o webmail com 1 Gb de armazenamento, obrigando aos concorrentes aumentarem a banda oferecida de graça para as mensagens dos usuários.

Um comentário:

Anônimo disse...

Prezada Adriana.
Recebi de um colega de POA, Gilson Lima, o link para teu blog e gostaria de cumprimentá-la. Ao mesmo tempo lhe informo que passas a constar na bibliografia da disciplina de computador e sociedade que admnistro na minha universidade, no interior do Rio Grande do Sul. UNISC.
Um abraço.
De um novo leitor.
Cesar Goes
hbgoes@uol.com.br