Reforma A

Abaular
Dar forma curva, arqueada, a uma superfície, a fim de proporcionar melhor escoamento da água ou acabamento estético.

Abertura
Termo genérico que resumo todo e qualquer rasgo na construção, seja para dar lugar a portas e janelas, seja para criar frestas ou vãos.

Abertura de vala
Ato de fazer valas.

Abóbada
Todo o teto côncavo pode-se chamar abóbada. Cobertura encurvada. Do ponto de vista geométrico, a abóbada tem origem num arco que se desloca e gira sobre o próprio eixo, cobrindo toda a superfície do teto. As abóbadas variam de acordo com a forma do arco de origem. Abóbada ogival, também chamada gótica, cujo arco tem forma de ogiva, é uma marca da arquitetura árabe. Abóbada aviajada tem origem num arco cujas extremidades estão em desníveis. Há ainda a abóbada de lunetas. De menor altura, esse tipo está presente nas casas de estilo colonial americano e facilita a iluminação interior.

Abrasão
Desgaste causado nas superfícies pelo movimento de pessoas ou objetos.

Abrigo
Lugar onde o homem pode-se proteger das intempéries. No uso corrente, indica locais como garagem, também chamada abrigo de carro.

Acabamento
Remate final da estrutura e dos ambientes da casa, feito com os diversos revestimentos de pisos, paredes e telhados.

Acetinado
Todo o material tratado para ter textura semelhante ao cetim.

Acesso
Rampa, escada, corredor ou qualquer meio de entrar e sair de um ambiente, uma casa ou um terreno.

Aço-carbono
Liga de aço e carbono que resulta num material leve e de grande resistência.

Adam
Estilo iniciado com o arquiteto inglês Robert Adam, que teve grande influência nas construções do colonial americano dos séculos XVIII e XIX. As casas desse estilo são altas, com detalhes leves e pórticos elaborados a partir de elementos da arquitetura clássica. A sua maior marca é a luneta, espécie de abóbada feita de vidro sobre a porta principal.

Adega
Também conhecida como cave. A palavra, provavelmente, tem origem no termo francês cave: lugar especial da casa, em geral no subsolo, onde se guardam vinhos e azeites. A adega precisa de ter condições climáticas controladas, para melhor conservar os vinhos.

Adobo (ou Adobe)
Tijolo feito com uma mistura de barro cru, areia em pequena quantidade, estrume e fibra vegetal. Deve ser revestido com massa de cal e areia. O termo adobe vem do árabe attobi e designa, também, seixos rolados dos leitos de rios.

Afagar
Nivelar, aplainar, desbastar saliências ou alisar madeiras.

Afastamento (ou Recuo)
Refere-se às distâncias entre as faces da construção e os limites do terreno.

Aglomerado (ou Contraplacado)
Placa prensada, composta de serragem compactada com cola e fechada com duas lâminas de madeira.

Agregado
É o material mineral (areia, brita, etc.) ou industrial que entra na preparação do betão.

Água do telhado
Cada uma das superfícies inclinadas da cobertura, que principia no espigão horizontal (cumeeira) e segue até à beirada.

Água-furtada
Vão entre as tesouras do telhado. Ângulo do telhado por onde correm as água pluviais. Sótão com janelas que se abrem sobre as águas do telhado.

Água-mestra
Nos telhados retangulares de quatro águas, é o nome que se dá às duas águas de forma trapezoidal. As duas águas triangulares chamam-se tacaniças.

Alambrado
A cerca feita com fios de arame que delimita um terreno.

Alçapão
Portinhola no piso ou no forro que dá acesso a caves ou sótãos.

Alçar
Levantar a parede, construir.

Aldrava (ou Aldraba)
Argola que fica do lado de fora da porta e serve de instrumento para bater à porta.

Alicerce
Ver Fundação.

Almofada
Na marcenaria e carpintaria, peça com saliência sobreposta à superfície.

Alpendre
Cobertura suspensa por si só ou apoiada em colunas sobre portas ou vãos. Geralmente, fica localizada na entrada da casa. Aos alpendres maiores dá-se o nome de varanda.

Alto-relevo
Saliência criada e definida numa superfície plana.

Alvará de construção
Documento emitido pela autoridade municipal onde a construção está localizada, que licencia a execução da obra.

Alvenaria
Conjunto de pedras, de tijolos ou de blocos – com argamassa ou não – que forma paredes, muros e alicerces. Quando esse conjunto sustenta a casa, ele chama-se alvenaria estrutural. O próprio trabalho do pedreiro.

Amianto
Tem origem num mineral chamado asbesto e é composto por filamentos delicados, flexíveis e incombustíveis. É usado na construção de refractários e na composição do fibrocimento.

Andaime
Plataforma usada para alcançar pavimentos superiores das construções.

Anodização
Tratamento químico no alumínio que lhe confere aparência fosca e cores variadas.

Ante-projeto
Primeiras linhas traçadas pelo arquiteto em busca de uma ideia ou concepção para desenvolver um projeto.

Apicoado
Superfície submetida a desbastamento do qual resulta uma textura rugosa, anti-derrapante. Normalmente feito de pedras.

Aplique
Ornamento. Enfeite fixado em paredes ou muros.

Aprumar
Acertar a verticalidade de paredes e colunas por meio do prumo.

Aquecimento central
Sistema provido de resistências eléctricas ou de serpentinas (se o aquecimento for feito a gás) que centraliza o aquecimento da água de todas as torneiras de uma casa.

Arcada
Sucessão de arcos.

Arco
Semi-circunferência que cobre um vão. Nome dado à construção que dá origem às abóbadas.

Arenito
Rocha composta de pequenos grãos de quartzo, calcário ou feldspato, usada em pisos externos. Nos pisos internos, o arenito normalmente recebe polimento e rejunte de granilite.

Argamassa
Mistura de materiais inertes (areia) com materiais aglomerantes (cimento e/ou cal) e água, usada para unir ou revestir pedras, tijolos ou blocos, que forma conjuntos de alvenaria. Ex.: argamassa de cal (cal+areia+água). A argamassa magra ou mole é a mistura com menor quantidade de aglomerante (cal e/ou cimento), responsável pela aglutinação. Já a argamassa gorda tem o aglomerante em abundância.

Armadura estrutural
Conjunto de ferros que ficam dentro do betão e dão rigidez à obra.

Arquiteto
Profissional que idealiza e projeta uma construção. Possui a arte da composição, o conhecimento dos materiais e suas técnicas e a experiência na execução de obras.

Arquitetura
Arte de compor e construir edifícios para qualquer finalidade, tendo em vista o conforto humano, a realidade social e o sentido plástico da época em que se vive. Uma das artes mais antigas. Escritos medievais são ilustrados com Deus segurando compasso e esquadro, uma alusão ao arquiteto do universo.

Arquitrave
Viga de sustentação que, nas suas extremidades, se apoia em colunas.

Arrimar
Apoiar, encostar, escorar.

Art Déco
Movimento que atinge o seu apogeu entre os anos 20 e 40. Surge em oposição aos excessos do Art Nouveau e marca a arquitetura com linhas geométricas e tons pastel. O movimento concilia a produção industrial e as artes, influenciando os primeiros trabalhos do arquiteto franco-suíço Le Corbusier. Ele tornou ainda mais despojadas as formas desse estilo, criando as bases da arquitetura funcional ou moderna. Os projetos enfatizam vãos e grandes espaços envidraçados. As colunas, antes ornamentadas, agora assumem função estrutural e passam a ser denominadas pilotis.

Art Nouveau
A Arte Nova refere-se ao estilo arquitetónico e de arte decorativa que marcou o final do século XIX e o começo do XX. Muitos dos seus elementos retomam o Rococó e o Gótico. Assim, os edifícios mostram ornatos como ninfas com flores nos cabelos. Na Europa, misturou-se a elementos regionais, ganhando diversas versões. A primeira construção art nouveau foi projetada pelo arquiteto belga Victor Horta, em 1892, em Bruxelas. Mais tarde, o metro de Paris (França), recebeu portões projetados por Hector Guimard, que traziam formas sinuosas. Antonio Gaudi, um dos mais brilhantes arquitetos espanhóis, foi buscar inspiração às tradições medievais do seu país para erguer obras dentro do novo estilo. Em Barcelona, projetou a Sagrada Família, catedral que começou a ser construída em 1883, com torres góticas e adornos barrocos. O estilo art nouveau começou a perder força pouco antes da Primeira Guerra Mundial (1914-18).

Assentar
Colocar e ajustar tijolos, blocos, esquadrias, pisos, pastilhas e outros acabamentos.

Aterro
Colocação de terra ou entulho para nivelar uma superfície irregular.

Átrio
Pátio de entrada das casas romanas, cercado por telhados pelos quatro lados, porém descoberto. Hoje o termo identifica um pátio de entrada de uma habitação.

AutoCAD
Software que facilita a confecção de plantas e croquis, oferecendo ferramentas essenciais para realizar projetos em computador. Fabricado pela Autodesk.

Azulejo
Ladrilho. Placa de cerâmica polida e vidrada de diversas cores. A origem do azulejo remonta aos povos babilónicos. Com os árabes, os azulejos ganharam maior difusão, marcando fortemente a arquitetura moura na Península Ibérica. Originalmente, os azulejos apresentavam relevos, característica que sobrevive até hoje.

Bookmark and Share

Antivirus Gratuito

Atualmente, 80% dos adultos brasileiros já foram vítimas de crimes na internet. Já são 220 mil vírus circulando no país! E, a cada 39 segundos, um hacker ataca um computador. Resumindo: qualquer um pode fazer parte dessa estatística, mesmo sem saber.

Baixe a vacina, proteja seu computador e compartilhe com os amigos.

http://brasilsemvirus.techtudo.com.br/3l0

 

 

Bookmark and Share

Anonymous disponibiliza catálogo de filmes e músicas da Sony

O grupo liberou em uma página simples na web links para download da discografia completa de vários artistas que possuem contrato com a Sony, incluindo Alicia Keys, Bruce Springsteen, Carrie Underwood, Franz Ferdinand e Jennifer Lopez. Também estão disponíveis todos os álbuns ligados à série de TV Glee, e trilhas sonoras de filmes produzidos pela Sony.

Na página, também é possível encontrar links para alguns dos filmes de maior sucesso produzidos pela Sony, em ordem de ano de lançamento, a partir de 2000. A maioria dos links remete a arquivos Torrent, mas é possível encontrar opções para download direto.

A iniciativa do Anonymous é mais uma resposta ao fechamento do Megaupload, um dos maiores sites de compartilhamento online do mundo, que foi desativado pelo FBI na última quinta-feira (19/01). A ação aconteceu logo depois de vários protestos contra os projetos de lei SOPA e PIPA, que estavam em discussão no Congresso dos Estados Unidos. Após a manifestação negativa dos internautas do mundo todo, os projetos foram arquivados por tempo indeterminado.

Bookmark and Share

Estressado no trabalho?

Estressado no trabalho? Saiba respeitar os seus limites!

Nos momentos difíceis do ambiente profissional, é preciso ter calma: respire fundo e veja como controlar melhor suas emoções em meio à frustração em apenas seis passos

Estress no trabalho
Estress no trabalho

Há dias difíceis, em que tudo parece seguir para o lugar errado, períodos em que a maré teima em remar contra você. Podem ser demandas atrás de demandas com prazos exíguos, em que você terá de trabalhar o triplo para conseguir entregar as tarefas. Ou é um daqueles dias em que seu chefe acordou com o humor estragado – ou, talvez ainda pior, de bom humor e elétrico, e perscruta cada e-mail em busca de algo para lhe repassar, pede para refazer um relatório que estava pronto, tudo ao mesmo tempo e em meio a piadas sem sentido. Então, você sente sua cabeça ferver e tem vontade de sair correndo, largar tudo, pedir demissão. Em momentos assim,é preciso ter calma: respire fundo e veja a seguir como controlar melhor suas emoções em meio à frustração em apenas seis passos.

1. Respire!
Antes de cometer o erro de dizer algo inapropriado com a cabeça quente, e depois se arrepender, feche a boca de vez e respire com calma. Você já deve ter ouvido que é importante contar até 10: é um princípio sábio. Isso vai fazer com que você ganhe tempo para pensar melhor, consiga colocar as coisas em perspectiva e evite um possível mal-estar com seus colegas ou seu chefe.

2. Coloque para fora sua raiva por escrito (mas não mostre a ninguém!)
A liberação da raiva pode ser feita através de procedimentos simples, como a substituição de seus sentimentos por palavras. Então, pegue uma caneta e um papel – pode ser uma caderneta ou mesmo sua agenda física – e escreva seus pensamentos. Guarde-os para você; talvez mais tarde até rasgue, amasse e jogue fora. Sobretudo, jamais envie nada por escrito a alguém quando você for provocado ou o mau humor tomar conta. Escrevendo, você exorciza os seus demônios de forma secreta, e o melhor: pode colocar fora as provas.

3. Desabafe com um colega de confiança
É uma atitude arriscada abrir-se no trabalho, mas a maioria de nós tem pelo menos um aliado entre os colegas de equipe, alguém em quem confiar especialmente a respeito de assuntos ligados ao que você faz na empresa. Pode servir como catarse, por exemplo, para falar sobre uma discussão que você teve com seu supervisor ou algum outro colega. Atente para a possibilidade de “audição” das paredes, e faça isso em um local seguro. Pode ser um café em frente à empresa ou outro local, desde que não sirva de ponto de encontro de seus colegas. Não se esqueça de oferecer a mesma confiança a quem lhe deu a chance para desabafar em uma próxima vez, ao notar que a pessoa também está precisando soltar um pouco as rédeas e abrir-se com alguém.

4. Busque o carinho de algum amigo
Às vezes, o que você realmente precisa é de um abraço amigo, de ouvir aquela voz familiar de quem de fato lhe conhece e entende. Bons amigos ou outras pessoas significativas podem ser a fonte perfeita para apoio em situações difíceis. Escreva um texto rápido por e-mail, se isso for permitido, ou telefone a alguém de quem gosta por alguns minutos. Isso pode ser o suficiente para se sentir um pouco melhor. Mesmo que esta pessoa não possa oferecer a mesma perspectiva que a de um colega de dentro da empresa, a intimidade, o carinho e a compreensão podem pôr você para cima ou apenas lembrá-lo de que ainda há vida além da sua atual situação.

5. Dê um instante de alegria para si mesmo
Ao se sentir oprimido pela raiva ou pela vontade de dizer algumas “verdades” que gostaria, mas não pode, tome alguns minutos de seu tempo para visitar um site favorito (se isso for permitido pela empresa), ou vá dar uma volta e beber um bom café. Esse pequeno período, que pode ser de apenas uns cinco minutos, pode lhe oferecer a fuga mental de que necessita quando está a ponto de explodir em um instante. Distrair-se ou concentrar-se em algo que lhe faz feliz pode aliviar o seu estresse e ajudá-lo a retornar ao trabalho em uma sintonia mais leve.

6. Faça um intervalo para relaxar
Se as coisas estão realmente tensas, como, por exemplo, ter sido deixado para trás em uma promoção ou um colega lhe tomou o crédito de uma grande ideia, uma das melhores soluções pode ser retirar-se temporariamente da situação. Vá almoçar sozinho ou simplesmente dê uma caminhada lá fora um pouco. Não carregue junto o telefone celular: esse tempo é só seu. Sair dos limites da empresa pode fornecer a você a distância física e mental de que precisa para colocar para fora as tensões. Exercitar o corpo em uma pequena caminhada, mesmo que seja em volta da quadra, pode ser um poderoso relaxante mental, além de fazer bem ao corpo.

Acima de tudo, saiba que não está sozinho: você não é uma criatura esquisita apenas por sentir que está perdendo o controle ou se irritando com colegas ou supervisores. Todos passam por isso em algum momento no ambiente de trabalho. O importante é saber como controlar-se para não deixar esse ponto nervoso romper-se, como um vulcão expelindo lava e chamas. Não importa o quanto ruim possa parecer o momento, manter o profissionalismo faz você amadurecer e passa, acima de tudo, a imagem de alguém que tem profissionalismo.

Bookmark and Share

Aline Popozuda Presa

Aline PopozudaCartaz do Disque-Denúncia de Aline Popozuda
(Foto: Divulgação/ Disque-Denúncia)

Policiais da Unidade de Polícia Pacificadora (UPP) do Morro de São Carlos, na Zona Norte do Rio de Janeiro, prenderam na tarde desta quarta-feira (18), uma mulher, conhecida como “Aline Popozuda”, suspeita de ser segurança pessoal do traficante “Coelho”. Ele foi preso durante a ocupação da favela da Rocinha, na Zona Sul da cidade, em novembro de 2011. As informações são da Polícia Militar.

A polícia informou que a suspeita estava dormindo numa casa, no Morro de São Carlos, quando foi surpreendida pelos agentes, que checavam a denúncia de que ela estaria escondida na comunidade. Contra ela existem quatro mandados de prisão, ainda de acordo com a polícia.

O Disque-Denúncia já havia oferecido recompensa que variava entre R$ 1 mil e R$ 2 mil para quem tivesse informações sobre ela. O caso foi registrado na 6ª DP (Cidade Nova).

Bookmark and Share

Pagerank Google como funciona

Google Pagerank



Atualmente, a Google é a máquina de busca mais estudada e conhecida de todas. Duas são as razões principais para explicar esse fenômeno:
1) a Google é a máquina de busca mais utilizada do mundo (seja diretamente, em um dos sites da própria Google, seja indiretamente, em um dos vários sites que utilizam resultados fornecidos pela Google); por isso, ela atrai a atenção de todos os que se interessam por Search Engines
2) por ter sido projetada e implementada no meio acadêmico (enquanto as outras desde cedo tomaram um rumo comercial), a Google teve vários documentos a respeito de sua estrutura divulgados. Mesmo nos dias atuais, em que a Google tornou-se mais orientada a lucro, é possível encontrar literatura técnica escrita por vários dos pesquisadores da Google (por exemplo, experimente fazer uma pesquisa por [Krishna Bharat]); embora não haja garantia de que esses trabalhos tenham sido efetivamente implementados, é provável que o algoritmo tenha incorporado ao menos algumas das novas propostas apresentadas pelos pesquisadores.

Tradução para o português de “A Anatomia de uma Máquina de Busca Hipertextual em Larga Escala”
Aqui a Google nasceu para o mundo. Na conferência anual WWW de 1998, Sergey Brin e Lawrence Page, os fundadores da Google, apresentaram um trabalho relatando as características da Search Engine que haviam projetado. O paper foi separado em sete partes, seguindo a divisão do trabalho original. O trabalho inteiro é interessante, mas de particular importância são a Seção 2, em que os autores mencionam pela primeira vez o conceito de PageRank, e a Seção 4, em que fazem uma descrição detalhada da arquitetura geral da Google (que provavelmente sofreu poucas modificações desde então).

Esse documento é uma tradução do original em inglês The Anatomy of a Large-Scale Hypertextual Web Search Engine

The Anatomy of a Large-Scale Hypertextual Web Search Engine
Sergey Brin and Lawrence Page
{sergey, 
page}@cs.stanford.edu
Computer Science Department, Stanford University, Stanford, CA 94305
Resumo

Nesse paper, apresentamos Google, um protótipo de uma máquina de busca em larga escala que faz uso intensivo da estrutura presente em hipertextos. Google é projetada para rastrear e indexar eficientemente a Web e produzir resultados mais satisfatórios do que sistemas existentes. Um protótipo com bancos de dados de textos completos e hiperlinks de pelo menos 24 milhões de páginas está disponível em /google.standford.edu
Projetar uma máquina de busca é uma tarefa desafiante. Máquinas de busca indexam dezenas ou centenas de milhões de páginas web, contendo um número comparável de diferentes termos. Elas respondem a dezenas de milhões de pesquisas todos os dias. Apesar da importância de máquinas de busca em larga escala na internet, muito pouca pesquisa acadêmica tem sido feita a esse respeito. Além disso, por causa do rápido avanço da tecnologia e do crescimento acelerado da web, criar uma máquina de busca hoje é muito mais difícil do que três anos atrás. Esse paper fornece uma descrição detalhada de nossa máquina de busca de larga escala – a primeira descrição desse tipo de que se tem notícia até o presente.
Além dos problemas de se adaptar as técnicas de pesquisa tradicionais a essas escalas gigantescas, existem outros desafios técnicos a serem enfrentados, referentes à utilização, para aprimoramento dos resultados, das informações adicionais presentes nos hipertextos.
Outro problema abordado é como lidar com o fato de que novas informações, na forma de hipertexto, podem ser livremente publicadas por qualquer pessoa.
Palavras-chave: World Wide Web, Search Engines, Information Retrieval, PageRank, Google

Características do sistema.
A Google apresenta duas importantes características que a ajudam a produzir resultados de alta precisão. Em primeiro lugar, ela faz uso da estrutura de links da Web pra calcular uma medida de qualidade para cada página; essa medida é chamada PageRank, e está descrita com detalhes em [Page 98]. Em segundo lugar, a Google utiliza informações contidas em links para melhorar o resultado das pesquisas.
2.1 PageRank: trazendo ordem para a Web
O grafo de citações (links) da web é um recurso importante que tem sido pouco usado pelas máquinas de busca. Nós criamos alguns mapas que contêm 518 milhões de hiperlinks, uma amostra significativa do total. Esses mapas permitem um rápido cálculo do “PageRank” de páginas da web, uma medida objetiva de sua importância em citações, que guarda boa correlação com a idéia subjetiva que as pessoas têm de importância. Graças a essa correlação, PageRank é uma excelente maneira de priorizar os resultados de pesquisas por palavras-chave. Para temas populares, uma pesquisa que examina apenas os títulos das web pages retorna resultados admiráveis, quando os mesmos são ordenados por PageRank (demo disponível em google. stanford.edu). Para as pesquisas que avaliam todo o texto dos documentos, como ocorre no sistema principal da Google, PageRank também é de grande utilidade.
2.1.1. Descrição do cálculo do PageRank
A técnica acadêmica de citações literárias tem sido aplicada à web, principalmente por meio da contagem de citações (links) a uma determinada página; essa técnicao fornece uma aproximação da importância ou qualidade de uma página.
PageRank é uma extensão dessa idéia, com algumas diferenças: os links não são considerados todos iguais; é feita uma normalização do número de links em cada página.
PageRank é definido da seguinte forma:
Assumimos que existam páginas T1, T2, …, Tn que contenham links apontando para a página A (ou seja, as páginas T fazem citações à página A). O parâmetro d é um fator redutor que pode assumir valores entre 0 e 1; nós usualmente estabelecemos d como 0.85 (há mais detalhes sobre d na próxima seção). C(A) representa o número de links que existem na página A. O PageRank da página A é dado pela expressão:
PR(A) = (1-d) + d [PR(T1)/C(T1) + PR(T2)/C(T2) + ... + PR(Tn)/C(Tn)]
Observe que os PageRanks formam uma distribuição de probabilidades através de páginas web; assim a soma dos PageRanks de todas as páginas web é igual a um.

PageRank ou PR(A) pode ser calculado utilizando-se um simples algoritmo iterativo, e corresponde ao eigenvector principal da matriz normalizada de links da web. Ademais, o PageRank de 26 milhões de páginas pode ser calculado em algumas horas, utilizando-se uma estação de trabalho de médio porte. Há muitos outros detalhes que estão além do escopo desse trabalho.

2.2 Explicação intuitiva
PageRank pode ser interpretado como o modelo de comportamento de um usário. Nós supomos que existe um “usuário aleatório”, a quem se fornece uma página aleatório, a partir da qual ele clica aleatoriamente; tal usuário nunca clica o botão “back”, mas em algum momento ele se cansa do conteúdo da página que está visitando e requisita outra página aleatória. A probabilidade de que esse usuário aleatório visite determinada página é o PageRank dessa página. Além disso, o fator redutor d é a probabilidade, em cada página, de que o usuário aleatório se canse e requisite outra página aleatória.
Uma variação importante é atribuir o fator d apenas a uma página, ou a um grupo de páginas. Isso permite personalização e torna quase impossível enganar deliberadamente o sistema, a fim de se conseguir maiores rankings.
Outra explicação intuitiva é que uma página terá alto PageRank se houver muitas páginas apontando para ela, ou se houver algumas páginas de alto PageRank apontando para ela. Intuitivamente, é fácil aceitar que páginas que são freqüentemente citadas em muitos outros pontos da web são merecedoras de uma visita; por outro lado; se uma página não é de alta qualidade, ou se for um link quebrado, é pouco provável que a homepage do Yahoo! aponte para ela. PageRank trata essas duas situações, e todas as outras situações intermediárias, por meio da propagação recursiva de pesos através da estrutura de links da web.

2.2 Texto âncora
O texto dos links é tratado de maneira especial pela nossa search engine. A maioria das máquinas de busca associa o texto de um link com a página que contém o link; nós, além de fazer isso, associamos o texto com a página para a qual o link aponta. Isso apresenta algumas vantagens. Âncoras, freqüentemente, fornecem uma descrição mais precisa de páginas web do que as próprias páginas. Além disso, âncoras podem existir para documentos que não podem indexadas por uma search engine baseada em texto, tais como imagens, programas e bancos de dados; torna-se possível assim retornar páginas que não foram de fatos rastreadas (crawled). Vale notar que páginas que não foram rastreadas podem causar problemas, já que sua validade nunca foi verificada, antes de serem retornadas para os usários; pode ocorrer, inclusive, que a search engine retorne uma página que nunca tenha existido, mas que tenha links apontando para ela (contudo, como é possível ordenar os resultados, esse problema raramente acontece).
Essa idéia de propagação de texto-âncora à página à qual o link aponta foi implementada no World Wide Web Worm [McBryan 94], especialmente porque ela ajuda na pesquisa de informações não-textuais, e expande a cobertura da pesquisa a partir de um menor número de documentos baixados. Nós utilizamos texto-âncora principalmente para obter resultados de melhor qualidade. A utilização eficiente de textos-âncora é difícil, por causa das grandes quantidades de dados que vem ser processadas; em nossa amostra de 24 milhões de páginas, nós indexamos mais de 259 milhões de âncoras.

2.3 Outras peculiaridades
Além de PageRank e do uso de texto âncora, Google apresenta outras diversas peculiaridades. Primeiramente, ela tem informação sobre a localização de todos os hits (Nota do Tradutor: um hit significa que uma palavra-chave foi identificada num documento) e, por isso, faz uso intensivo da proximidade de palavras-chave, ao realizar as pesquisas. Além disso, Google presta atenção a alguns detalhes visuais da apresentação, como tamanho das fontes; palavras escritas em fontes maiores ou com negritos têm um peso maior que outras palavras. Ademais, o inteiro teor das páginas HTML fica disponível em um repositório próprio.

Google PageRank
Para se compreender o que é, e qual a importância do Pagerank, é necessário recordar um pouco da luta entre Search Engines e spammers que vem sendo travada desde que a internet tornou-se comercial.
Já se tornara evidente que (as SERPs mostravam isso), se se deixasse a cargo dos webmasters a tarefa de determinar qual o assunto abordado nas páginas (ou seja, se o ranking fosse determinado apenas por fatores on page – da própria página), os spammers facilmente dominariam os resultados. A Altavista introduziu o conceito de link popularity, pelo qual a avaliação de uma página passaria a levar em conta também fatores off page: quanto mais links apontassem para uma determinada página, melhor seria sua pontuação; os spammers logo descobriram uma brecha: eles se reuniam em grupos, criavam links entre si, e inflavam artificialmente a popularidade de suas páginas.

A Google levou adiante a idéia de que fatores off page deveriam determinar a importância de uma página. Mas, em vez de contar tão somente o número de links (que pode ser facilmente inflado) como fez a Altavista, a Google teve a idéia de atribuir diferentes pesos a cada link; a importância de cada link seria proporcional à importância da página em que o link estivesse inserido; e a importância da página seria proporcional à quantidade e importância dos links que ela recebesse.
A esse índice de importância de cada página foi dado o nome de PageRank, em homenagem a Larry Page, autor da idéia.
Clique o link para ler o paper original sobre PageRank, em formato PDF. Veja mais comentários sobre o paper na seção Fundamentos Matemáticos do PageRank.

O único fator que aumenta o PageRank de uma página são os links que apontam para ela, bem como o PageRank da página que contém o link; de acordo com a fórmula original, o PageRank de uma página é, após um desconto (se uma página tem 100 pontos dePageRank, apenas, digamos, 85 poderiam ser repassados), dividido igualmente entre todas as páginas linkadas na página.
Observe que uma página não perde seu PageRank, independente de quantos links contenha. O PageRank pode ser comparado a uma “capacidade de voto”: quanto maior o PR de uma página, mais PR ela pode passar (maior será o PR das páginas linkadas); essa “capacidade de voto” é conquistada, ela também, por meio de votações de outros sites: a única maneira de se incrementar o próprio PR é conseguindo contribuições de PRs de outros sites.

Note que o cálculo de PageRank é recursivo: para saber meu PR, eu tenho que saber o PR das páginas que linkam para mim; mas o PR dessas outras páginas depende do meu próprio PR, já que eu posso ter links diretos ou indiretos para elas. O cálculo do PageRanké extremamente trabalhoso; leia mais sobre o cálculo do PageRank no link acima indicado de Fundamentos Matemáticos do PageRank.

A importância do PR decorre de sua aplicação (e por muito tempo somente a Google pôde fazer isso) no rankeamento de páginas. Comparemos as situações:
Antes do PR: para uma pesquisa por [palavra], a SE selecionava mil páginas que contivessem [palavra]; a SE levava então em conta fatores on page, tais como presença da palavra no título, presença da palavra em headers, contagem do número de palavras na página, posição das palavras no texto, etc., e atribuía a cada página uma pontuação. No caso da Altavista, essa pontuação poderia ser corrigida por um fator proporcional à link popularity, mas, como vimos, com o tempo esse fator tornou-se manipulável. Ao fim desse cálculo, a SE retornava para o usário aquelas mil páginas, em ordem decrescente de pontuação.
Com o PR: para a mesma pesquisa por [palavra], a Google, por hipótese, selecionaria as mesmas mil páginas (na prática, isso não ocorre); aplicaria os mesmos critérios para obter pontuações on page. A diferença é que essas pontuações seriam ao final corrigidas peloPageRank: uma página de alto PageRank (ou seja, de alto conceito dentro da web) poderia ultrapassar várias outras que tivessem uma pontuação maior.
Obviamente, esse ordenamento depende de muitos outros fatores (no caso da Google, é certo que os textos âncoras apontando para as páginas têm grande peso no ordenamento); é óbvio também que a Google pode alterar os pesos dos fatores (inclusive e principalmente o peso do PageRank) conforme achar conveniente.

O fato é que o PageRank foi o principal fator do sucesso da Google. A Google tornou-se o que é hoje porque seus resultados agradavam os usuários; agradavam porque eram mais relevantes; e eram mais relevantes muito por causa do PageRank. Embora tenha certamente passado por muitos ajustes, até hoje, segundo a própria Google, “the heart of our software is PageRank” (o coração do software da Google é o PageRank).
Atualização de PageRank e Rankings
Breve Histórico
Até o final de 2002, as atualizações ocorriam da seguinte maneira:
Por um período de aproximadamente um mês, a Google soltava os googlebots na web; os bots coletavam novas páginas e novos links; todas as informações eram armazenadas nos servidores.
Ao final do ciclo, a Google reunia todas as informações e reconstruía completamente seus índices; novas páginas eram adicionadas, e todos os links eram levados em conta no cômputo do novo PageRank; uma vez concluídos os cálculos, o PageRank era atualizado e os rankings refletiam os novos índices.
Essa troca de índices era chamada de Google Dance. Era um dia aguardado por webmasters, que ansiavam por ver o resultado de seus trabalhos; após a dança, os resultados permaneciam quase estáticos até que o próximo ciclo se completasse. Uma tradição iniciada na Webmasterworld fez com que cada dança tivesse um nome de mulher, em ordem alfabética (tal qual os furacões). Veja aqui uma tabela com as datas das Google Dances; observe que a lista vai apenas até novembro de 2003.

A partir de 2002, a Google introduziu um novo robot, chamado freshbot. Enquanto a googlebot buscava dados para a atualização mensal, o freshbot ia atrás de informações recentes, em páginas e sites atualizados com maior freqüência. A função do freshbot era fazer pequenas alterações no índice e nos rankings, enquanto não se efetuava o recálculo mensal do PageRank.
Por ocasião da dança mensal, as mudanças já não eram tão bruscas, já que o freshbot já havia antecipado algumas alterações nos índices. Com o passar do tempo, o freshbot ficou cada vez mais ativo: as mudanças diárias no índice passaram a ser mais freqüentes e de maior impacto, reduzindo assim cada vez mais o impacto causado pela dança mensal.
Nota: os nomes dos User Agents dos bots da google eram os mesmos: googlebot; a única maneira de diferenciar o googlebot do freshbot é por meio dos respectivos IPs. Até hoje, parece existir diferentes tipos de googlebots; alguns têm nomes distintos (como o bot da Adsense, chamado Media-partners bot), outros são diferenciáveis apenas pela classe de IPs.

Reconhecendo a existência de deficiências no antigo algoritmo de PageRank, a Google, em novembro de 2003, num episódio que tornou-se conhecido como Update Florida, promoveu várias alterações na maneira como os resultados são apresentados aos usuários.
Entre as ações adotadas pela Google para evitar a manipulação dos rankings, incluiu-se justamente uma intensificação da ação dos freshbots, que praticamente assumiram o papel dos antigos googlebots. Isso quer dizer que os freshbots não apenas buscavam páginas recentes, com o propósito apenas de refinar os rankings, até a próxima dança; agora, os freshbots parecem ter o poder de dar um ranking permanente às páginas e links que encontram.
Com isso, a Google atingiu dois objetivos. Primeiro, consegue manter um índice permanentemente mais atualizado, o que agrada os usuários e era, desde o princípio, o objetivo dos freshbots. Segundo, ficou mais difícil para webmasters observar o efeito de suas técnicas (leia-se: tentativas de subir no ranking): anteriormente, como a atualização era mensal, os resultados de técnicas adotadas durante todo um mês apenas se refletiam ao final de cada ciclo, e portanto eram facilmente identificáveis e mensuráveis; agora, como as atualizações são praticamente diárias, é muito mais difícil saber quais técnicas deram resultado, quanto tempo demorou, etc. Ficou mais difícil manipular os resultados.

Dias Atuais
Atualização de PageRank: o valor de PR exibido ao público é atualizado muito pouco freqüentemente; houve uma atualização em outubro de 2004, após um período de aproximadamente três meses. Note, entretanto, que o PageRank atual, utilizado na determinação dos posicionamentos, é provavelmente atualizado com muito mais freqüência. Essa foi uma das medidas tomadas pela Google para combater spammers a partir da Update Florida.
Atualização dos rankings: o posicionamento dos sites nos rankings é alterado constantemente. Páginas podem subir e descer a cada vez que uma pesquisa é feita; novas páginas são introduzidas constantemente.
Observe, entretanto, que embora os rankings se alterem todos os dias, não há forma clara de se determinar quanto tempo uma alteração em sua página se refletirá em uma alteração no ranking (ou, de maneira inversa: se seu posicionamento se alterou hoje, não há como saber quando foram feitas as modificações que deram ensejo à alteração).
Igualmente, embora todos os dias surjam novas páginas nas SERPs, não há como determinar quanto tempo levará para que uma nova página específica seja mostrada. É certo, entretanto, que para ser introduzida no índice, a página deve ser visitada pela googlebot; e há consenso de que as chances de uma visita da googlebot são proporcionais ao PageRank da página antiga onde houve um link para a página nova.

A Google contra-ataca
Por volta de outubro de 2003, o quadro na indústria de SEO era o seguinte: para melhorar o ranking de meu site sobre venda de canetas, eu vou àquele site que fala de borboletas africanas, com várias páginas com PR7, e compro alguns links por algumas centenas ou milhares de dólares. Após alguns dias, meu site vai para a primeira página da Google. O comprador de links está feliz, o vendedor está feliz, e tudo segue adiante.
A Google, porém, não estava satisfeita. E demonstrou isso em novembro de 2003: na sua (então mensal) atualização do índice, grandes mudanças aconteceram; ficou evidente que a Google havia feito uma enorme mudança no algoritmo; diversas teorias conspiratórias surgiram (a mais citada: a Google havia rebaixado o ranking de vários sites comerciais às vésperas do Natal, no intuito de que eles passassem a pagar por AdWords). Leia uma das mais longas threads de Webmasterworld.com: the Florida Update.

O que a Google fez?

É evidente que houve bruscas alterações no algoritmo.
Em primeiro lugar, reconhecendo que PageRank agora podia ser comprado, a Google retirou muito do seu peso. Sites com PR6 e PR7 que ocupavam o topo do ranking perderam seus lugares para sites com PR5, 4 e 3; além disso, se antes havia grande semelhança entre resultados nas SERPs e resultados em allinanchor: , agora, passou a haver muitas discrepâncias. (Nota: as opiniões sobre a importância atual do PageRank variam muito; alguns dizem que “PR não vale mais nada”, enquanto no outro oposto se diz que “PR é tão importante quanto antes”; a maioria das opiniões, entretanto, é no sentido de que houve diminuição no peso do PageRank, mas ele continua sendo o mais importante dos critérios de rankeamento.)
Várias outras alterações podem ter sido efetuadas; algumas de pequena monta, como, por exemplo mudanças no peso dado a cabeçalhos (h1, h2, etc), uso de fontes em negrito ou itálicas, etc.
Outras alterações, entretanto, podem ter sido mais radicais. Tornaram-se mais consistentes os rumores de que a Google introduziu o algoritmo Hilltop; outros webmasters viram evidências nas SERPs de que a Google estaria fazendo uso mais extensivo de análise de semântica para melhor classificar as páginas.
Evidentemente, a Google não se manifestou sobre o assunto.

Além de alterar o algoritmo, a Google restringiu a quantidade de informações passadas aos webmasters.
PageRank gráfico, ou TBPR – Toolbar PageRank (exibido por meio da Google Toolbar passou a ser atualizado com muito menos freqüência. Em lugar das tradicionais atualizações mensais, a Google passou a fazer atualizações cada vez mais espaçadas; houve uma atualização geral em julho de 2004, e a seguinte veio apenas em outubro de 2004.
Vários webmasters reportaram que o valor do TBPR apresentado era errático. Por exemplo, páginas com PR7 passaram a PR4 ou 5, mesmo tendo havendo aumento no número de backlinks. Com isso, aumentou o número de casos em que sites de menor PR batiam sites de alto PR, mesmo para termos muitos competitivos.
Alguns sites perderam a capacidade de repassar PageRank. Sites de alto PR que vendiam “espaço publicitário” de repente não transmitiam mais PageRank; se anteriormente um link nessas páginas garantia alto PR, agora pouco ou nenhum efeito era notado, nem no valor do TBPR, nem no posicionamento nos rankings.
A Google passou a mascarar os backlinks de cada página. Uma pesquisa com o comando link:URI costumava retornar os links mais relevantes para a página, o que facilitava o trabalho de webmasters que estavam em busca de links; após a mudança (e até hoje), o comando parece retornar um sub-conjunto aleatório de backlinks. Além disso, tal qual ocorreu com o TBPR, as atualizações dos backlinks tornaram-se menos freqüentes.
Todas essas alterações tiveram o mesmo objetivo: dificultar a ação daqueles que procuram encontrar links a fim de melhorar o PageRank. Antes das alterações, era fácil encontrar as páginas de alto PR, descobrir quais links apontavam para elas, e tentar obter os mesmos links. Após essas alterações, o valor do PR exibido não é confiável, e a relação de links é aleatória; é muito mais difícil descobrir onde tentar obter um link.

Resultado: hoje, é muito mais difícil conseguir os links necessários para levar uma página ao topo do ranking.

Deficiências do PageRank
Apesar de ter colocado a Google em vantagem em relação às demais Search Engines, o algoritmo do PageRank tem algumas deficiências.
Na Seção 6.1 do documento original sobre PageRank, Sergei e Larry escreveram:

“Esses tipos de PageRank personalizados são virtualmente imunes a manipulações movidas por interesses comerciais. Para uma página conseguir um alto PageRank, ela deve convencer uma página importante, ou uma porção de páginas sem importância, a linkar para ela. No pior caso, poderemos ter manipulação na forma de compra de publicidade (links) em sites importantes. Mas isso parece estar sob controle, já que custa dinheiro…”
Eles estavam errados.

Em primeiro lugar, deve-se mencionar que o algoritmo tinha uma deficiência desde a origem: o PageRank era passado de página a página, independente do conteúdo das mesmas. Isso significa que um link da homepage da NASA transferia a mesma quantidade dePageRank, quer o link apontasse para um site sobre astronáutica (tópico correlato ao da página da NASA), quer o link apontasse para um site sobre filmes dos anos 50 na Chechênia. Assim, uma pessoa procurando aumentar seu PageRank tinha apenas que conseguir links em outras páginas de alto PR, sem se importar com o tópico das mesmas.
A título de curiosidade: por volta da mesma época em que Page imaginou o PageRank, outro pesquisador chamado J. Kleinberg estava desenvolvendo um trabalho chamado Authoritative Sources in a Hyperlinked Environment (fontes que sejam autoridade em ambientes de hiperlinks), que também analisava a estrutura de links para atribuir índices de relevância a cada página; a diferença era que, para calcular o “PageRank” de uma página, o algoritmo de Kleinberg considerava apenas os links contidos em páginas cujo tópico fosse similar ao da página sob análise.
O problema dessa técnica é que o grafo a ser analisado depende da [palavra-chave], e portanto deve ser montado em tempo real, para cada pesquisa; o projeto, que recebeu o nome HITS, não foi adiante porque não havia recursos tecnológicos suficientes para torná-lo comercialmente viável. Entretanto, alguns anos depois, a patente da HITs foi adquirida pela Teoma. Leia mais sobre Teoma e AskJeeves.

As pessoas aproveitaram-se da deficiência do algo do PageRank acima mencionada para manipularem seus rankings; na verdade, pode-se dizer que a Google foi vítima do seu próprio sucesso.
Antes da Google, a compra de espaço publicitário (links de texto ou banners) era comum, mas o principal objetivo do comprador era conseguir tráfego; ninguém se importava com PageRank.
Após seu explosivo crescimento, todos queriam ter bons rankings na Google. Com o tempo, ficou evidente que havia grande correlação entre o posicionamento de uma página no ranking e seu PageRank; mais e mais pessoas aprenderam que, para aumentar seuPageRank, a maneira mais fácil era obter links em outras páginas de alto PageRank.
Em pouco tempo, PageRank virou uma commodity. Webmasters compravam links interessados apenas no PageRank, e não na quantidade ou qualidade do tráfego que receberiam. Os links, que deveriam funcionar como meio de acesso a outras fontes interessantes de informação (esse era o espírito original do PageRank) passaram a ser objeto de compra e venda.

É bem verdade que muitos (a maioria) dos grandes sites não se envolveu nesse comércio de PageRank. Os .edus, .govs, as grandes corporações continuaram sua vida normalmente.
Entretanto, alguns grupos de sites rapidamente aderiram ao comércio de PageRank. Por exemplo, alguns grandes sites de alto PageRank que desde sempre venderam links, agora podiam inserir mais links em mais páginas, por um preço muito maior; um exemplo desse tipo de site é foxnews.com. Outros sites que se beneficiaram foram aqueles que, ao longo dos anos, publicaram informações úteis e relevantes, conquistaram merecidamente vários links, e subitamente viram-se detentores de uma mercadoria relevante chamadaPageRank (vários sites na geocities enquadram-se aqui); muitas pessoas que nunca pensaram em ter qualquer retorno financeiro de seus sites informativos agora podiam faturar um bom dinheiro, vendendo PageRank.
Um caso que ficou notório foi o da searchking.com. Esse site atingiu PR7 em sua homepage, tinha excelentes rankings, e abertamente anunciava a venda de links, como forma de se conseguir PageRank e melhores rankings. A Google alterou o PR da SearchKing, que viu seu tráfego encolher. A SearchKing iniciou um processo judicial contra a Google – mas não ganhou; leia sobre o caso SearchKing (siga os links no pé da página).

O fato é que estava ficando cada vez mais claro que a Google precisava fazer correções no seu algoritmo.Conquistando PageRank
Existe apenas uma maneira de se conseguir PageRank: por meio de links para sua página, os quais devem estar inseridos em páginas com algum PageRank e devem ser reconhecidos pelo bot. Tanto mais PageRank será transferido, quanto maior for o PageRank da página que contém o link e quanto menor for o número total de links na página.
Lembre-se de que PR é atribuída a cada página, e não a cada site. Costuma ocorrer que a homepage tenha PageRank maior que as páginas internas. Pode acontecer que a homepage tenha PR8, e que a página de links (onde seu link será inserido) tenha PR0, por ter tido seu acesso bloqueado aos bots.
Para se assegurar de que o link será reconhecido, procure usar a forma
a href=”w.seudominio.com” mce_href=”w.seudominio.com”.
Links codificados em javascript em geral não são reconhecidos.
Links que fazem acesso a bancos de dados podem ou não ser reconhecidos. Um link to tipo
a href=”w.outrodominio.com/?cid=200 (o número 200 faz referência a um registro em um banco de dados, onde estão armazenadas informações sobre o site a ser acessado, incluindo a URI) certamente não transferirá PageRank, pois o bot não consegue saber qual URI está sendo linkada.
Um link como a href=”h.outrodominio.com/?sw.seudominio.com&p=20&q=X pode ou não ser reconhecido, dependendo: do PageRank da página em que o link está inserido; do número de parâmetros da URI.

A melhor forma, portanto, de se angariar PageRank é conseguir links em páginas com o mais alto PR possível e o menor número de links possível.
Lembre-se de que, como o montante de PageRank aumenta exponencialmente, uma página com PR4 tem muito mais que o dobro de PageRank de uma página PR2.

Links internos
O projeto original da Google não fazia, para cálculo do PageRank, nenhuma distinção entre links internos (que apontam para páginas dentro do mesmo domínio) e externos (que apontam para páginas em outros domínios). Assim, se a Página A contiver um link para a Página B de um mesmo domínio, a Página B estará recebendo PageRank da Página A; ainda, se a Página B contiver um link para a mesma Página A, essa estará tendo também um incremento de PageRank.
Isso quer dizer que uma outra maneira de se aumentar o PageRank total de um domínio é através da adição de novas páginas; os links que apontam para uma nova página transferem-lhe PageRank, que pode ser repassado para as páginas antigas.

1. Com que freqüência o Googlebot acessa as minhas páginas?

Para a maioria dos sites, o acesso do Googlebot não deve ocorrer, em média, mais de uma vez no intervalo de poucos segundos. No entanto, devido a atrasos na rede, é possível que a taxa pareça ser um pouco mais elevada dentro de intervalos curtos.

2. Como posso solicitar ao Google para não indexar determinadas partes do meu site?

O robots.txt é um documento padrão que informa ao Googlebot que ele não deve fazer o download de determinadas informações do seu servidor web. O formato do arquivo robots.txt é especificado na Norma de Exclusão para Robôs. Para obter instruções detalhadas sobre como evitar que o Googlebot indexe a totalidade ou parte do seu site, consulte a nossa página de Remoções. Lembre-se de que as alterações no arquivo robots.txt do seu servidor não serão refletidas imediatamente no Google. Elas serão descobertas e propagadas quando o Googlebot fizer a próxima indexação do seu site.

3. O Googlebot está indexando o meu site rápido demais. O que posso fazer?

Por favor, envie-nos o URL do seu site e uma descrição detalhada do problema. Inclua também uma parte do seu weblog que mostre os acessos do Google para que possamos rastrear rapidamente o problema.

4. Por que o Googlebot está solicitando um arquivo chamado robots.txt, que eu não tenho no meu servidor?

O robots.txt é um documento padrão que informa ao Googlebot que ele não deve fazer o download de determinadas informações do seu servidor web. Para obter informações sobre como criar um arquivo robots.txt, consulte a Norma de Exclusão para Robôs. Se você quiser simplesmente evitar as mensagens de erro de “arquivo não encontrado” no weblog do seu servidor, crie um arquivo vazio chamado robots.txt.

5. Por que o Googlebot está tentando fazer download de links incorretos do meu servidor? Ou de um servidor que não existe?

É certo que em qualquer momento você encontrará vários links na web que estão quebrados ou desatualizados. Quando alguém publica um link incorreto para o seu site (às vezes devido a erro de digitação ou de ortografia) ou não consegue atualizar os links para refletir as mudanças no seu servidor, o Googlebot tenta fazer o download de um link incorreto do seu site. Isso explica também porque você poderá receber acessos à uma máquina que nem é servidor web.

6. Por que o Googlebot está fazendo download de informações do nosso servidor “secreto”?

É quase impossível manter um servidor web em segredo por não haver links que levem a ele. Assim que alguém seguir um link que parte do seu servidor “secreto” e vai para outro servidor web, o seu URL “secreto” aparecerá na tag referrer e poderá ser armazenado e publicado no referrer log do outro servidor web. Portanto, se houver um link para o seu servidor ou página “secretos” em algum lugar da internet, é provável que o Googlebot e outros indexadores o encontrem.

7. Por que o Googlebot não obedece ao meu arquivo robots.txt?

Para economizar largura de banda, o Googlebot só faz o download do arquivo robots.txt uma vez por dia ou quando tivermos muitas páginas do servidor. Por isso, talvez demore um pouco até que o Googlebot saiba das alterações no seu arquivo robots.txt. Além disso, o Googlebot está distribuído em diversas máquinas. Cada uma delas mantém o seu próprio registro do seu arquivo robots.txt.

Sugerimos sempre que você verifique se a sua sintaxe está de acordo com as normas mostradas em h://. Uma causa comum de problemas é o fato de o arquivo robots.txt não estar localizado no diretório superior do servidor (por exemplo, www.myhost.com.br/robots.txt). Se o arquivo for colocado em um subdiretório, ficará sem efeito.

Além disso, há uma pequena diferença entre a maneira que o Googlebot trata o arquivo robots.txt e o que está previsto na norma do robots.txt (levando-se em consideração a diferença entre “deve” e “é obrigatório”). A norma diz que devemos obedecer à primeira regra aplicável, ao passo que o Googlebot obedece à maior (ou seja, à mais específica). Esta prática, mais intuitiva, corresponde àquilo que as pessoas normalmente fazem e o que elas esperam que nós façamos. Por exemplo, vamos considerar o seguinte arquivo robots.txt:

User-Agent: *
Allow: /
Disallow: /cgi-bin

É óbvio que a intenção do webmaster é permitir que os robôs indexem tudo, exceto o diretório /cgi-bin. Portanto, é isso que fazemos.

Para obter mais informações, veja as Perguntas Freqüentes sobre Robôs. Caso ainda tenha problemas, entre em contato conosco.

8. Por que aparecem acessos a partir de várias máquinas do Google.com.br, todos com o user-agent Googlebot?

O Googlebot foi projetado para ficar distribuído em diversas máquinas, visando melhorar o desempenho e a escala, à medida que a web crescer. Além disso, para reduzir a utilização da largura de banda, executamos diversos indexadores em máquinas localizadas próximas aos sites que estão sendo indexados na rede.

9. Vocês podem me informar os endereços IP a partir dos quais o Googlebot faz a indexação para que eu possa filtrar os meus registros?

O endereço IP usado pelo Googlebot pode mudar ao longo do tempo. A melhor maneira de identificar os acessos do Googlebot é através do user-agent (Googlebot).

10. Por que o Googlebot está fazendo várias vezes o download da mesma página do meu site?

Em geral, o Googlebot só deveria fazer download de uma única cópia de cada arquivo do seu site em cada indexação. Às vezes, porém, a indexação é interrompida e reiniciada, o que pode fazer com que sejam reindexadas as páginas que foram encontradas recentemente.

11. Por que não estão aparecendo no seu índice as páginas que o Googlebot indexou no meu site?

Não se assuste se você não conseguir localizar imediatamente no mecanismo de busca do Google os documentos que foram indexados pelo Googlebot. Os documentos são acrescentados ao nosso índice logo após serem indexados. Às vezes, porém, os documentos acessados pelo Googlebot não são incluídos por vários motivos (por exemplo, por se tratarem aparentemente de duplicatas de outras páginas da web).

12. Quais tipos de link o Googlebot segue?

O Googlebot segue links HREF e SRC.

13. Como posso impedir que o Googlebot siga os links das minhas páginas?

Para evitar que o Googlebot siga os links das suas páginas para outras páginas ou documentos, coloque a seguinte meta tag no cabeçalho do seu documento HTML:

<META NAME=”Googlebot” CONTENT=”nofollow”>

Para obter maiores informações sobre meta tags, consulte #meta. Você pode ver também o que a padrão HTML diz sobre essas tags. Lembre-se de que as alterações no seu site não serão refletidas imediatamente no Google. Elas serão descobertas e propagadas quando o Googlebot fizer a próxima indexação do seu site.

14. Como posso informar ao Googlebot que ele não deve indexar um determinado link que leva para fora da minha página?

As meta tags permitem excluir todos os links que levam para fora da sua página, mas você também pode instruir o Googlebot para não indexar determinados links: basta adicionar rel=”nofollow” no hiperlink. Quando o Google encontra o atributo rel=”nofollow” nos hiperlinks, o respectivo link não recebe créditos durante a classificação dos sites nos nossos resultados de pesquisa. Por exemplo, o link

<a t;Esse link é ótimo!</a>

poderia ser substituído por

<a href=follow”> Esse link eu não garanto</a>.

Bookmark and Share

O que é Hoax

A palavra hoax veio do pretenso encantamento hocus pocus. “Hocus pocus”, por sua vez, pode ser uma distorção da expressão latina “hoc est corpus” (“este é o corpo”) proferido durante a missa. O assunto ainda é controverso entre os etimologistas.

Os hoaxes, também conhecidos como “pulhas”, “boatos” ou “lendas virtuais”, são caracterizados por sua linguagem típicamente marcada pela ênfase no caráter emergencial, na gravidade ou na urgência do fato, além do tom emocional ou sensacionalista usados com o intuito de seduzir o leitor e, ainda, o típico e insistente apelo para que seja repassada ao máximo de pessoas. Estes atributos, que muitas vezes se tornam até mais evidentes do que as próprias informações da mensagem, se forem bem observados, nos permitirão facilmente distinguir uma pulha de uma mensagem honesta.

Como forma de transmitir uma pseudo credibilidade ao fato, o hoax costuma citar termos científicos – embora muitas vezes incoerentes – e mencionar nomes de autoridades ou de instituições reconhecidas, inclusive de organizações humanitárias e governamentais. Além disso, a autoria da mensagem não se identifica ou se identifica de forma dissimulada usando dados irreais. Contudo, um dos principais indicadores de falsas mensagens é o simples fato de serem objetos de repasses reiterados, pois muitos o fazem ingenuamente, sem averiguar quaisquer características ou sem tampouco lerem o conteúdo.

A criação e disseminação de hoaxes ou correntes pela Internet têm como principal motivação a captura de endereços de e-mails que, em seguida, são repassados ou vendidos a spammers. Um hoax pode circular pelo mundo em poucas semanas, retornando à origem centenas de cópias, cada qual trazendo junto ao corpo da mensagem outras centenas ou milhares de endereços de e-mails por onde a mesma circulou. Isso ocorre porque os leitores, ao repassarem adiante tais mensagens, ao invés de inserir os endereços de e-mails dos seus amigos no campo CCo (Cópia Oculta), costumam digitá-los nos campos Para ou C/Cópia. Dessa forma fazem com que esses endereços sejam incorporados à mensagem e, a partir daí, passem a circular expostos e abertamente até caírem nas mãos dos piratas de e-mails.

Além disso, outra prática que muito contribui para esse efeito nocivo dos “hoaxes” é o fato de que, ao repassarem uma mensagem adiante, os internautas não tomam o cuidado de limpar eventuais endereços de e-mail que porventura já estejam incorporados a esta mensagem.

O repasse indiscriminado deste tipo de mensagens é um sinal de pouca sofisticação e pouca experiência no uso da Internet, além de um ato bastante deselegante com os próprios amigos, pois seus endereços de e-mails são publicados aos quatro ventos! Sobretudo porque o endereço de e-mail é uma informação de natureza pessoal e individual e, como tal deve ser respeitada e preservada.

Bookmark and Share

Google tem ganhos positivos – 1 Trimestre 2009

Google

Google

As ações do Google valorizaram mais de 2% na quinta-feira (16/04) em antecipação à divulgação dos resultados positivos do trimestre. O gigante das buscas entregou números que superaram as expectativas de analistas de mercado. A receita do primeiro trimestre fiscal de 2009 somou US$ 5,51 bilhões, com alta de 6% sobre igual período de 2008, mas 3% inferior ao último trimestre do ano passado.

“O Google fez bem em administrar as expectativas”, disse Mukul Krishna, diretor global de mídia digital da Frost & Sullivan.

A receita da companhia está em linha com as estimativas, mas o ganho por ação de US$ 5,16 foi melhor que os US$ 4,93 antecipados, um sinal de que o controle de custos está funcionando. As despesas operacionais atingiram US$ 1,52 bilhão no período, consumindo 28% da receita, uma pequena queda em relação ao último trimestre de 2008, quando as despesas somaram US$ 1,65 bilhão.

Em conferência voltada aos investidores, o CFO do Google, Patrick Pichette, informou que a empresa tem reputação de ser uma companhia não convencional e que as despesas apresentadas no primeiro trimestre revelam que o grupo entende de gerenciamento fiscal responsável.

Eric Schmidt, CEO do Google, disse que a empresa teve um forte trimestre, mesmo diante do clima de instabilidade econômica. “Se você olhar para a situação econômica, nós ainda estamos basicamente em um território intocável”, observou.

O executivo reconheceu que os usuários do Google estão comprando menos e que as publicidades têm convertido menos que o de costume, mas ressaltou que os anunciantes continuam gastando. “Achamos que o Google estão bem posicionado para uma recuperação assim que ela ocorrer ou quando ocorrer. Obviamente, não sabemos quando isto irá acontecer”, afirmou.

No final de março, o Google informou que tinha 20.164 funcionários em regime full time, número um pouco inferior ao verificado em dezembro, quando a companhia tinha 20.222 empregados. Esses números não contabilizam as demissões anunciadas no início do trimestre.

Sobre o YouTube, o Google não especificou a quantidade de conteúdo que suportaria publicidade, mas afirmou que o site de vídeos tem grande potencial de receita. “Qualquer um poderia morrer por um site com o tráfego que o YouTube possui”, comentou Krishna.

Bookmark and Share

Como acessar o Internet banking com segurança

internet banking

internet banking

O Brasil tem atualmente 27,3 milhões de usuários de internet banking, segundo o relatório mais recente da Febraban (Federação Brasileira de Bancos). Se você está entre estes 17% da população nacional que acessa a conta bancária via Web fica atento às dicas.

Cuidado com sites falsos As empresas possuem recursos que conseguem bloquear a maioria dos e-mails falsos. Alguns programas de antivírus que usados no computador pessoal também possuem este tipo de característica. Mas o especialista em segurança da informação da Future Security, Denny Roger, afirma que os fraudadores perceberam isso e estão aplicando um dos golpes mais antigos: o das páginas clones. “Neste tipo de golpe o usuário é induzido a acessar uma página falsa do banco que solicita as mesmas informações da verdadeira. Esse clone é capaz de armazenar os dados do usuário em um banco de dados para o acesso do estelionatário”, explica um analista de segurança.

A dica que ele dá para se livrar deste golpe é simples. “A URL (endereço da página) do site clonado é diferente da URL verdadeira do banco. Também é comum encontrarmos erros de português nas páginas falsas”, alerta o especialista. Acesse sua conta somente do seu PC As pragas programadas para espionar o acesso ao Internet banking podem estar instaladas em Lan House, Cybercafé, laboratórios de faculdade, hotéis ou até mesmo nas estações de trabalho da sua empresa.

Por isso, o analista aconselha o internauta a acessar sua conta sempre do seu computador pessoal. “É muito provável que você saiba quais são os programas instalados no seu PC. No caso de computadores de terceiros você não tem controle nenhum”. Não compartilhe sua senha Outra dica básica, mas que muita gente esquece é não revelar para outras pessoas dados como número da sua agência, conta corrente, senha e frase secreta.

“Os bancos implantam as chaves de segurança ou tokens para minimizar o número de fraudes. Porém, algumas pessoas tiram uma xerox do seu cartão contendo estas chaves e compartilham o acesso com outra pessoa. Não adianta nada”, exemplifica o especialista. Feche sua máquina Mantenha sempre seu antivírus, firewall pessoal e anti-spyware atualizados. Segundo a Nettion Information Security, estes recursos ainda são a forma mais simples de travar as portas do computador para entrada de invasores. Mas se ainda assim seu micro for invadido, você pode tentar descobrir. “Alguns softwares comerciais focados em perícia forense podem detectar incidentes e identificar o autor dos ataques”.

Uma das sugestões é um programa de detecção de intrusos (IDS). “Um exemplo deste tipo de software é o G-Buster”. Caso o computador apresente lentidão, pode ser indício de que sua máquina está sendo atacada. “O programa Process Explorer ajudará a identificar o código malicioso que está deixando a máquina lenta”. Para download, acesse link Snapfiles. O especialista indica ainda outro software que ajuda a identificar se o invasor está conectado ao seu micro. É o TCP View. Para download acesse o site da Microsoft. Por fim, é importante monitorar os arquivos do Windows e entender as técnicas de ataque. “Dessa forma, conseguiremos minimizar o risco de ocorrer um ataque bem-sucedido ou o vazamento de informação de uma determinada organização”, reforça .

Bookmark and Share