<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	>

<channel>
	<title>Fazedor de Site &#187; Buscadores</title>
	<atom:link href="http://www.fazedordesite.com/blog/category/buscadores/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.fazedordesite.com/blog</link>
	<description>Blog voltado a todos os fazedores de site, programadores, webdesigners, designers de interface, enfim, todos que contribuem pro crescimento da nossa profissao, teremos textos sobre Javascript principalmente, metodologias de desenvolvimento, usabilidade, acessabilidade e muito mais.</description>
	<pubDate>Mon, 05 Jan 2009 16:05:38 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.7</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Robots.txt</title>
		<link>http://www.fazedordesite.com/blog/2007/07/30/robotstxt/</link>
		<comments>http://www.fazedordesite.com/blog/2007/07/30/robotstxt/#comments</comments>
		<pubDate>Mon, 30 Jul 2007 10:21:53 +0000</pubDate>
		<dc:creator>Rodrigo Fante</dc:creator>
		
		<category><![CDATA[Avaliação]]></category>

		<category><![CDATA[Buscadores]]></category>

		<category><![CDATA[Desenvolvimento]]></category>

		<guid isPermaLink="false">http://www.fazedordesite.com/blog/2007/07/30/robotstxt/</guid>
		<description><![CDATA[Falarei hoje de algo que não é exatamente novo, mas como a cada dia temos novos fazedores de site, nunca é demais evidenciar o que é importante.
O Robots.txt nada mais é que um arquivo texto que é lido pelos robôs(bots) dos sistemas de busca como Google, Yahoo&#8230;
O que este arquivo de texto faz é informar [...]]]></description>
			<content:encoded><![CDATA[<p>Falarei hoje de algo que não é exatamente novo, mas como a cada dia temos novos fazedores de site, nunca é demais evidenciar o que é importante.</p>
<p>O Robots.txt nada mais é que um arquivo texto que é lido pelos robôs(bots) dos sistemas de busca como Google, Yahoo&#8230;</p>
<p>O que este arquivo de texto faz é informar ao robô quais diretórios e/ou arquivos <strong>não</strong> deve acessar, fora os diretórios/arquivos informados neste arquivo ele automaticamente pega tudo que tem no seu site, diretórios, sub-diretórios, arquivos.</p>
<p>Caso você não utilize este arquivinho os buscadores indexam o site todo, ou seja, se seu site tiver uma área reservada, intranet, extranet, o que for, sem esse arquivo, tudo isso será indexado, inclusive aquelas informações confidenciais que seu concorrente adoraria saber.</p>
<p>Sem mais delongas, o que deve ser colocado nesse arquivo?</p>
<p>Agora vem um processo muito &#8220;complexo&#8221;, primeiro devo destacar novamente que devem criar o arquivo exatamente com esse nome:<br />
robots.txt</p>
<p>Não pode ser .html .php nada disso, deve ser exatamente robots.txt, um arquivo texto simples, use o notepad para criar se quiser.<br />
Este arquivo deve ser colocado na raiz do seu site, será a primeira coisa lida pelo robozinho.</p>
<p>Agora alguns exemplos de como escrever esse seu arquivo.</p>
<p>Para que nada no site seja indexado por nenhum mecanismo de busca insira dentro do arquivo texto o seguinte:<br />
<code><br />
User-agent: *<br />
Disallow: /<br />
</code><br />
O * ali indica que <strong>todos </strong>os buscadores devem obedecer o que vem na linha a seguir.<br />
E o / significa todos os diretórios, e disallow é negar o acesso.<br />
Logo ali estamos dizendo que para todos os buscadores devemos negar o acesso a todos os diretórios.<br />
Pronto, seu site não será indexado.</p>
<p>Bom supondo que tenhamos um diretório chamado &#8220;admin&#8221; que  deve ser bloqueado a todo custo dos buscadores, pois ali guardamos muita informação valiosa, e que não pode de forma alguma cair nas mãos maléficas da concorrência, como proteger esse diretório?<br />
Simples assim:<br />
<code><br />
User-agent: *<br />
Disallow: /admin/ #diretorio bloqueado<br />
</code><br />
O sinal #(tralha), serve como comentário, o que vem após dele não interfere na definição das regras de acesso.</p>
<p>Mas veja bem, na realidade, aquele diretório que bloqueamos tem apenas um arquivo que é importante e altamente secreto, que é o &#8220;formula_da_cocacola.doc&#8221;, o restante gostaria que fosse indexado.<br />
Perfeito, porque não disse antes? Neste caso vamos bloquear apenas o segredo industrial mais bem guardado do século, e o faremos da seguinte forma:<br />
<code><br />
User-agent: *<br />
Disallow: /admin/formula_da_cocacola.doc #</code><code>XooOOoo buscadores.</code><code><br />
</code></p>
<p>Agora para resumir, caso queira bloquear mais de um arquivo/diretório pode fazer assim:<br />
<code><br />
User-agent: *<br />
Disallow: /admin/ #diretorio bloqueado<br />
Disallow: /intranet/ #diretorio bloqueado<br />
Disallow: /segredos_roubados/formula_da_cocacola.doc #aqui nao, TOP SECRET.<br />
</code><br />
No exemplo acima bloqueamos o acesso completo aos diretórios &#8220;admin&#8221; e &#8220;intranet&#8221;, e também ao arquivo &#8220;formula_da_cocacola.doc&#8221;, que está dentro do diretório &#8220;segredos_roubados&#8221;, o restante dos arquivos do diretório &#8220;segredos_roubados&#8221; está livre para ser indexado pelos buscadores.<br />
E para finalizar, caso queira bloquear um determinado arquivo/diretório de apenas um buscador, basta ao invés do * em User-agent, escrever o nome do agente/buscador a ser bloqueado, assim:</p>
<p><code><br />
User-Agent: Googlebot<br />
Disallow: /admin/ #diretorio bloqueado<br />
</code><br />
Oppsss acabamos de bloquear o acesso do google ao diretório &#8220;admin&#8221;.</p>
<p> <img src='http://www.fazedordesite.com/blog/wp-includes/images/smilies/icon_biggrin.gif' alt=':D' class='wp-smiley' /><br />
Simples e eficaz.</p>
<p>Boa semana a todos!</p>
]]></content:encoded>
			<wfw:commentRss>http://www.fazedordesite.com/blog/2007/07/30/robotstxt/feed/</wfw:commentRss>
		</item>
	</channel>
</rss>

<!-- Dynamic Page Served (once) in 1.017 seconds -->
