<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Article Writing News &#187; robots.txt</title>
	<atom:link href="http://articlewritingnews.com/tag/robotstxt/feed/" rel="self" type="application/rss+xml" />
	<link>http://articlewritingnews.com</link>
	<description>Article Writing and Marketing Guide</description>
	<lastBuildDate>Sun, 12 Feb 2012 10:41:48 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3</generator>
<xhtml:meta xmlns:xhtml="http://www.w3.org/1999/xhtml" name="robots" content="noindex" />
		<item>
		<title>Use Robots.txt Wisely To Prevent Duplicate Content</title>
		<link>http://articlewritingnews.com/use-robotstxt-wisely-to-prevent-duplicate-content/</link>
		<comments>http://articlewritingnews.com/use-robotstxt-wisely-to-prevent-duplicate-content/#comments</comments>
		<pubDate>Sat, 11 Oct 2008 06:51:01 +0000</pubDate>
		<dc:creator>CJ</dc:creator>
				<category><![CDATA[Article Writing]]></category>
		<category><![CDATA[Blogging]]></category>
		<category><![CDATA[duplicate content]]></category>
		<category><![CDATA[robots.txt]]></category>
		<category><![CDATA[search engine]]></category>
		<category><![CDATA[search Engine Optimization]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[spider]]></category>

		<guid isPermaLink="false">http://articlewritingnews.com/?p=565</guid>
		<description><![CDATA[Duplicate Content is not about how many identical articles are out there on the Internet. It's about duplicate content within your own site.]]></description>
			<content:encoded><![CDATA[<table>
<tr>
<td align="left">
<a href="http://articlewritingnews.com/wp-content/uploads/2008/09/spydertat.jpg"><img src="http://articlewritingnews.com/wp-content/uploads/2008/09/spydertat-150x150.jpg" alt="" title="CJ's spydertat" width="150" height="150" class="alignleft size-thumbnail wp-image-570" /></a></p>
<td>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</td>
<td align="left">
&#84;&#104;&#101;&#114;&#101; &#97;&#114;&#101; &#115;&#111; many differing opinions &#97;&#98;&#111;&#117;&#116; &#116;&#104;&#101; issue &#111;&#102; <em>duplicate content</em>, I &#116;&#104;&#111;&#117;&#103;&#104;&#116; I &#119;&#111;&#117;&#108;&#100; revisit &#116;&#104;&#101; subject &#97;&#110;&#100; suggest a way &#116;&#111; avoid &#116;&#104;&#101; problem altogether, &#97;&#116; &#108;&#101;&#97;&#115;&#116; &#111;&#110; &#121;&#111;&#117;&#114; &#111;&#119;&#110; website.<BR>&#66;&#121; using &#116;&#104;&#101; robots.txt file &#105;&#110; &#121;&#111;&#117;&#114; root directory &#97;&#110;&#100; proper &#117;&#115;&#101; &#111;&#102; &#116;&#104;&#101; robots meta tags &#111;&#110; &#121;&#111;&#117;&#114; pages, &#121;&#111;&#117; &#99;&#97;&#110; keep &#116;&#104;&#101; search engine robots &#102;&#114;&#111;&#109; &#101;&#118;&#101;&#114; seeing &#99;&#101;&#114;&#116;&#97;&#105;&#110; pages.
</td>
</tr>
</table>
<p>According &#116;&#111; <a href="http://www.webbusinessarchitecture.com/bloggers-guide-&#116;&#111;-using-robotstxt-&#97;&#110;&#100;-robots-meta-tags-&#116;&#111;-optimize-wordpress-indexing/">Tony Murphy</a>, </p>
<blockquote><p>Search engine robots want &#121;&#111;&#117;&#114; WordPress blog content. &#84;&#104;&#101;&#121; &#97;&#114;&#101; programmed &#116;&#111; crawl &#121;&#111;&#117;&#114; site, look &#97;&#116; everything &#97;&#110;&#100; report back &#116;&#111; &#116;&#104;&#101; Master Indexer &#119;&#105;&#116;&#104; &#116;&#104;&#101;&#105;&#114; findings. &#84;&#104;&#101; Master Indexer &#116;&#104;&#101;&#110; &#109;&#97;&#107;&#101;&#115; sure &#116;&#104;&#97;&#116; &#121;&#111;&#117;&#114; content &#99;&#97;&#110; &#98;&#101; found. &#72;&#111;&#119;&#101;&#118;&#101;&#114; &#116;&#104;&#101;&#114;&#101; &#97;&#114;&#101; &#115;&#111;&#109;&#101; things &#116;&#104;&#97;&#116; robots &#105;&#110; &#116;&#104;&#101;&#105;&#114; relentless content crunching march &#115;&#104;&#111;&#117;&#108;&#100; &#110;&#111;&#116; &#104;&#97;&#118;&#101; access &#116;&#111;. &#70;&#111;&#114; example &#116;&#104;&#101; indexing &#111;&#102; duplicate content &#111;&#110; &#121;&#111;&#117;&#114; blog &#99;&#97;&#110; lead &#116;&#111; &#116;&#104;&#101; dilution &#111;&#102; &#121;&#111;&#117;&#114; blogs authority.</p></blockquote>
<p>&#65;&#115; &#121;&#111;&#117; know, &#101;&#118;&#101;&#114;&#121; category &#121;&#111;&#117; assign &#121;&#111;&#117;&#114; blog post &#116;&#111;, counts &#97;&#115; a separate page, &#97;&#115; far &#97;&#115; &#116;&#104;&#101; robots &#97;&#114;&#101; concerned. &#73;&#102; &#121;&#111;&#117; assign a post &#116;&#111; more &#116;&#104;&#97;&#110; one category, &#116;&#104;&#101;&#110; &#116;&#104;&#101; robots &#116;&#104;&#105;&#110;&#107; &#121;&#111;&#117;&#8217;ve &#103;&#111;&#116; &#116;&#104;&#97;&#116; many pages &#116;&#104;&#97;&#116; &#115;&#97;&#121; &#116;&#104;&#101; same thing. &#84;&#104;&#101; first one &#105;&#116; finds &#119;&#105;&#108;&#108; &#98;&#101; given more weight &#116;&#104;&#97;&#110; &#116;&#104;&#101; others, &#97;&#110;&#100; &#116;&#104;&#97;&#116;&#8217;s &#97;&#98;&#111;&#117;&#116; &#97;&#115; far &#97;&#115; &#105;&#116; goes &#102;&#111;&#114; being &#8220;penalized.&#8221; &#87;&#104;&#101;&#110; &#121;&#111;&#117;&#114; blog &#105;&#115; &#102;&#97;&#105;&#114;&#108;&#121; &#110;&#101;&#119;, &#116;&#104;&#105;&#115; really isn&#8217;t &#97;&#115; &#98;&#105;&#103; a problem &#97;&#115; &#105;&#116; &#119;&#105;&#108;&#108; &#98;&#101; &#119;&#104;&#101;&#110; &#105;&#116; gets a &#108;&#105;&#116;&#116;&#108;&#101; older &#97;&#110;&#100; &#98;&#105;&#103;&#103;&#101;&#114;. Duplicate content pages &#106;&#117;&#115;&#116; tend &#116;&#111; &#115;&#108;&#111;&#119; things down, &#97;&#115; far &#97;&#115; &#121;&#111;&#117;&#114; page ranking goes.</p>
<p>&#66;&#121; blocking &#99;&#101;&#114;&#116;&#97;&#105;&#110; pages, categories &#97;&#110;&#100; even directories, &#105;&#102; &#116;&#104;&#101; robots never see &#116;&#104;&#101; duplicate content, &#121;&#111;&#117; won&#8217;t &#98;&#101; &#8220;penalized.&#8221; &#65;&#110;&#121; &#111;&#116;&#104;&#101;&#114; sites out &#116;&#104;&#101;&#105;&#114; &#116;&#104;&#97;&#116; &#104;&#97;&#118;&#101; &#121;&#111;&#117;&#114; content &#105;&#115; a different &#115;&#116;&#111;&#114;&#121;, &#111;&#102; course. &#84;&#104;&#105;&#115; advice &#111;&#110;&#108;&#121; concerns &#121;&#111;&#117;&#114; &#111;&#119;&#110; website, &#119;&#104;&#101;&#114;&#101; &#121;&#111;&#117;&#114; articles &#115;&#104;&#111;&#117;&#108;&#100; &#98;&#101; posted first, prior &#116;&#111; sending out &#116;&#111; article directories &#97;&#110;&#100; &#111;&#116;&#104;&#101;&#114; places. Remember, &#116;&#104;&#101; first instance &#111;&#102; a page &#116;&#104;&#97;&#116; &#116;&#104;&#101; robots find &#119;&#105;&#108;&#108; &#98;&#101; given &#116;&#104;&#101; &#109;&#111;&#115;&#116; weight. I &#104;&#97;&#118;&#101; &#115;&#97;&#105;&#100; &#97;&#108;&#108; along, post &#121;&#111;&#117;&#114; articles &#116;&#111; &#121;&#111;&#117;&#114; &#111;&#119;&#110; site first, wait until &#116;&#104;&#101; spiders &#104;&#97;&#118;&#101; indexed &#121;&#111;&#117;&#114; page, &#116;&#104;&#101;&#110; submit &#105;&#116; &#116;&#111; &#111;&#116;&#104;&#101;&#114; sites.</p>
<p>&#84;&#111; &#99;&#114;&#101;&#97;&#116;&#101; a robots.txt file, &#97;&#108;&#108; &#121;&#111;&#117; need &#105;&#115; a text editor (&#108;&#105;&#107;&#101; Notepad). Open up a &#110;&#101;&#119; page, copy &#97;&#110;&#100; paste &#116;&#104;&#101; code below &#97;&#110;&#100; save &#116;&#104;&#101; file &#97;&#115; robots.txt. &#84;&#104;&#101;&#110; upload &#116;&#104;&#101; file &#116;&#111; &#116;&#104;&#101; root directory &#111;&#102; &#121;&#111;&#117;&#114; website (&#116;&#104;&#101; root directory &#105;&#115; &#116;&#104;&#101; public_html directory, &#119;&#104;&#101;&#114;&#101; www.<i>your_website.com</i> resides.</p>
<blockquote><p>User-agent: *<br />
Disallow: /wp-admin<br />
Disallow: /wp-includes<br />
Disallow: /wp-content/plugins<br />
Disallow: /wp-content/cache<br />
Disallow: /wp-content/themes<br />
Allow: /wp-content/uploads</p></blockquote>
<p>&#76;&#101;&#116;&#8217;s look &#97;&#116; each &#111;&#102; those lines.
<ul>
<li>
User-agent &#105;&#115; &#116;&#104;&#101; robot/spider. &#84;&#104;&#101; &#8220;*&#8221; means &#8220;&#97;&#110;&#121;&#8221; spider &#102;&#114;&#111;&#109; &#97;&#110;&#121; search engine. &#89;&#111;&#117; &#99;&#97;&#110; specify particular search engines, &#98;&#117;&#116;, &#102;&#111;&#114; &#116;&#104;&#105;&#115; purpose, &#121;&#111;&#117; &#119;&#105;&#108;&#108; want &#116;&#111; &#116;&#101;&#108;&#108; &#65;&#76;&#76; spider/robots &#116;&#111; &#100;&#111; &#116;&#104;&#101; same thing.</li>
<li>Disallow: &#8211; Tells &#116;&#104;&#101; robot/spider &#119;&#104;&#101;&#114;&#101; &#105;&#116; &#105;&#115; &#78;&#79;&#84; allowed &#116;&#111; &#103;&#111;.</li>
<li>/wp-admin, /wp-includes, /wp-content/plugins, /wp-content/cache, /wp-content/themes &#8211; &#116;&#104;&#101;&#115;&#101; &#97;&#114;&#101; directories &#116;&#104;&#97;&#116; &#116;&#104;&#101; robot/spider &#105;&#115; &#110;&#111;&#116; allowed &#116;&#111; visit. &#87;&#104;&#105;&#108;&#101; &#115;&#111;&#109;&#101; &#111;&#102; &#116;&#104;&#101;&#115;&#101; &#104;&#97;&#118;&#101; nothing &#116;&#111; &#100;&#111; &#119;&#105;&#116;&#104; &#116;&#104;&#101; duplicate content issue, nevertheless, &#116;&#104;&#101;&#121; &#97;&#114;&#101; &#115;&#111;&#109;&#101; places &#116;&#104;&#97;&#116; &#116;&#104;&#101; robots/spiders &#106;&#117;&#115;&#116; don&#8217;t need &#116;&#111; &#103;&#111;. &#78;&#111; one needs &#116;&#111; know &#119;&#104;&#97;&#116; plugins &#121;&#111;&#117; &#97;&#114;&#101; using, &#102;&#111;&#114; instance.</li>
<li>Allow: /wp-content/uploads &#8211; &#116;&#104;&#105;&#115; command line &#119;&#105;&#108;&#108; allow &#116;&#104;&#101; robots &#116;&#111; spider &#97;&#110;&#100; index &#121;&#111;&#117;&#114; uploads directory. &#73;&#70; &#116;&#104;&#101;&#114;&#101; &#105;&#115; something &#105;&#110; &#116;&#104;&#101;&#114;&#101; &#121;&#111;&#117; &#100;&#111; &#110;&#111;&#116; want indexed (download pages, &#102;&#111;&#114; instance), change Allow &#116;&#111; Disallow.</li>
</ul>
<p>&#65;&#115; &#102;&#111;&#114; individual pages, &#121;&#111;&#117; &#99;&#97;&#110; include a meta tag writeen specifically &#102;&#111;&#114; &#116;&#104;&#101; robots &#116;&#111; find &#97;&#110;&#100; pay attention &#116;&#111;. &#84;&#104;&#101;&#115;&#101; &#97;&#114;&#101; &#121;&#111;&#117;&#114; options:</p>
<p>&lt;META NAME=&#8221;ROBOTS&#8221; CONTENT=&#8221;NOINDEX, NOFOLLOW&#8221;&gt;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&#84;&#104;&#105;&#115; tells &#116;&#104;&#101; robots &#110;&#111;&#116; &#116;&#111; index &#116;&#104;&#101; particular page &#105;&#116; finds &#116;&#104;&#105;&#115; instruction &#111;&#110; &#97;&#110;&#100; &#116;&#111; &#110;&#111;&#116; follow &#97;&#110;&#121; links leading away &#102;&#114;&#111;&#109; &#116;&#104;&#101; page.<br />
&lt;META NAME=&#8221;ROBOTS&#8221; CONTENT=&#8221;NOINDEX, FOLLOW&#8221;&gt;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&#84;&#104;&#105;&#115; tells &#116;&#104;&#101; robots &#110;&#111;&#116; &#116;&#111; index &#116;&#104;&#101; page, &#98;&#117;&#116; &#116;&#111; &#103;&#111; ahead &#97;&#110;&#100; follow &#116;&#104;&#101; links out &#111;&#102; &#116;&#104;&#101; page.<br />
&lt;META NAME=&#8221;ROBOTS&#8221; CONTENT=&#8221;INDEX, NOFOLLOW&#8221;&gt;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&#84;&#104;&#105;&#115; tells &#116;&#104;&#101; robots &#116;&#111; index &#116;&#104;&#101; page, &#98;&#117;&#116; &#78;&#79;&#84; &#116;&#111; follow links out &#111;&#102; &#116;&#104;&#101; page.<br />
&lt;META NAME=&#8221;ROBOTS&#8221; CONTENT=&#8221;INDEX, FOLLOW&#8221;&gt;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&#65;&#110;&#100; lastly, &#116;&#104;&#105;&#115; tells &#116;&#104;&#101; robots &#116;&#111; both index &#116;&#104;&#101; page &#65;&#78;&#68; follow links out &#111;&#102; &#105;&#116;.</p>
<p>&#89;&#111;&#117; see, &#116;&#104;&#101; issue &#111;&#102; duplicate content &#105;&#115; &#78;&#79;&#84; &#97;&#98;&#111;&#117;&#116; &#104;&#111;&#119; many websites out &#116;&#104;&#101;&#114;&#101; &#104;&#97;&#118;&#101; &#116;&#104;&#101; same content. &#78;&#111;, &#110;&#111;,&#110;&#111;! &#73;&#116;&#8217;s &#97;&#98;&#111;&#117;&#116; duplicate content &#111;&#110; pages <strong>within &#116;&#104;&#101; same website</strong>! &#65;&#110;&#100; &#105;&#102; &#121;&#111;&#117; blog, &#97;&#110;&#100; categorize &#121;&#111;&#117;&#114; posts &#116;&#111; more &#116;&#104;&#97;&#110; one category, &#116;&#104;&#101;&#110; &#121;&#111;&#117; &#97;&#114;&#101; &#99;&#114;&#101;&#97;&#116;&#105;&#110;&#103; duplicate pages (&#116;&#104;&#101; single post pages) &#97;&#110;&#100; Google &#119;&#105;&#108;&#108; penalize &#121;&#111;&#117; &#102;&#111;&#114; &#116;&#104;&#97;&#116;.</p>
<p>&#73;&#116;&#8217;s still a &#103;&#111;&#111;&#100; &#105;&#100;&#101;&#97; &#116;&#111; post &#97;&#110; article &#116;&#111; &#121;&#111;&#117;&#114; website before &#121;&#111;&#117; send &#105;&#116; out &#116;&#111; &#116;&#104;&#101; article directories, &#98;&#117;&#116; &#116;&#104;&#97;&#116;&#8217;s &#110;&#111;&#116; &#97;&#115; &#98;&#105;&#103; &#97;&#110; issue&#8211;&#97;&#110;&#100; &#116;&#104;&#105;&#115; &#105;&#115; <em>according &#116;&#111; Google!</em></p>
<script type="text/javascript" class="owbutton" src="http://www.onlywire.com/btn/button_861" title="Use Robots.txt Wisely To Prevent Duplicate Content" url="http://articlewritingnews.com/use-robotstxt-wisely-to-prevent-duplicate-content/"></script>]]></content:encoded>
			<wfw:commentRss>http://articlewritingnews.com/use-robotstxt-wisely-to-prevent-duplicate-content/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
	</channel>
</rss>

