News Reader (New: 0)

Read All
Unread All
Show short preview
X

CapSEO
Home
Magazine
Discussions
Videos
Events
Job Posts
Connexion
Email
Password


Forgot password? Join us!
Création d’un fichier « robots.txt »
Published on 2/4/2010, 16:50 Last Update: 2 year(s) ago by Aymen Khalifa
Category: All topics » Moteurs de recherche
  • C’est quoi un robots.txt ?

Le robots.txt ou appelé aussi fichier d'exclusion des robots, est une ressource de format texte qui peut être placée à la racine de votre site. Ce fichier contient une liste des instructions destinées aux moteurs.
Ce fichier vous permet de laisser des instructions aux spiders comme :

  • Bloquer l'accès de votre site à certains robots
  • Ne permet pas l'examen de certaines pages de votre site aux spiders
  • Interdire l'exploration de certaines pages à certains spiders
  • Créer un « robots.txt »

Pour créer un fichier robots.txt, il faut commencer par créer un fichier texte, le nommer robots.txt (attention au pluriel et de le nommer en minuscule) et le placer à la racine de votre site Web. Il ne peut exister qu'un seul fichier robots.txt sur un site. La structure d'un fichier robots.txt est la suivante :


User-agent: { nom du robot }
Disallow: { document-a-exclure }


User-agent

User-agent: { nom du robot } :> accès accordé à un robot précis.

User-agent: * => accès accordé à tous les robots


Disallow

 

  • Disallow:  => c’est l’équivalent du non existence du fichier robots.txt, il indique au robot que tous doit être indexer.
  • Disallow:  / => bloquer le site dans son intégralité
  • Disallow: /exemple => ne permet pas l'indexation ni de http://www.monsite.com/exemple/index.html, ni de http://www.monsite.com/exemple.html (n’indexe pas tous le contenu du repertoire exemple).
  • Disallow: /exemple/ => ne permet pas d’indexer http://www.monsite.com/exemple/index.html, mais par contre le robot peut indexer http://www.monsite.com/exemple.html.
  • User-agent: Googlebot-Image
    Disallow: /

=> Supprimer toutes les images de votre site de Google Recherche d'images


La liste de de certains robots


Outil de recherche:     User-Agent de l'outil

Google                                    googlebot
Alta Vista                                   Scooter
Infoseek                         InfoSeek Sidewinder
Excite                                    ArchitextSpider
Lycos                              Lycos_Spider_(T-Rex)
Northern Light                         Gulliver


Si vous avez des problèmes pour créer le fichier robots.txt, vous pouvez le générer facilement en utilisant l’outil Google pour les webmaster. http://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=156449

Source : abondance

Share |
Views: 934 views    Report Inappropriate Content
All topics
Chiffres  (18 articles)
Bilans & Prévisions (1 article)
Etudes & Statistiques (16 articles)
Moteurs de recherche  (31 articles)
Autres (1 article)
Bing (1 article)
Google (27 articles)
Référencement  (199 articles)
Naturel (75 articles)
Payant (13 articles)
Social (75 articles)
Universel (vidéos, images, géolocalisé...) (8 articles)
Webmarketing  (35 articles)
Affiliation (5 articles)
Display (1 article)
Emailing (1 article)
Browse Articles
Tags: spider robots.txt robots moteur de recherche Disallow User-agent créer robot.txt
La revue de presse SEO de la semaine 17
Published on 29/4/2011, 11:37
Google est-il vraiment intouchable ?
Published on 5/5/2010, 12:14
Top Mots Clés 2009 sur Twitter
Published on 21/12/2009, 09:12
Quelques conseils pour réussir mon référencement ?
Published on 5/11/2009, 14:25
comment améliorer le référencement?
Published on 30/10/2009, 10:19
Copyright © 2012 CapSEO All rights reserved.
FAQ
RSS Feed
Terms of Service
Contact Us

There was an error processing the request. Please try again.
  Login via Facebook?

You are currently logged in to Facebook. Would you like to autologin to CapSEO?


   or Cancel