En général, le Googlebot essayera de remplir et de valider les formulaires d’une page, afin de découvrir du nouveau contenu et de nouvelles URLs qui ne sont pas directement visibles autrement.
Google décidera individuellement si un élément FORM d’une page semble être utile et essayera ensuite de le remplir en utilisant un petit nombre de requêtes naturelles diverses, faites pour simuler un véritable utilisateur.
Google n’indexe que les formulaires qui utilisent la méthode GET et ne demande pas d’informations personnelles. De plus, le formulaire ne doit pas contenir plus de deux champs de données.
Comment puis-je rendre le contenu derrière mes formulaires accessible à Google ?
Pour cela, il faut concevoir les formulaires de telle sorte que le Googlebot puisse les remplir et parcourir leur contenu. Cependant, c’est impossible de forcer le Googlebot à indexer le contenu. Un texte pertinent à proximité de l’élément FORM, qui décrit la raison de ce formulaire, peut aussi être utile.
L’utilisation de ce que l’on appelle l’AutoCompleteType-Attribute n’aide pas le Googlebot à remplir le formulaire, mais est utile pour les utilisateurs.
Pour être sûr de ne pas être complètement dépendant de l’indexation des formulaires, il faudra lier toutes les pages derrière ces derniers entre elles, et avoir au moins une de ces pages accessibles via la page d’accueil du domaine. Il faudra aussi faire un plan de site HTML – ou XML – disponible pour toutes les pages qui sont accessibles via les formulaires, pour que Google puisse toutes les trouver plus facilement.
Vidéo explicative de Matt Cutts / Google sur le sujet
Comment Google trouve-t-il les pages qui ne possèdent aucun lien vers elles ?
Comment le Googlebot peut-il parcourir et indexer les pages qui ne possèdent aucun lien pointant sur elles dans mon site web ? Je trouve tous les jours deux ou trois pages dans l’index qui n’ont pourtant aucun lien vers elles sur mon site. Les pages sont générées par le champ de recherche de mon site web.