Le crawling est la collecte du contenu lexical d’une page et l’identification des centres d’intérêt des internautes.
Pour la classification des mots du Web, des Parsers (robots) parcourent la page et identifient le contenu pertinent des mots à l’aide du TAL (Traitement Automatique du langage).