Analyse sémantique latente (LSA) versus Topicalisation

Analyse-sémantique-latente

Nous allons tenter de dissiper une certaine confusion sur la relation entre l’analyse sémantique latente (LSA) et le principe de Topicalisation.

L’analyse sémantique latente (LSA)

L’idée sous-jacente de l’analyse sémantique latente est qu’en exploitant des énormes corpus de millions de pages Web (tout simplement des index), les moteurs de recherche peuvent « apprendre » comment les termes sont interconnectés les uns aux autres, et quels concepts nominaux les relient entre eux.

Par exemple, en utilisant LSA un moteur de recherche comprendra qu’un voyage en Afrique inclura très probablement l’observation de la faune et des animaux sauvages, éventuellement dans le cadre d’un safari.

Maintenant, effectuez une recherche sur Google pour la requête voyage safari. Vous noterez que les mots qui apparaissent en gras dans les SERP correspondent aux termes mis en italique dans le paragraphe ci-dessus. Google met en gras les termes connexes et reconnaît ceux qui apparaissent fréquemment en même temps que la requête soumise dans son index (ensemble, sur la même page ou à proximité dans le contexte sémantique).

Malgré la puissance de ce processus, certaines formes de LSA sont trop coûteuses en terme de volume de calculs à réaliser. Beaucoup de systèmes de modélisation ne sont pas assez intelligents pour « apprendre » comme le font certains réseaux de neurones plus complexes à déployer. Par exemple, il a toujours été difficile pour Google de comprendre uniquement en se basant sur son index que les zèbres et les tigres sont tous deux des animaux à rayures, même s’il peut se rendre compte que rayures et zèbre sont plus liés sémantiquement que canards et rayures.

La Topicalisation

La Topicalisation est un terme inventé par les experts SEO. Il est souvent évoqué pour mettre en exergue la proximité lexicale des contenus ou des pages à optimiser : choisir une page « thématisée » pour générer un lien plutôt qu’une page généraliste. Google a créé le concept de recherche par thème pour être capable de classer les sites Web en fonction de leurs contenus ou de leurs liens, et ceci dans différentes thématiques identifiées grâce à une catégorisation générale de la toile.

Pour aller plus loin, voir également la page Wikipedia dédiée à l’Analyse sémantique latente

PULSEM

Fondée en 2013 par un Consultant spécialisé en référencement naturel (SEO) et payant (SEA), Pulsem est une agence Search indépendante. Nous accompagnons des entreprises dans l'optimisation de leur visibilité sur les pages de résultats des moteurs de recherche. Nos locaux sont situés au cœur de Paris, dans le 4e arrondissement.

Contacts

PULSEM - Téléphone : 01 88 32 84 92
30-32 boulevard de Sébastopol
75004 Paris

Tweets