L’intelligence artificielle qui génère du texte naturel dans ChatGPT fait parler d’elle. Bien que ses possibilités puissent vous étonner au premier abord, elle a des limites, telles que l’indexation par Google ou notre capacité à détecter le texte généré par ChatGPT, qui doivent être prises en compte lors de l’utilisation de cet outil.
Indexation par Google du contenu généré par ChatGPT
Lorsqu’elle est bien maîtrisée, la technologie ChatGPT peut générer un contenu de qualité suffisante pour être publié directement ou après relecture et retouche sur le web. Quelle est la position de Google à ce sujet ?
Dans ses pages relatives à la politique de lutte contre le spam dans les recherches sur le Web, Google consacre un paragraphe entier au contenu généré automatiquement. Oui, le contenu généré automatiquement par des technologies telles que GPT-3 est considéré comme du spam par Google et peut donc entraîner des pénalités. Cela inclut les textes :
- Traduits par un outil automatisé sans intervention humaine ni correction avant publication.
- Générés par des processus automatisés sans tenir compte de la qualité ou de l’expérience utilisateur.
- Générés par des techniques automatisées de synonymie, de paraphrase ou d’obfuscation.
Détection du contenu généré par ChatGPT
Il s’agit d’une question très délicate : comment détecter un contenu généré par un outil basé sur l’intelligence artificielle ? Comment un enseignant peut-il savoir qu’un contenu a été écrit par un élève et non par une machine ? Les réponses dépendent de la personne qui veut détecter ce contenu.
Si vous voulez savoir si un texte a été produit avec ChatGPT, vous pouvez essayer GPTZero ou Draft & Goal. Ce ne sont pas des solutions précises, mais elles vous aideront à détecter plus rapidement les fragments évidents. De son côté, l’éditeur lui-même travaille sur une solution permettant de détecter plus facilement les contenus générés par ChatGPT. L’un des objectifs est de lutter contre le plagiat.
Les limites de ChatGPT
La principale limite de ChatGPT est l’ancienneté de ses données. L’outil ne va pas chercher des réponses sur internet à la volée, mais utilise une base de connaissances qui n’a pas été mise à jour depuis 2021. Par conséquent, vous n’obtiendrez pas de réponses sur des événements survenus depuis cette date et les résultats peuvent être incorrects si les données ont changé.
À l’origine, les données utilisées par ChatGPT proviennent d’internet (articles, sites web, conversations publiques, etc.) ; elles ne sont donc pas parfaites et peuvent contenir des erreurs. Afin de répondre à un maximum de demandes des internautes, les données intégrées par ChatGPT couvrent un large éventail de sujets. Cependant, sa connaissance de chaque sujet est limitée, il ne peut donc pas répondre à des questions très précises sur un sujet particulier.
ChatGPT génère du contenu en se basant sur du contenu existant ; par conséquent, les résultats générés ne sont jamais complètement originaux, ce sont des variations orientées du contenu disponible.
Enfin, comme tout modèle de langage naturel, ChatGPT génère parfois des réponses grammaticalement correctes mais dénuées de sens. En fonction de son utilisation et de la qualité attendue, les réponses obtenues nécessitent très souvent une correction et des ajustements effectués par un humain.
Je m’appelle Marc. J’ai toujours été passionné par l’informatique depuis mon plus jeune âge… et la création d’Internet ! 😜 J’en ai fait mon métier puisque je travaille dans une agence de webmarketing aujourd’hui. J’adore également partagé autour de moi mes connaissances. Ce qui fait que j’ai énormément de questions de mes clients et de mes proches… Quoi de mieux qu’un blog pour lister ses interrogations et y répondre pour que cela serve au plus grand nombre !