Technique de black hat SEO, le scrap désigne le fait de copier un contenu depuis un autre site web pour l’utiliser à des fins de traitement interne.
Le Scraping, ou «web scraping», est le processus d’extraction de grandes quantités d’informations d’un site Web. Cela peut impliquer le téléchargement de plusieurs pages Web ou du site entier. Le contenu téléchargé peut inclure uniquement le texte des pages, le code HTML complet ou à la fois le code HTML et les images de chaque page.
Il existe de nombreuses méthodes pour Scraping un site Web. Le plus élémentaire est le téléchargement manuel des pages Web. Cela peut être fait soit en copiant et en collant le contenu de chaque page dans un éditeur de texte, soit en utilisant la commande Fichier → Enregistrer sous… de votre navigateur pour enregistrer des copies locales de pages individuelles. Le Scraping peut également être effectué automatiquement à l’aide d’un logiciel de Scraping Web. C’est le moyen le plus courant de télécharger un grand nombre de pages à partir d’un site Web.
Le scraping Web peut être effectué à plusieurs fins différentes. Par exemple, vous souhaiterez peut-être archiver une section d’un site Web pour un accès hors ligne. En téléchargeant plusieurs pages sur votre ordinateur, vous pouvez les lire ultérieurement sans être connecté à Internet. Le scraping peut également être effectué à des fins illégales, telles que la copie d’un site Web et sa republication sous un autre nom. Ce type de scraping est considéré comme une violation du droit d’auteur et peut entraîner des poursuites judiciaires.
Bien que le scraping d’un site Web dans le but de republier des informations soit toujours erroné, le scraping d’un site à d’autres fins peut toujours enfreindre les conditions d’utilisation du site Web. Par conséquent, vous devez toujours lire les conditions d’utilisation d’un site Web avant de télécharger du contenu à partir du site.