Spam

Le spam, mot d'origine anglaise, désigne les communications électronique massives, notamment de courrier électronique, sans sollicitation des destinataires, à des fins publicitaires ou malhonnêtes.

Les mots pourriel (de « poubelle » et « courriel »), polluriel (de « pollution » et « courriel ») et merdiel (à l'étymologie transparente), ainsi que d'autres variantes formées sur des racines exprimant l'exaspération des utilisateurs, ont également été formés pour désigner le spam. Le mot pourriel est d'usage assez courant (probablement par euphonie avec pourri), polluriel est plus rarement utilisé, alors que les autres termes apparaissent ou disparaissent selon la fantaisie et l'irritation des victimes.

Le verbe spammer est souvent utilisé pour qualifier l'action d'envoyer du spam, le spamming. Le mot spammeur désigne celui qui envoie du spam. Les mots polluposter, pollupostage et polluposteur sont également utilisés.

Sommaire

Origine du mot

Image manquante
Spam.jpg

Le mot spam provient d'un sketch des Monty Python dans lequel le même mot, désignant un jambon en boîte de basse qualité, envahit la conversation et le menu d'un petit restaurant. Spam est l'acronyme de Shoulder of Pork and hAM (épaule de porc et jambon), ou selon d'autres sources Spiced Pork and hAM (porc épicé et jambon), Spiced Pork And Meat ou simplement SPiced hAM. Ce sketch parodiait d'ailleurs une des premières formes de spam. En effet c'est une publicité radiophonique pour le Spam, pendant laquelle le terme était répété de nombreuses fois, qui est à l'origine du sketch des Monty Python.

Contenu du spam

Le spam contient généralement de la publicité. Des escrocs envoient également des propositions malhonnêtes de cette façon. Les lettres en chaînes peuvent aussi être qualifiées de spam.

Les produits les plus vantés sont les services pornographiques, les médicaments, le crédit financier ou des escroqueries prétendant enrichir rapidement.

Parfois aussi il s'agit de messages d'entreprises ignorantes de la Netiquette qui y voient un moyen peu coûteux d'assurer leur promotion.

Enfin la dernière forme de spam, le phishing, consiste à tromper le destinataire en faisant passer le message pour un message de sa banque ou d'un quelconque service protégé par mot de passe. Le but est de récupérer les données personnelles des destinataires (notamment des mots de passe) en les attirant sur un site factice enregistrant toutes leurs actions.

Cibles du spam

Le spam peut s'attaquer à divers médias électroniques : les courriels, les forums de discussion de Usenet, les moteurs de recherche, les wikis, les messageries instantanées.

Par courrier électronique

Le spam par courrier électronique (pourriel) est le type de spam le plus répandu. Le coût d'envoi d'un courrier électronique étant négligeable, il est facile d'envoyer un message à des millions de destinataires. Les destinataires assument le coût de réception et de stockage en boîte aux lettres, ce qui peut causer des coûts non négligeables aux prestataires de services, à cause du volume pris par le spam.

Contrairement aux promotions commerciales pour lesquelles les utilisateurs peuvent avoir donné leur accord, le spam n'est pas sollicité. Il est souvent rédigé spécialement pour contourner les filtres anti-spam. Un mot clé tel que Viagra (souvent vanté par le spam) peut être ainsi écrit « v1@gr@ » ou « v|agra » de manière à tromper une règle de filtrage basée sur ce mot.

Les spammeurs redoublent d'imagination pour masquer leurs activités et ne pas être démasqués, que ce soit en falsifiant les adresses d'expéditeur ou en utilisant des serveurs SMTP (serveur de courrier électronique) non sécurisés qui permettent des envois anonymes.

Les adresses à spammer sont généralement collectées par robot d'indexation. Il existe un marché pour les listes d'adresses.

Pour éviter d'être spammé, les internautes font souvent figurer leur adresses d'une manière masquée lorsqu'elle doit apparâitre dans un site Web ou dans Usenet. Par exemple:

Par message de forum de discussion

Ce type de spam est apparu sur Usenet avant le spam par courrier électronique. Les forums de discussion de Usenet sont une cible facile du spam. En effet, un message envoyé à un forum touche tous les lecteurs du forum. Certains groupes de discussion ne reçoivent pratiquement plus que du spam (c'est l'une des raisons pour lesquelles de nombreux forums sont modérés, c'est-à-dire surveillés par un humain ou un robot qui effectue un tri parmi les articles proposés). D'autre part, les usenaute faisant généralement figurer leur adresse électronique dans leurs articles, les spammeurs peuvent facilement récolter des milliers d'adresses au moyen d'un robot, puis spammer les auteurs de ces articles par courrier électronique.

Le phénomène est rendu encore plus pénible et par la publication croisée ou la publication multiple, qui consistent respectivement à destiner un message à plusieurs groupes simultanément ou à envoyer le message dans plusieurs de groupes de suite.

Pour cette raison, tout message de promotion, même d'un livre, est prohibé dans les forums Usenet, à l'exception de news:alt.business.

Dans Usenet, on parle également de spam lorsqu'un article, quel que soit son contenu, et même s'il n'appartient pas aux catégories usuelles de messages abusifs (publicités commerciales, escroqueries, insultes...) est publié en un nombre d'exemplaires excessif: tous les exemplaires d'un tel article peuvent être annulés par les utilisateurs (les critères numériques exacts permettant d'identifier de tels spams dans la principale hiérarchie francophone sont donnés dans la documentation du forum news:fr.usenet.abus.d). Les diverses hiérarchies possédant des critères différents pour identifier et annuler les articles de spam, il existe une certaine incertitude quant aux traitements qui peuvent être appliqués aux spams diffusés simultanément dans plusieurs de ces hiérarchies. Une règle particulièrement simple décide du sort des escroqueries manifestes, c'est-à-dire des articles proposant de « gagner de l'argent rapidement et sans rien faire » (habituellement appelés « MMF », de l'anglais Make money fast: « gagnez de l'argent rapidement »): ces articles peuvent être annulés immédiatement par n'importe quel utilisateur.

Les actions des usenautes spécialisés dans la lutte contre le spam donnent souvent lieu à des accusations de censure et de cabale.

Par systèmes vocaux

Le développement de la voix sur IP (téléphonie par Internet) va avoir pour conséquence l'arrivée en 2005 sur nos combinés d'un nouveau type de spam, le spam vocal, baptisé SpIT (Spam over Internet Telephony).

Spamdexing

Le spam destiné aux robots d'indexation de moteur de recherche consiste à modifier des pages Web pour augmenter les chance d'avoir un bon classement dans le moteur de recherche.

Parmi les techniques utilisées :

Les opérateurs de sites de recherche comme Google cherchent toujours des moyens de détecter des trucs comme ça et les rendre plus difficiles à utiliser effectivement; si on a un tas de liens venant des sites du genre «www.ferme-aux-liens-inutiles.spam.example.com» on peut se faire enlever de l'importance dans les recherches au lieu d'en gagner.

Lutte contre le spam

Lutte technique

Les techniques pour lutter contre le spam mettent en œuvre diverses techniques de classification automatique pour trier entre le spam et le courrier légitime. Ces techniques peuvent êtres mises en œuvre soit au niveau des fournisseurs de service Internet qui protègent leur messagerie, soit au niveau des utilisateurs par des outils appropriés.

Ces techniques peuvent être soit préventives (marquage du courrier pour indiquer qu'il s'agit de spam) soit curatives (blocage, voire renvoi des messages incriminés vers l'expéditeur). À noter que cette dernière comporte des inconvénients puisque le destinataire doit pouvoir être maître des courriers qu'il souhaite recevoir. De plus renvoyer un message ne peut que faire empirer la situation en occupant un peu plus le réseau, avec de fortes probabilités que l'auteur du spam ait maquillé sa véritable adresse ou utilisé l'adresse d'un tiers (tout à fait innocent) comme adresse de retour.

Plusieurs techniques de lutte contre le spam sont possibles et peuvent être cumulées : analyse statistique (méthode bayesienne), filtrage par mots clés ou par auteur, listes blanches (désignation de personnes ou de machines autorisées à publier dans certains lieux), listes noires (désignation de personnes ou de machines auxquelles il est interdit de publier dans certains lieux), interrogation en temps réel de serveurs spécialisés dans la lutte anti-spam.

Ces techniques de lutte, tout comme les antivirus, doivent s'adapter en permanence car de nouveaux spams réussissent à contourner ces défenses.

Méthode bayesienne

Cette méthode d'analyse statistique utilise l' inférence bayésienne formulée par le mathématicien Thomas Bayes. Celle-ci permet d'associer des probabilités aux mots contenus dans les courriers. En fonction du pointage obtenu, la probabilité qu'il s'agisse vraiment de spam augmente ou diminue. Cette méthode requiert une phase d'apprentissage de mots autorisés et interdits pour être réellement efficace.

La méthode bayésienne sert également à d'autres classifications automatiques du courrier, en particulier dans Lotus Notes.

Filtrage par mots clés ou adresses

Cette méthode est très limitée car elle se base sur le rejet ou le tri du courrier en fonction de règles de vocabulaire préalablement établies, définissant des mots comme interdits. Certains mots clés revenant souvent dans le spam, tels que « sexe », « viagra » ou « money » pourront servir de base pour la constitution de ces règles. De même on pourra décider de bloquer tous les messages en provenance d'un expéditeur précis, d'un domaine spécifique, voire d'un pays entier.

Cette méthode engendre de fortes probabilités d'erreur et s'avère également peu efficace lorsque les spammeurs maquillent les mots utilisés (« vi@gr@ », « s3x », etc.). Il convient alors d'utiliser les expressions régulières.

Rendre les courriels payants

Mettre un prix sur l'envoi de courriel, symbolique pour les envois légitimes mais dissuasif pour les envois massifs (à 2 centimes d'euros par courrier, celui-ci reste toutefois du même ordre de coût pour l'expéditeur qu'une publicité radio ; or elle peut être bien mieux ciblée selon l'endroit où a été récoltée l'adresse). Et à 20 centimes d'euros il sera nécessaire de mettre une franchise sinon c'est l'accès à l'envoi de courrier pour le particulier au budget le plus serré qui commence à s'estomper.

Modération

Dans les forums Internet et Usenet, ainsi que sur les listes de diffusion, on a souvent recours à la modération: une personne de confiance (« modérateur ») lit les messages dont la publication est proposée, et refuse évenutellement de les diffuser (modération a priori); ou bien cette personne lit les messages qui ont déjà été diffusés, et efface ceux qui lui semblent hors de propos. Comme cette méthode nécessite des moyens humains importants, et que de plus les modérateurs sont souvent accusés de censurer à outrance, il existe aussi une modération par robot (généralement appelée « robot-modération »): n'importe qui peut publier un message par l'intermédiaire du robot, même si cet article est dépourvu d'intérêt (et même s'il constitue effectivement un spam), mais le robot ne laisse passer le message que s'il répond à un critère simple et connu de tous, comme la présence d'un certain mot dans son titre. Cette protection est surtout efficace contre les robots qui émettent automatiquement des messages identiques dans des dizaines de forums, et qui n'ont pas été programmés pour produire des messages conformes aux exigences spécifiques de tel ou tel forum.

Lutte judiciaire et législative

En France, le pourriel est réglementé, d'autant plus qu'il implique la possession, la conservation (et souvent le commerce) de listes d'adresses électroniques récupérées automatiquement (dans des forums de discussion, des sites Web), ce en contradiction avec la loi Informatique et libertés. Une loi impose l'accord des destinataires pour tout type d'adresse comportant le nom d'une personne.

Aux États-Unis, le spam est réglementé depuis 2003 par une loi appelée CAN-SPAM Act. Elle autorise le spam, à condition que le sujet du courrier soit descriptif, que l'adresse d'expédition soit valide et qu'une méthode de désinscription (hyperlien) soit fourni.

Dans de nombreux pays, aucune réglementation spécifique au spam n'existe.

Quelques poursuites judiciaires ont été amorcées en utilisant des lois existantes :

L'emprisonnement est rare mais cela arrive : Dave Rhodes, qui envoyait des arnaques du genre Ponzi ou « pyramide » intitulées « Make Money Fast » au début des années 1990, se retrouva en prison pour quelques années, trouvé coupable de fraude.

La République Populaire de Chine a déjà condamné à mort et exécuté des personnes dont le seul crime était l'envoi de spams.

Le plus souvent, les poursuites judiciaires qui se sont déjà déroulées étaient des procès civils coûteux amorcés par les grands fournisseurs comme AOL ou Yahoo! contre les spammeurs les plus abusifs du réseau, ceux qui envoient des millions de courriers. Le site cyberpromo.com a dû fermer ses portes à cause de poursuites judiciaires de ce genre et à cause de difficulté à trouver un fournisseur d'accès à Internet prêt à donner l'accès au réseau à une telle compagnie.

Comme le problème est international, les lois nationales ont assez peu d'effet sur le volume du spam.

Voir aussi

Articles connexes

phishing ~ Fraude 4-1-9 ~ courrier électronique ~ Nétiquette ~ Canular

Liens externes

See also: Spam, 1990, 2003, 2005, APINC, Acronyme, America online, Anglais, Araignée, Bourse