Le 12 août 2014, un article du Monde titrait « Près d’un compte Twitter sur 10 est alimenté automatiquement » et attirait l’attention sur une donnée fournie par la firme elle-même : 8,5 % des comptes considérés comme actifs sont en fait alimentés de façon automatique (soit tout de même 23 millions d’utilisateurs). Et la journaliste de mentionner ce qu’elle considère comme le plus sérieux des bots : @earthquakeBot.

Auparavant Diplomatie digitale, dans son post du 13 juin, donnait quant à lui aussi une analyse des robots sur Twitter en les classifiant en 5 catégories (spammeurs, followers, RT, influenceurs et pourvoyeurs) et prenait en exemple un autre robot « vertueux » du domaine de la sismologie : @earthquakesSF (qui tweete tous les séismes de la région de San Francisco).

Il est vrai que les tremblements de terre sont une illustration de choix de l’idée qu’on se fait d’un robot vertueux car il œuvre sur le délicat sujet des catastrophes naturelles. Au moment d’une secousse sismique, la première réaction des témoins est aujourd’hui d’aller chercher de l’information sur le Net et plus particulièrement sur Twitter. Eclairons cependant les auteurs de ces articles : ce ne sont pas les robots Twitter qui « détectent » les tremblements de terre des comptes @earthquakesSF et @earthquakeBot mais bien de très classiques sismomètres. Pour être plus précis, les sismomètres de l’USGS (US Geological Survey, l’institut sismologique américain) qui met à la disposition de tous ses flux de données (vous et moi, donc). Il suffit donc d’avoir quelques basiques notions de programmation pour créer ces « robots » qui ne font que tweeter un flux XML.

Alors, existe-t-il de « vrai » robot « pourvoyeur », fondé sur un algorithme assez fin pour être capable de s’adapter à une situation réelle évolutive et de tweeter sur la durée en conséquence ? Un robot peut-il rédiger des tweets qui traduisent le ressenti de milliers d’êtres humains ?

@LastQuake, un robot conçu en France

Il semble que la sismologie inspire particulièrement les concepteurs de robots mais quand ce sont les instituts eux-mêmes qui s’y attèlent, c’est encore mieux. Tout d’abord parce que ce sont eux qui détiennent les données qui sont répercutées dans les médias traditionnels et sociaux. Ensuite parce qu’ils ont le savoir-faire et la capacité à mener des recherches qui amènent à de véritables innovations technologiques.

@LastQuake est un robot conçu par le Centre de Sismologie Euro-Méditerranéen (CSEM ou en anglais Euro-Mediterranean Seismological Centre – EMSC) basé en région parisienne. Cette ONG scientifique internationale fédère 84 instituts de sismologie dans 55 pays, au sein d’une zone qui va de l’Islande à l’Iran et du Maroc à la Russie.

La problématique qui a motivé les sismologues du CSEM au développement d’un robot Twitter était double :

  • la réactivité : impossible à un humain d’égaler un robot sur ce plan.
  • la pertinence :  si les instruments enregistrent en moyenne 35000 séismes chaque année sur le globe, seuls 1000 d’entre eux environ sont d’intérêt pour le grand public. Cet intérêt général ne dépend pas seulement d’un seuil de magnitude mais du fait que le séisme a été ressenti (car tous les séismes de forte magnitude ne sont pas ressentis, loin de là).

L’objectif du CSEM au travers de @LastQuake est donc plus ambitieux que la seule transmission d’informations sismologiques brutes (magnitude, localisation, etc) : il s’agit d’informer sur les effets des tremblements de terre.

On comprend ainsi aisément qu’un fort séisme dans une zone désertique n’a aucun impact sur les populations et tandis qu’un tremblement de terre modéré dans une zone très densément peuplé avec des bâtiments fragiles peut avoir des conséquences importantes.

Le compte a été ouvert en octobre 2010 afin de réserver le pseudo. Puis un algorithme préliminaire a été conçu par les équipes du CSEM. Le compte était alors en mode privé et réservé pour test à une communauté restreinte de sismologues. L’ouverture au public s’est faite en avril 2012. Depuis le robot a été enrichi de fonctionnalités dont cet article donne un aperçu.

Comprendre l’algorithme @LastQuake

 

LastQuake, the Twitter Robot

Internet et les réseaux sociaux ont changé la donne concernant la détection des séismes. Autrefois, l’information sismologique était fournie exclusivement par les sismomètres. La vitesse de propagation des ondes sismique étant ce qu’elle est et sachant qu’il faut un minimum de 3 stations sismiques pour proposer une information qualifiée, on comprend assez facilement que les données sismologiques sont disponibles plusieurs minutes après la secousse initiale. Actuellement, seules des régions comme le Japon, grâce à des réseaux d’une densité exceptionnelle, peuvent fournir une information sismologique en quelques dizaines de secondes.

Il ne faut en revanche que quelques secondes aux témoins des séismes pour affluer sur internet et les réseaux sociaux. Le CSEM a mis au point le flashsourcing, une méthode de détection des séismes via le trafic généré par les internautes sur son site (2e site d’information sismologique au monde après celui de l’USGS). Un afflux de connections depuis une zone géographique donnée permet de localiser un événement sismique et provoque un tweet préliminaire avant l’arrivée des données sismologiques (en une minute environ).

Dans le même temps, l’USGS a développé un robot crawler appelé TED, Twitter Earthquake Detection, qui scanne Twitter à la recherche d’une augmentation sensible de tweets contenant le terme « séisme » dans les principales langues utilisées dans le monde. @LastQuake est capable de fusionner ces données avec celles issues des instruments et du flashsourcing.

Que tweete @LastQuake ?

Type of tweets from a Twitter Robot : LastQuake

@LastQuake est capable de produire aujourd’hui une trentaine de types de tweets différents entre 1 et 90 minutes après un séisme. Un même tremblement de terre peut faire l’objet de différents tweets qui se déploient dans le temps. Le robot est aussi capable de créer des hashtags spécifiques à un événement donné.

En parallèle, si un séisme est repéré comme potentiellement générateur de tsunami, l’alerte est également transmise par @LastQuake qui est capable d’avertir ensuite si l’arrivée d’une vague est confirmée ou l’alerte levée (en collaboration avec le PTWC, Pacific Tsunami Warning Center).

Ce dispositif est par ailleurs complété par une intervention humaine. Rémy Bossu, responsable du CSEM et sismologue, intervient très régulièrement sur le compte pour interagir en temps réel avec les abonnés du compte quand nécessaire. @LastQuake fournit également des informations de base sur les séismes et peut relayer certains documents, photos ou vidéos particulièrement remarquables concernant un événement.

Exemple d’une « séquence » du robot LastQuake : le séisme de Barcelonnette en France, le 7 avril 2014

L’insertion des tweets manuels par les sismologues sont en bleus. La séquence est d’une durée totale de 40 minutes pour cet événement particulier et comprend 8 tweets automatiques et 2 tweets manuels. Les liens aboutissant à des pages aujourd’hui en erreur (404) affichaient des données en temps réel qui ont été corrigées depuis. Consultez les données finales du séisme de Barcelonnette et lisez les témoignages des personnes ayant permis la détermination de l’intensité.

  • Tweet préliminaire en provenance de la détection « flashsourcing » avec approximation de la localisation en fonction des IP entrantes sur le site. Détection réalisée en 96 secondes dans ce cas particulier. Aucune donnée sismologique disponible à ce stade (tweet F0)
  • Arrivée des premières données sismologiques (en provenance des sismomètres – premier tweet F1)
  • Appel à témoin pour détermination de l’intensité du séisme. Estimation préliminaire de la magnitude disponible en base de données mais non transmise sur Twitter. LastQuake utilise une indication qualitative (un adjectif : moderate) plutôt que quantitative (deuxième tweet F1)
  • Première analyse d’impact 11 minutes après le séisme via 84 témoignages sur le site et 34 imagettes sur smartphone (tweet Q1)
  • Réactivation de l’appel à témoin avec mise en valeur des commentaires laissés par les premiers témoins (tweet C1)
  • Au vu de la largeur de la zone d’impact, un sismologue effectue un tweet manuel avec une estimation de la magnitude considérée comme fiable
  • Mise à disposition de la carte indiquant l’épicentre et première révision de la magnitude par les sismonogues (tweet géolocalisé). A ce moment le CSEM dispose de 340 questionnaires et 107 imagettes pour son analyse d’impact. (tweet Q2)
  • Mise à disposition de la carte d’intensité macrosismique : les effets du séismes (tweet géolocalisé)
  • Tweet manuel en français puisque c’est la langue locale du séisme 
  • Carte d’intensité macrosismique révisée (tweet géolocalisé – tweet Q2 bis)

Conclusion

L’exemple de @LastQuake démontre que, certes, le phénomène des robots sur Twitter est amené à durer. Mais il est surtout la preuve que l’intervention de scientifiques dans la conception d’un robot Twitter couplée à des données exclusives permet d’aboutir à un niveau de sophistication hors normes. Spécialement quand ce compte est animé « manuellement » par ces mêmes scientifiques en complément de l’algorithme.

Au lieu de participer à une dégradation des échanges sur le web social, @LastQuake se targue de les enrichir avec de l’information parfaitement qualifiée et offre la possibilité à tout à chacun d’interagir avec des sismologues.

Enfin pour maintenir la viabilité de la technique du Flashsourcing qui est le véritable plus de ce système, le CSEM s’adapte en permanence aux usages des internautes. Dernière innovation en date : une appli smartphone « LastQuake » basée sur le même principe que le robot, avec quelques aménagements spécifiques et de nombreux services supplémentaires (y compris alertes sismiques), disponible sous iOS et Android.