En sus de la presse que j'ai sélectionnée, j'utilise parfois Google News / Actualités afin de visualiser rapido ce que raconte la presse Moldue, celle qui « fait l'opinion », paraît-il. Ça me permet de récupérer des faits (nombre de manifestants dans tel cortège selon la police ou date de tel raout gouvernemental, par exemple). Ça me permet également de visualiser quels sujets sont traités (ou non) et sous quel angle ils le sont. Ça en dit long, ça permet d'orienter des luttes, et ça permet de diffuser autour de soi les infos manquantes.
Mais Google est une multinationale en situation de quasi-monopole qui est sans foi ni loi ni éthique, etc. Quelle alternative éthique à Google News ?
Meta-press.es est une extension Firefox en logiciel libre (GPL) qui propose une alternative à Google News / Actualité. Elle est un moteur de recherche décentralisé et auto-hébergé pour la presse. Elle affiche le titre principal de chaque journal (actualisé en permanence) et elle permet de rechercher des mots-clés dans un ensemble de journaux (et au-delà, genre dans des revues scientifiques). L'utilisateur peut choisir le sous-ensemble de médias dans lesquels chercher. Critères disponibles : langue, type, thématique, couverture géographique, etc.
Pratique pour ne pas se faire renifler le cul par Google. Google affiche de la publicité. Google affiche les résultats qu'il veut bien afficher (car tel sujet crée plus d'engagement des lecteurs donc augmente les revenus publicitaires). Google affiche des résultats différents pour une même recherche en fonction de l'utilisateur et de l'ordinateur, etc. Tout cela n'existe pas avec Meta-press.es.
Pratique pour effectuer une revue de presse sans recourir à Google.
Techniquement, il s'agit d'un méta-moteur de recherche : il utilise le moteur de recherche interne à chaque média comme un humain le ferait. Il n'y a pas de processus d'indexation.
Même si son utilisation est intuitive, sa documentation est par là.
Il est possible d'ajouter de nouveaux médias dans lesquels l'extension ira piocher (voir la doc). Cela nécessite de manier l'onglet « réseau » des outils de développement de Firefox afin d'identifier si le média utilise RSS/Atom, le top car automatisable, ou XHR (XMLHttpRequest) + JSON (le type se voit dans l'onglet « Réponse » quand on clique sur une requête) ou du simple HTML moins top (qu'il faudra demander à Meta-press.es d'analyser avec les sélecteurs CSS ou XPath). Pour identifier cela facilement, clique droit sur le nom des colonnes de l'onglet réseau -> « Délais » -> « Début » puis trie sur la colonne « Début » afin d'identifier au fil de l'eau les requêtes récentes. Si les résultats se chargent après le chargement de la page dans un widget au milieu de la page, alors il y a du XHR et du JSON dans l'air. Trie les requêtes par source afin d'identifier plus facilement les appels XHR. Si la page se recharge entièrement à chaque recherche (et que son type est HTML), alors il faudra utiliser les sélecteurs CSS. Si HTML, il faut une bonne dose de patience pour lire le code HTML merdique des sites web des médias (qui, sur ce point, ne diffèrent pas des autres sites web). Pour contrer cela, je recommande vivement d'utiliser l'onglet « inspecteur » des outils de dév' ou un programme qui formate et indente proprement le HTML comme tidy -i
ou l'outil en ligne HTML formatter.
Via la liste de discussion de La Quadrature du Net, association de défense des libertés.