5504 links
  • GuiGui's Show

  • Home
  • Login
  • RSS Feed
  • Tag cloud
  • Picture wall
  • Daily
Links per page: 20 50 100
page 1 / 1
  • rivières de shaarlis - GuiGui's Show - Oros links

    @Oros :


    Là où j'ai besoin d'aide c'est de trouver si dans le lot, il y en a où l'erreur était temporaire ou s'ils ont changé d'URL.

    Je m'en suis occupé.



    Au début, on a 208 shaarlis marqués invalides.



    Combien y a-t-il de domaines non associées avec une IPv6 ou une IPv4 ? Boucle for + commande `host'.

    • 130 domaines n'ont pas d'adresse v4/v6. Le domaine shaarli.fr, non renouvellé donc supprimé de fr., représente 85 URLs à lui seul ;

    • 78 en ont au moins une.



    Quel contenu est pointé par ces 78 URLs ? Allons-voir avec wget --quiet --max-redirect=0 --connect-timeout=10 --tries=1 -O - (un seul essai, on tente d'établir la connexion TCP durant 10 secs maximum, on refuse les redirections HTTP). Quand on a une réponse, on grep « pubDate » afin de nous assurer qu'il s'agit d'un flux RSS (et de voir la date du dernier shaarli publié).

    • 10 shaarlis sortent avec le code retour 0. C'était donc une erreur temporaire ;

    • 15 sortent en 4 : timeout TCP. Ça peut être dû à une IPv6 foireuse. On applique un wget -4 sur cette liste : on récupère aucun shaarli, donc c'est tout des shaarlis disparus ;

    • 11 sortent en 5 : erreur x509. On utilise wget --no-check-certificate. 9 URL passent en code retour 8. 2 URLs sont des shaarlis OK avec un certificat x509 invalides ;

    • 37 sortent en 8 : erreur HTTP. + les 9 URL du point précédent. 46 URL en tout. Ça peut être une redirection. On utilise wget sans interdire la redirection + grep 'Emplacement' | tail -n 1 pour choper l'URL de destination et l'ajouter à la liste.

      • On joue wget | grep 'erreur'. On a 16 URLs OK, 30 erreurs (404, 403, 410, 500).
        • J'ai regardé les URL en erreur, j'ai remonté la racine, j'ai essayé des sous-domaines comme shaarli ou links : les shaarlis n'existent plus, sauf dans 4 cas ;

        • Parmi les 16 URLS OK, seules 7 amènent à un flux RSS shaarli. Il s'agit principalement de redirections HTTP vers HTTPS ;
    • 5 présentent un résultat qui n'est pas du RSS. J'ai vérifié à la main : soit le site web entier n'existe plus, soit je n'ai pas trouvéé de lien vers le shaarli (abandon de shaarli probable).



    Au final, dans la liste https://github.com/Oros42/shaarlis_list/blob/master/shaarlis_HS.json , seuls les shaarlis suivants fonctionnent et peuvent être ajoutés à la rivière :

    • http://lien.shazen.fr/?do=rss

    • http://lienspersos.accessibilisation.net/shaarli/?do=rss (il est en double dans la liste « shaarlis_HS.json »)

    • http://shaarli.epha.se/?do=rss

    • https://j-mad.com/shaarli/?do=rss (il est présent en HTTP et en HTTPS dans la liste « shaarlis_HS.json », la redirection HTTP => HTTPS fait tomber le site HTTP dans code retour 8). Déjà présent dans « shaarlis.json », mais passage à HTTPS ;

    • https://jcfrog.com/shaarli41/?do=rss . (il est en double, HTTP et HTTPS dans « shaarlis_HS.json »). Déjà présent dans « shaarlis.json », mais passage à HTTPS ;

    • https://warriordudimanche.net/feed.php?rss/categorie015 OU https://warriordudimanche.net/feed/rss

    • https://shaarli.hoab.fr/

    • https://shaarli.yggz.org/?do=rss

    • https://jeekajoo.eu/links/?do=rss . Déjà présent dans « shaarlis.json », mais changement du nom de domaine ;

    • https://shaarli.librement-votre.fr/?do=rss

    • https://chabotsi.fr/links/?do=rss . Déjà présent dans « shaarlis.json ». On peut aussi virer son doublon dysfonctionnel « https://chabotsi.fr/links?do=rss » ;

    • https://e-jim.be/liens/?do=rss



    Les shaarlis suivants ont besoin d'un ajustement avant de rejoindre la rivière :

    • https://shaarli.base-jump.info/?do=rss . Soit on intègre la version HTTP à la rivière, soit le certificat x509 doit être corrigé (il ne couvre pas le nom de domaine) ;

    • https://links.yosko.net/?do=rss . Certificat x509 qui ne couvre pas le nom de domaine + IPv6 HS ;

    • https://shaarli.callmematthi.eu/?do=rss . Code HTTP 410 sur les flux (RSS et Atom). Probablement une erreur de config' ;

    • https://links.green-effect.fr/?do=rss . (il est en triple, HTTP, HTTPS, URL invalide dans « shaarlis_HS.json »). IPv6 HS. Dans « shaarlis.json », on peut virer son doublon inutile « http://links.green-effect.fr/?do=rss?do=rss » ;

    • https://web.amok.lu/shaarli/?do=rss . IPv6 HS ;

    • https://ban.netlib.re/shaarli/?do=rss . IPv6 capricieuse (ne fonctionnait pas en début d'aprem, fonctionne depuis le milieu d'aprem).
    Sun 26 Apr 2020 06:32:16 PM CEST - permalink -
    - https://www.ecirtam.net/links/?Q3cjSw
Links per page: 20 50 100
page 1 / 1
Mentions légales identiques à celles de mon blog | CC BY-SA 3.0

Shaarli - The personal, minimalist, super-fast, database free, bookmarking service by the Shaarli community