Utilisateur:Pmartin/Cache

Une page de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
WiKiwix   Wikipediaondvd   Cache

PDD en cours : Discussion Wikipédia:Prise de décision/Système de cache
Présentation du projet cache.

Depuis quelques mois, Linterweb a entrepris un travail sur les liens externes de fr.wikipedia.org Pour l'instant, cela prend la forme de remontée de ces liens au sein de wikiwix.com. Afin d'étudier la qualité de ces liens, nous nous aventurons dans la conception d'un moteur de recherche contenant ces liens. C'est ainsi que nous nous sommes aperçus que beaucoup d'entre eux était en erreur 404 (c'est-à-dire que les pages n'existaient plus), soit environ 5 %.


Parallèlement à notre travail, nous nous sommes aperçus qu'une partie de la communauté, dont le Projet:Correction des liens externes, travaillait d'arrache-pied sur la question et qu'une solution consistait à fournir un cache pour les liens externes.


Un cache est un outil de sauvegarde de données qui est utilisé par les moteurs de recherche et aussi par des sites comme internet archive. D'un point de vue de la légalité d'une telle sauvegarde, il semblerait qu'elle respecte le code html "no-archive" avant de sauvegarder le contenu. Le dossier est en cours d'étude par mon avocat spécialisé NTIC.

align


Pour tester le fameux cache et nous permettre de savoir si un tel outil a de l'avenir au sein de Wikipedia, je vous invite donc à tester le cache en plaçant importScript("User:Pmartin/cache.js"); dans votre monobook et à venir nous faire part de vos remarques sur cette page.


Cela ajoute à côté de chaque lien externe un petit lien vert vers la page mise en cache par wikwix. Voici un exemple pris au hasard de cache.


L'intérêt du cache consiste à rendre fiables les sources internet de sorte qu'elles ne finissent pas en erreur 403, 404, 410 ou 500 lorsque le site est déplacé, supprimé, etc.


Cet outil n'est pas intrusif, c'est-à-dire qu'il ne fait pas de requêtes sur les serveurs de Wikiwix lorsqu'un internaute visionne un article de Wikipedia.


De plus seulement les liens externes contenu dans le namespace 0, c'est-à-dire celui des articles, sont mis en cache.


Lors de la suppression d'un lien externe dans un article, celui-ci sera effacé du cache de façon automatique après vérification que celui-ci n'est plus lié à aucun article.


Il y a la possibilité de désactiver le cache en ajoutant no_external_cache = true; à votre monobook.


Cordialement, Pmartin (d) 19 août 2008 à 14:53 (CEST) et Dodoïste [réveille-moi] 21 août 2008 à 06:50 (CEST)

Mais les liens que j'ai indiqué dans la page concernant Victor Ernst NESSLER, renvoient à mon site Généanet personnel..... et je suis d'accord pour qu'on y accède ! Alors, y a-t-il moyen de supprimer ce cache ? Que doit-on faire ? Tout cela devient bien compliqué, savez-vous ! Cordialement. Jean-Pierre BERNARD.

C'est pas bien que ce message « Vous êtes en train de consulter une version archivée de cette URL.

Elle apparaît ci-dessous telle qu'elle était lorsqu'elle elle a été insérée comme lien externe dans Wikipedia.

Vous trouverez des informations et pouvez donner votre opinion sur le cache sur cette page. | Si vous souhaitez interdire la mise en cache de ce site, merci d'utiliser le formulaire de blocage de site. » reste toujours présent quelque soit où l'on navigue dans la page. J'ai essayé de le faire disparaitre ce message avec l'extension firefox « element hiding helper pour adblock plus » mais ça efface le message et le contenu de la page. Merci de faire en sorte que ça change.

C'est pas bien, il y a des pages qui ne sont plus présente dans archive.wikiwix.com, alors que ça dérange. Sans le consentement, la page disparait, c'est peut-être un abus de censure du net par l'homme qui interdit au bot de travailler pour la sauvegarde du contenu du net. MerveillePédia dial. 18 janvier 2014 à 14:40 (CET)
Grand bandeau qui gêne, des archives fait par wikiwix.com. Ce bandeau c'est toujours affiché avant le 19 janvier 2014.
@Pmartin il existe un lien pour interdire la mise en cache par wikiwix. Et il y a une page de données météo, qui me semble suspecte pour sa disparition de wikiwix.com. C'est vraiment pas bien, on ne connaît pas la raison de la non disponibilité d'une page en archive de wikiwix.com. Et puis internet est mal fait, par exemple en clic de nombreuses fois sur un lien Youtube en s'attendant à voir une vidéo est à la place on un message « droit d'auteur donc pas visionnable » « payant donc pas visionnable », ça fait perdre du temps, j'en voie pas l'intérêt, peut-être qu'il n'est pas possible de faire autrement.
Merci de coder différement afin que ce grand bandeau ne dérange plus.
Est-ce qu'on pourrait faire par exemple un détecteur de lien mort, par exemple un lien avec un contenu que l'on ne peut plus voir s'affiche en police orange au lieu de bleu afin de ne pas cliquer sur un lien mort (gain de temps pour l'internaute) ? MerveillePédia dial. 20 janvier 2014 à 10:56 (CET)
Ce bandeau contient les informations légales ( lien qui permet de retourner à la page d'origine, informations expliquant aux internautes qu'il n'est pas sur la page qui a généré le contenu ), il n'est pas là pour être joli mais plutôt pour être sans équivoque. Le seul cas où nous retirons de la data des archives c'est quand le propriétaire fait exercer son droit de retrait, donne moi le lien (soit vers wikiwix soit vers le site de météo ) et je regarderai . Si une source devient payante s'est indépendamment de ma volonté mais elle en reste néanmoins source et permet aux utilisateurs d'y accéder quand même. Le système que tu évoques de coloration des liens serait intrusif pour la communauté wikipedia, c'est à dire qu'à chaque requête sur une page, il y aurait plein de demande vers wikiwix pour connaitre l'état du lien, ce qui ralentirai l'affichage des pages. J'espère avoir répondu à tes questions, et mes excuses du délai de réponses mais j'avais zappé ton message car il est tombé en plein dans mon déménagement :) --Pmartin (discuter) 26 mars 2014 à 04:39 (CET)

Je ne comprends rien à ce Bot[modifier | modifier le code]

sinon qu'il me bousille mon travail et le lien externe dans l'article Heidegger et Aristote vers Persée http://www.persee.fr/web/revues/home/prescript/article/phlou_0035-3841_1989_num_87_76_6579. Les inventeurs de ces joujous devraient comprendre que tous les intervenants ne maîtrisent pas l'informatique et que le les instructions de correction ( Il y a la possibilité de désactiver le cache en ajoutant no_external_cache = true; à votre monobook.) restent un jargon inutilisable. Je suis fatigué d'avoir à me battre avec ces petits génies. Merci de m'en dispenser --Gerard-emile (discuter) 7 janvier 2015 à 05:01 (CET)

Bonjour, le service d'archivage de lien externe est en maintenance, les disques durs arrivaient à saturation. Du coup, nous ne stockons plus temporairement le contenu des liens, c'est la raison pour laquelle le message "Le cache est actuellement en lecture seule" s'affiche. Le problème sera résolu avant la fin Janvier, j'ai les nouveaux disques durs, mais ils ne sont pas compatibles avec la carte sur laquelle je dois les brancher. Cette carte est en attente de réception. Une fois que cette carte sera monté nous récupérons le retard engendré par la non sauvegarde automatique Cordialement --Pmartin (discuter) 7 janvier 2015 à 10:26 (CET)

Blocage de liens avec le cache[modifier | modifier le code]

Bonjour Pmartin,

Je suis entrain de travailler sur l'article Laurent Fignon et depuis, peu un grand nombre des liens sont bloqués par le cache et je ne sais pas comment faire pour permettre à nouveau que ces liens soient consultables depuis l'article. Merci. Cordialement. Bebel92 (discuter) 27 août 2016 à 10:06 (CEST)

Notification Bebel92 : tu as un exemple plus parlant ? Pmartin (discuter) 27 août 2016 à 11:20 (CEST)
Notification Pmartin : J'ai utilisé pour sourcer l'article, le site des archives de la Gazette de Lausanne et du Journal de Genève. Depuis quelques jours, je n'arrive plus à accèder aux liens depuis l'article, apparemment à cause du cache. Voici un exemple ([1]). Bebel92 (discuter) 27 août 2016 à 15:50 (CEST)
Je viens de me rendre compte de mon erreur, c'est en cliquant sur archive du lien que ça coince, mais pas sur le lien en lui-même. Au temps pour moi, merci quand même. Bebel92 (discuter) 27 août 2016 à 15:56 (CEST)
Notification Bebel92 : j'ai regardé la page en archive, et tenté d'améliorer le rendu de celle - ci, mais c'est impossible car la technologie utilisé pour afficher les images est du HTML5 :( Pmartin (discuter) 3 septembre 2016 à 11:43 (CEST)
Notification Pmartin : Merci pour tes recherches. Cordialement. Bebel92 (discuter) 4 septembre 2016 à 15:23 (CEST)

Page blanches[modifier | modifier le code]

Bonjour, certaines pages du cache affichent une simple page blanche (sous Firefox 50).

Exemples :

Pourriez-vous, au moins, faire apparaître un message d'explication de la non mise en cache de ces pages ? ContributorQ() 7 février 2017 à 00:43 (CET)

Notification ContributorQ :ça ne s'est pas reproduit pas de page blanche. il y a juste le lien vers le monde mais c'est expliqué pourquoi. Pmartin (discuter) 9 février 2017 à 21:27 (CET)
En fait, c'est toujours le même problème, déjà signalé. Au premier accès à une page archivée, le temps de chargement est tellement long, plusieurs minutes, que la connexion plante, ce qui donne une page blanche. ContributorQ() 12 février 2017 à 01:25 (CET)
Notification ContributorQ :On a procédé à un correctif il y a quelques jours pour améliorer le premier accès de la page archivée, il y a maintenant une redirection après 5 secondes, du coup la page s'affiche plus vite. Sur les quelques tests que j'avais réalisé il n'y avait pas de phénomènes de pages blanches. Je cherchais justement la page où le problème de lenteur avait été signalé. Donc si tu as d'autres exemples de lenteur ou de pages blanches je suis preneur. Pas d'infos sur l'article de le monde c'est un bug qui a été engendré suite à la redirection, on va résoudre le problème cette semaine. Pmartin (discuter) 13 février 2017 à 00:06 (CET)
Notification ContributorQ : http://archive.wikiwix.com/cache/?url=https://lemonde.fr voilà le correctif, sur le pourquoi certaines pages ne sont par archivables, est réalisé. Pmartin (discuter) 17 février 2017 à 18:47 (CET)
Bonjour, merci pour vos correctifs. La référence vers le site du journal Le Monde affiche maintenant le message compréhensible « impossible d'archiver cette url » avec l'explication qui va bien. Malheureusement, certaines références affichent toujours une page blanche après un long temps de chargement. Vous pouvez tester les références 9, 11, 12 et 17 de l'article Misaki (cheval), par exemple. ContributorQ() 18 février 2017 à 17:13 (CET)
Bonjour, j'apporte une nouvelle observation. En fait, une première ouverte de page de cache affiche une page totalement blanche (le cadre sous l'en-tête) comme je l'ai rapporté ci-dessus. Cependant, une fois la page rechargée dans le navigateur, une ou deux fois, le contenu apparaît et le temps d'affichage est nettement plus rapide. Bizarre... ContributorQ() 12 mars 2017 à 10:33 (CET)

Moins de jargon[modifier | modifier le code]

Bonjour, peut-être vous rendrez-vous un peu mieux compte du niveau de gogolerie d'ignorance en informatique des gens à qui vous vous adressez, si je vous pose la question : "c'est quoi un monobook ?" (= où c'est, comment on s'en sert ?) Je suis "pour" faire un effort pour que les liens ext. mis en ref ne risquent pas, ou risquent moins, de se retrouver cassés ; mais pas au point d'aller chercher ce que c'est que ce truc-là, ni de galérer pour trouver comment on s'en sert - car galère ce sera presque assurément. Donc non merci. J'ai retenu la page Modèle:Lien brisé, je trouve déjà bien assez compliqué de l'utiliser quand il s'agit d'arranger un lien dans une ref "wikifiée" (après plusieurs essais j'ai décidé de ne plus m'emmerder et de de coller le modèle 'lien brisé' à la suite des doubles accolades fermantes, de le compléter avec le lien coupé-collé depuis la ref). Soit dit en passant, ça serait bien si votre formule, là, était présentée de la même façon que les pages de modèles (enfin, pour la plupart - certaines ne sont pas vraiment au point et manquent de clarté, mais bon dans l'ensemble c'est à peu près compréhensible). C'est-à-dire une page d'explications "pour idiots" (comme la collection de bouquins du même titre). Du pas par pas expliqué le plus simplement possible et chaque pas illustré par des exemples.

Et merci pour le travail utile. Les liens brisés sont une plaie. (et en plus les pauvres se font presque engueuler, lol, ça vous apprendra à être utiles, tiens !) Pueblopassingby (discuter) 1 mars 2017 à 21:41 (CET)

Notification Pueblopassingby :Je t'invite à aller faire un tour sur cette page, tu y trouveras certainement du monde qui pourra mieux te renseigner que moi sur les modèles et le monobook. D'ailleurs je ne suis même plus sur que le monobook existe encore. https://fr.wikipedia.org/wiki/Projet:Aide_et_accueil
https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Pr%C3%A9f%C3%A9rences#mw-prefsection-gadgets sur celle là tu y trouvera une extension du gadget Archivelinks ajouter un lien [archive] à côté de chaque lien externe, pointant vers une version en cache. Je ne comprends pas trop ce que tu cherches Pmartin (discuter) 1 mars 2017 à 22:56 (CET)
"Je ne comprends pas trop ce que tu cherches" : moi non plus :D ! Je ne suis pas sûr de comprendre les tenants et aboutissants de l'objet de cette page-ci, me suis penché dessus car croyais que c'est un truc pour donner accès à un cache des pages dont les liens ont été / seront peut-être brisés. Mais comme je n'y connais rien je ne suis même pas sûr que j'aie bien compris ne serait-ce que cela. Peu importe, c'est pas grave. j'ai suivi ton lien https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Pr%C3%A9f%C3%A9rences#mw-prefsection-gadgets. Ca a l'air intéressant, merci :) Mais comme je ne suis pas fichu de retrouver cette page par le chemin normal dans mon compte, et que personne et surtout pas moi n'est à l'abri d'un ordi qui vous pète dans les mains donc les bookmarks ne sont pas sures, je préfère m'abstenir de tripoter quoi que ce soit de ce genre, des fois que je ne puisse pas le rechanger.
Toutefois je crois bon de signaler que pour ce lien-ci : http://marchaisbeton.cc-charny.fr/divers/HistoireMarchaisBeton.pdf (en ref ici : Cravant (Yonne)), qui est cassé suite à la modif du site de la CCommunes après création d'une de ces "nouvelles communes", eh bien le modèle lien brisé ne fonctionne pas et je ne sais pas si la formule de cette page-ci fonctionne. Là aussi, pas grave pour ce coup-ci, j'ai trouvé le nouvel url et changé le lien dans l'article. Mais je croyais que le modèle lien brisé servait, justement, à ramener un cache de la page. Confusion confusion. Merci en tout cas pour ton attention. Pueblopassingby (discuter) 1 mars 2017 à 23:42 (CET)