Discussion aide:Unicode

Une page de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

Urgent[modifier le code]

Remplissage urgent par quelqu'un qui s'y connait (à cause de {{Msg:Unicode}} qui fait appel à cet article et qui commence à être utilisé par quelques articles, comme Langue japonaise). Ploum's 24 fév 2004 à 19:35 (CET)

C'était prévu et c'est fait (je n'allais pas lancer comme cela un
message

sans qu'il soit pertinent). Vincent 24 fév 2004 à 20:10 (CET)

Total respect ! C'est mieux que pertinent. C'était préparé. Je m'incline. Ploum's 24 fév 2004 à 20:15 (CET)
Je n'ai fait que mon devoir, Général. Vincent
A ce titre, et au nom de la nationWikipedia reconnaissante, je te décerne une décoration en chocolat. Ploum's 24 fév 2004 à 20:28 (CET)
Merci. Vincent

On pourrait faire un page de test unicode commune a toute les langues, non ? Aineko 27 fév 2004 à 02:27 (CET)

Toutes ? Cela me semble irréalisable (et puis : comment teste-t-on les langues CJK ?). Pour les principales écritures, oui, mais il faut les séparer. Vincent 27 fév 2004 à 06:44 (CET)
En fait, c'est surtout pour tester les fontes de caractères. Dans un premier temps, mettre des phrases dans les principales langues utilisant l'Unicode (chinois, japonais, russe, grec, etc.). Pour l'arabe c'est un peu particulier a cause du moteur de rendu, mais sinon, je vois pas le problème. Aineko 27 fév 2004 à 06:52 (CET)
Le problème est qu'il faudra faire de même que pour l'arabe avec les écritures de l'Inde à variantes contextuelles... Sinon, j'ai une page de test plus générale sur mon site web ( http://sivanataraja.free.fr/config/test.htm ) dont je peux réutiliser le système. Vincent 27 fév 2004 à 07:12 (CET)
Oui, il y a un certain nombre de langue qui necessite un traitement speciale, mais la page de teste general pourrait servir pour toutes les autres. Sympa ta page! On peux l'utiliser ? Aineko 27 fév 2004 à 07:54 (CET)
Bien sûr ! Je peux en pondre d'autres comme cela facilement. On peut aussi se servir du I can eat glass, du moins un peu. J'y ai participé et ai fourni quelques exemples. Vincent 27 fév 2004 à 09:50 (CET)
C'est justement la page que je coulais retrouvé :o) On peux reprendre librement les exemples ? Aineko 27 fév 2004 à 09:57 (CET)
Pas sûr. Il vaut mieux demander (Frank da Cruz est quelqu'un de très sympa). Le problème, c'est que les exemples ne contiennent pas forcément les caractères de blocs importants (comme les diacritiques sans chasse). Vincent 27 fév 2004 à 12:35 (CET)

Code ISO-8859-1 Unicode Equivalent Unicode
128 Ç € 199 Ç
129 ü  252 ü
130 é ‚ 233 é
131 ⠃ 226 â
132 ä „ 228 ä
133 à … 224 à
134 å † 229 å
135 ç ‡ 231 ç
136 ê ˆ 234 ê
137 ë ‰ 235 ë
138 è Š 232 è
139 ï ‹ 239 ï
140 î Œ 238 î
141 ì  236 ì
142 Ä Ž 196 Ä
143 Å  197 Å
144 É  201 É
145 æ ‘ 230 æ
146 Æ ’ 198 Æ
147 ô “ 244 ô
148 ö ” 246 ö
149 ò • 242 ò
150 û – 251 û
151 ù — 249 ù
152 ÿ ˜ 255 ÿ
153 Ö ™ 214 Ö
154 Ü š 220 Ü
155 ø › 248 ø
156 £ œ 163 £
157 Ø  216 Ø
158 × ž 215 ×
159 ƒ Ÿ 402 ƒ
160 á 225 á
161 í ¡ 237 í
162 ó ¢ 243 ó
163 ú £ 250 ú
164 ñ ¤ 241 ñ
165 Ñ ¥ 209 Ñ
166 ª ¦
167 º § 186 º
168 ¿ ¨ 191 ¿
169 ® © 174 ®
170 ¬ ª 172 ¬
171 ½ « 189 ½
172 ¼ ¬ 188 ¼
173 ¡ ­ 161 ¡
174 « ® 171 «
175 » ¯ 187 »
176 ° 9617
177 ± 9618
178 ² 9619
179 ³ 9474
180 ´ 9508
181 Á µ 193 Á
182 Â 194 Â
183 À · 192 À
184 © ¸ 169 ©
185 ¹ 9571
186 º 9553
187 » 9559
188 ¼ 9565
189 ¢ ½ 162 ¢
190 ¥ ¾ 165 ¥
191 ¿ 9488
192 À 9492
193 Á 9524
194 Â 9516
195 Ã 9500
196 Ä 9472
197 Å 9532
198 ã Æ 227 ã
199 Ã Ç 195 Ã
200 È 9562
201 Ð É 208 Ð
202 Ê 9577
203 Ë 9574
204 Ì 9568
205 Í 9552
206 Î 9580
207 ¤ Ï 164 ¤
208 ð Ð xf0 ð
209 Ð Ñ x110 Đ
210 Ê Ò xca Ê
211 Ë Ó xcb Ë
212 È Ô xc8 È
213 ı Õ 305 ı
214 Í Ö 205 Í
215 Î × 206 Î
216 Ï Ø 207 Ï
217 Ù 9496
218 Ú 9484
219 Û 9608
220 Ü 9604
221 ¦ Ý 254f ? &#x254f ?
222 Ì Þ 204 Ì
223 ß 9600
224 Ó à 211 Ó
225 ß á 223 ß
226 Ô â 212 Ô
227 Ò ã 210 Ò
228 õ ä 245 õ
229 Õ å 213 Õ
230 µ æ x3bc μ
231 þ ç 254 þ
232 Þ è 222 Þ
233 Ú é 217 Ú
234 Û ê 219 Û
235 Ù ë 218 Ù
236 ý ì 253 ý
237 Ý í 221 Ý
238 ¯ î
239 ´ ï
240 ð
241 ± ñ
242 ò 8215
243 ¾ ó
244 ô
245 § õ
246 ÷ ö
247 ¸ ÷
248 ° ø
249 ¨ ù
250 · ú
251 ¹ û
252 ³ ü
253 ² ý
254 þ 9632
255 ÿ

un lien : http://www.natural-innovations.com/wa/doc-charset.html


Note : le texte ci-dessous a été déplacé depuis le Bistro de Wikipédia.

Ryo 11 mar 2004 à 10:02 (CET)

Félicitation ! (UTF-8)[modifier le code]

Et voila, nous voici virtuellement passé a l'UTF-8 ! Merci a tous ceux ayant participé au débat Wikipédia:Prise de décision/UTF-8. 28 pour, 0 contre, voici un joli consensus qui fait bien plaisir. J'ai envoyé un mail aux développeurs, et j'espère qu'ils prendront un peu de temps pour exhausser notre vœu. Il ne faut pas pour autant oublier les réserves qui ont été émise, et je vous invite donc à aider a la création de page d'aide concernant l'UTF-8. Un bon départ serait de donner la liste des navigateurs compatibles. Essayons de compléter la page Wikipédia:Navigateur. Aineko 9 mar 2004 à 11:22 (CET)

-- J'utilise internet explorer 5.00.2919.6307, sous windows 98 (version 4.10.1998). Internet explorer me propose de choisir entre affichage/codage/utf8 ou iso. Cependnat lorsque je choisis iso, moins de caractères de la page de test s'affichent. Est-ce normal? Il semble que le problème ne se pose qu'à l'affichage, mais pas à l'édition (qui me montre les caractères sous frome de & # ... ; Je suis pourtant pour unicode. Jean-Michel.

En fait, dans IE, on peux choisir une police de character par codage. Si tu choisi une police de character Unicode (Arial Unicode par exemple) pour le codedage "iso", tu veras autant de carateres. Dans tout les cas, je te conseil de passer a Mozilla Firefox, c'est vraiment mieux et en plus, c'est libre! Aineko 10 mar 2004 à 02:58 (CET)



Passage à l'UTF-8[modifier le code]

Bonjour, pour le passage à l'UTF-8, il faudra que le site soit inaccessible (au moins en écriture) pendant le temps du transfert. De plus, tous les caractères actuellement codé entre 128-255 qui ne sont pas égale entre ISO-8859-1 et UTF-8 devrons être corrigé par un ou des bots dans les plus brefs délais. Je vais essayer de faire la liste des caractères à corriger. Aineko 10 mar 2004 à 03:07 (CET)

Voila, j'ai fait le tableau de comparaison sur la page Discussion Wikipédia:Unicode. Tous les caractères de gauche seront affichés comme dans la colonne de droite après passage à l'UTF-8. Il faut donc trouver leurs équivalents Unicode. Je pense que dans le tas, seul une 20e~30e doivent être utilisé. Si quelqu'un peu m'aider, ça sera avec plaisir. Aineko 10 mar 2004 à 03:38 (CET)

Logiquement HasharBot est bilingue iso-8859-1 / UTF-8 et devrait pouvoir convertir les articles sans aucun problème. Il faudra que je fasse quelques tests. Ashar Voultoiz 10 mar 2004 à 08:10 (CET)
En fait, apparemment, la conversion serait fait automatiquement lors du switch. Par contre, il restera peut-être les entité HTML, du genre &#abcd;, a reconvertir en caractères Unicode. J'attends des nouvelles sur la ML technique. Je suis assez mauvais en anglais (qui a dit "en français aussi" !), et ça serait vraiment bien que d'autre s'inscrivent sur les ML pour transmettre nos interrogations et nos doléances. Aineko 10 mar 2004 à 08:49 (CET)
Ce n'est pas nécessaire de convertir les entités HTML... Elles n'utilisent que des caractères ASCII (code < 128/80h) donc elles sont 100% compatibles avec UTF8. Ce qui pose problème ce sont les caractères dans le code source HTML dont le numéro est supérieur à 128 dans une page de code donnée, ici ISO 8859-1. «&eacute;» n'a pas à être converti, pas plus que «&2345;» ; seuls les caractères binaires du genre «é» ont besoin d'être convertis, et seuls les caractères binaires non-prévus par la norme ISO 8859-1 du genre «œ» peuvent éventuellement poser problème et demander des corrections manuelles. JX Bardant 10 mar 2004 à 12:13 (CET)
D'après ce que j'ai compris, le passage à l'UTF8 est simple, mais lent. Il faut passer toutes les pages par un script qui convertit en UTF-8. Puis après relancer les scripts de reconstruction des liens (méthode la plus simple) Shai 10 mar 2004 à 10:15 (CET)
Oui, c'est simple en théorie... Je pense qu'il serait bien de tester d'abord. On notera que le processus rend la base de donnée innaccesible durant un temps. Beatnick
Et concernant l'affichage correct des caractères ? Personnellement, j'ai quand même quelques problemes avec mon IE 6 sous XP. Ne serait-il pas utile d'indiquer quelque part où trouver les plug-ins necessaires s'ils existent ? Traroth 10 mar 2004 à 11:18 (CET)

Bonjour, les entités HTML, du genre &#abcd;, n'ont pas besoin d'etre converties. Elles s'affichent correctement sous n'importe quel encodage.
En revanche, il est indispensable de corriger les entites illegales Windows qui existent actuellement dans le code:

  • apostrophes,
  • oe lié,
  • points de suspension,
  • tirets longs,
  • guillemets anglais, etc.

Vargenau 10 mar 2004 à 12:06 (CET)

La liste des caractères à problèmes est donnée dans l'article ISO 8859-1 au chapitre ISO-8859-1 vs Windows ANSI. Il s'agit des caractères de 80h à 9Fh (128 à 159). JX Bardant 10 mar 2004 à 12:28 (CET)

Je sais, c'est moi qui ai cree l'article ISO 8859-1 (a partir de l'anglais) :-)

Eh bien, bravo pour la cohérence de tes propos :-) JX Bardant 10 mar 2004 à 13:52 (CET)

En resume : Qui lance le robot pour corriger ? Vargenau 10 mar 2004 à 13:31 (CET)

J'ai pas dit, il faudra convertir les entités HTML, mais je prefereai. Quite a passer a l'UTF-8, j'aimerai bien que le source des pages pleines de caracteres japonais deviennes lisible sans que j'ai tout a retaper. Aineko 10 mar 2004 à 14:42 (CET)

Je ne suis pas sur que ce soit une bonne idee de convertir toutes les entites HTML. Je suis capable de corriger du grec s'il est ecrit &alpha;&beta;. C'est beaucoup plus difficile si les caracteres sont en UTF-8. Il faut en discuter. Vargenau 10 mar 2004 à 15:19 (CET)

En fait tu pourras toujours saisir du grec sous la forme &alpha;, même si la conversion est faite... L'entité &alpha; reste valide quel que soit le codage... Par contre c'est vraiment plus difficile de lire «&alpha;&beta;&gamma;» que «αβγ». Je crois qu'on a intérêt à convertir systématiquement en «binaire» les caractères saisis pour être stockés (saisi comme «&alpha;» => stocké comme «α»). Dans l'autre sens, les seuls caractères qu'on devrait toujours afficher dans la zone d'édition sous forme d'entité HTML sont ceux du type espace insécable, puisqu'on ne peut pas faire la différence à l'œil. JX Bardant 10 mar 2004 à 16:05 (CET)

Note : le texte ci-dessous a été déplacé depuis le Bistro de Wikipédia.

Aineko 21 mar 2004 à 09:53 (CET)

À propos du passage en UTF-8[modifier le code]

Pour tenir tout le monde au courant à propos de l'utf-8, la migration approche. On a fait un petit programme qui convertit les textes en utf-8 et qui convertit aussi les entités unicode &#xxxx; en utf-8. J'ai essayé sur ma machine personnelle, ça fonctionne correctement. Les japonisants, arabisants et autre langues non latinisantes vont être heureux je pense. :) Med 14 mar 2004 à 13:16 (CET)

Bravo. Vincent 14 mar 2004 à 13:39 (CET)
Pour les quelques impatients, qui veulent tester (et donc cherches des bogues), voilà mon wiki : http://einstein.hd.free.fr/wiki/wiki.phtml . Pour les problèmes connus, les interwikis n'ont pas été réparés, et il n'y a que la dernière version de la base (qui date du dernier dump). Le reste devrait fonctionner à peu près. Si vous voyez un affichage incorrect, n'hésitez pas à le signaler. Med 14 mar 2004 à 13:44 (CET)
Cela fonctionne à merveille. Quelle facilité maintenant pour travailler un texte en grec... Tiens, je vois qu'il reste des &mdash;. Vincent 14 mar 2004 à 15:44 (CET)
oui, on n'a converti que les entités unicode, les entités html étant moins simples à convertir et étant plus ou moins lisibles au contraire de l'unicode. Il est prévu qu'un robot passe pour nettoyer les pages pour tout ça. Mais tu pourras utiliser les vrais caractères à la place de &dash; cependant. Med 14 mar 2004 à 15:52 (CET)

Alphabet khmer[modifier le code]

Je poste ici, ce n'est peut-être pas le bon endroit, dans ce cas veuillez m'en excuser et dites moi où poster.

Certaines pages de Wiki ont des caractères khmers, sur mon ordi ils sont tout petits et de ce fait illisibles. Comment faire pour les agrandir?

--Laurentleap (d) 17 janvier 2010 à 13:54 (CET)

Problème police de caractères[modifier le code]

Bonjour,

Quelqu'un saurait-il d'où vient ce genre de problème et comment le réparer éventuellement ? Je vous remercie d'avance. Automatik (d) 15 janvier 2013 à 17:48 (CET)

Les détails de cette affaire non résolue sont sur wikt:Wiktionnaire:Wikidémie/janvier_2013#Bug_.EA.9C.B5. JackPotte ($) 16 janvier 2013 à 22:46 (CET)

Mise à jour Windows 7[modifier le code]

Il y aurait lieu de mettre à jour l'article avec Windows 7. — Berdea (discuter) 26 juillet 2018 à 14:46 (CEST)

Bonjour Berdea.
J'imagine que vous faites référence à la sous-section Aide:Unicode#Microsoft_Windows.
En effet, cette partie du guide semble dépassée, se concentrant sur Windows 2000 et faisant allusion à Windows XP comme son seul successeur. Merci d'avoir attiré mon attention sur ce point. N'étant pas suffisamment compétent en la matière, je notifie certains collègues mieux placés : Sherbrooke (qui est l'auteur à l'origine de cette sous-section) et l'aimable Niridya (qui saura peut-être contacter un contributeur compétent dans ce domaine, à moins qu'il se sente capable de mettre lui-même à jour ce qu'il faut). J'ai également signalé le problème ici. Le travail à faire concerne au moins la forme.--Braaark (discuter) 28 juillet 2018 à 18:16 (CEST)
Merci Braaark Clin d'œil pour la mention ! Mort de rire Malheureusement, je ne suis pas trop compétent dans le domaine même si l'informatique est mon domaine (j'ai un petit doute sur l'aspect correct de cette phrase^^). Je sais que sous Windows 10, ce type de configuration (s'il existe toujours, car Unicode est un standard) se fait sûrement via Edge. Sous Windows 7 et 8 (qui utilisent la même version d'Internet Explorer) je pense (mais un peu moins sûr que tout à l'heure) que c'est automatique.
D'ailleurs, je ne sais pas si des navigateurs/systèmes d'exploitations actuels ont toujours besoin de configurer Unicode. (Smiley: ???)
Je notifie @Lofhi, @Jibe74 et @Marilouw qui auront peut-être les connaissances pour vous aider sur cette page. --Niridya (discuter) 28 juillet 2018 à 19:09 (CEST)
Il se trouve que je n'arrive pas à voir certains caractères (je suis sur Windows7 et Firefox). Tout vient de là. J'avais fait un signalement dans le bistrot du 26 juillet. — Berdea (discuter) 29 juillet 2018 à 12:37 (CEST)
Bonjour Berdea Bonjour,
Peut-être pourrais-tu trouver ton bonheur dans la page Aide:Liste de caractères spéciaux ? Mais si ce n'est qu'une question d'affichage, ça ne fera pas ton affaire (Smiley: triste). Pour le reste, voir ci-après...
--Jibe74 (discuter) 29 juillet 2018 à 14:47 (CEST)

----------------
(je ne sais pas trop comment indenter pour répondre à Niridya sans avoir l'air de répondre à Berdea (Smiley Gêné) Si ça ne convient pas, n'hésitez pas à revoir la mise ne page)
Bonjour Bonjour à tous et Merci Niridya Clin d'œil pour la mention. Malheureusement, ça fait plus de 10 ans que je n'ai plus du tout de Windows chez moi et j'ai totalement refusé d'y toucher après Windows 7... Donc, je suis totalement incompétent, mais c'est vrai que la page gagnerait à être mise à jour au moins pour Windows 10 et Windows 7 qui se rencontre encore assez souvent. Selon ma minuscule expérience dans le domaine Microsoft, il me semble que certains sont restés fidèles à Windows 7 et sont allergiques aux versions postérieures, et que les autres sont plus ou moins tout passés à Windows 10, donc Windows 8 serait AMHA moins utile.
--Jibe74 (discuter) 29 juillet 2018 à 14:47 (CEST)
Bonjour Jibe74 Bonjour et c'est pas grave pour l'indentation^^.
D'après ZDNet, Windows 10 est maintenant le Windows le plus utilisé, après Windows 7 et Windows 8.1. Concernant le support d'Unicode par Microsoft, la personne qui actualisera la page aura peut-être besoin de cette page trouvée sur le support technique de Microsoft. Sinon, tu utilises plus Windows car tu n'aimes pas les logiciels propriétaires ? --Niridya (discuter) 29 juillet 2018 à 21:42 (CEST)
Oui, Notification Niridya :, je suis quelqu'un qui aime que l'ordinateur fasse ce que je lui demande, comme je le demande, quand je le demande, avec fiabilité et efficacité. Je n'en dis pas plus, ce n'est pas le lieu ici, mais on peut en parler en privé si tu veux. --Jibe74 (discuter) 29 juillet 2018 à 23:02 (CEST)
@Jibe74 tu n'es pas obligé, à moins que tu aies des raisons différentes des autres personnes qui n'utilisent pas Windows. (ou qui l'ont abandonné) Clin d'œil --Niridya (discuter) 30 juillet 2018 à 12:59 (CEST)
Les problèmes des polices d'écriture, c'est franchement un truc spécial, surtout quand on parle de différents environnements. Il faudrait fouiller le web pour voir ce qu'il en est aujourd'hui, mais on ne peut rien garantir : il n'y a pas vraiment d'aide toute faite. Heureusement qu'UTF-8 existe maintenant... aux débuts de Wikipédia, ce n'était même pas utilisé, il y a eu une sorte de migration à faire. Il faudrait donc en effet mettre à jour cette page et proposer une plice d'écriture pour chaque cas spécifique Lofhi me contacter 3 août 2018 à 19:05 (CEST)

Birman / Burmese Padauk[modifier le code]

Le lien SIL est cassé en 2019 sur le site scripts.sil.org ... Je le signale aussi dans la Wiki en anglais : https://en.wikipedia.org/wiki/Help_talk:Multilingual_support#Burmese%20Padauk --Wisdood (discuter) 15 avril 2019 à 16:27 (CEST)

gotique vs gothique[modifier le code]

Bonjour,

Dans la section 1. Polices de caractères, il y a une partie sur « l'alphabet gotique. » Dans l'article sur la langue gotique, il est expliqué qu'il faut maintenant utiliser gotique (sans H) pour faire la distinction avec l'adjectif gothique.

Je pense donc qu'on peut retirer les H dans les 2 lignes qui suivent… mais n'étant pas spécialiste, je pose la question ici.

--Mdhooge (discuter) 25 juin 2019 à 19:59 (CEST)