Forum
  • MUGs
  • Help fund the Mandriva Linux project

The time now is Thu Sep 09, 2010 7:37 am

Become a registered member of the Mandriva community.It takes only 5 mns and it's free ... Learn more ...
[Résolu] MAJ -> 2007 : UTF-8
Goto page 1, 2  Next
 
Post new topic   Reply to topic    Mandriva Forum Index -> Logiciels Divers
View previous topic :: View next topic  
Author Message
-Tuxicoman-

Non Figura

Joined: 17 Mar 2006
Posts: 663
Location: eon@jabber.fr

View user's profile Send private message Visit poster's website
PostPosted: Thu Oct 05, 2006 11:24 am    Post subject: [Résolu] MAJ -> 2007 : UTF-8 Reply with quote Report

Je me prépare à passer de la 2006 à la 2007 tout en gardant mon /home (formatage de /). Quelle est la procédure pour migrer sans trop de soucis vers UTF-8?

Mon .i18n actuel:
LC_TELEPHONE=fr_FR
LC_CTYPE=fr_FR
LANGUAGE=fr_FR:fr
LC_MONETARY=fr_FR
LC_ADDRESS=fr_FR
LC_COLLATE=fr_FR
LC_PAPER=fr_FR
LC_NAME=fr_FR
LC_NUMERIC=fr_FR
LC_MEASUREMENT=fr_FR
LC_TIME=fr_FR
LANG=fr_FR
LC_IDENTIFICATION=fr_FR
LC_MESSAGES=fr_FR


Last edited by -Tuxicoman- on Tue Oct 10, 2006 11:42 am; edited 1 time in total
Back to top
yoho
Taster
yoho

Joined: 16 Apr 2005
Posts: 3776
Location: Brussels, Belgium

View user's profile Send private message
PostPosted: Thu Oct 05, 2006 1:57 pm    Post subject: Reply with quote Report

imr ! À la rescouscousse ! Perso, je pense qu'il faut utiliser localedrake. Je suggère de passer ce fil en post-it car il revient souvent.
Back to top
imr

imr

Joined: 11 Apr 2002
Posts: 9698
Location: wild wide est de Paris

View user's profile Send private message Visit poster's website
PostPosted: Thu Oct 05, 2006 2:41 pm    Post subject: Reply with quote Report

Oui, c'était un peu prévu que ça allait devenir une faq Smile

On a même fait rajouter un utilitaire dans le centre de controle: désormais on peut choisir son système d'accentuation dans le MCC.
Par contre, passer facilement à l'utf-8 sans problème, pour l'instant, je ne sais pas faire.
Les fichiers doivent être convertis et ce n'est pas simple.
Ma méthode:
-je laisse mon vieux home dans le vieux système fr_FR avec un utilisateur créé pour l'occasion.
-je migre selon mes besoins mes fichiers et je convertis ceux qui en ont besoin
-écueil: mon courrier. J'en suis là. Je n'ai donc pas encore migré.
-A venir: un tutorial dès que je trouve le temps d'en faire un ou qu'on m'en désigne un.
_________________
pouet!
Back to top
ahaire

ahaire

Joined: 03 Oct 2005
Posts: 251
Location: en France

View user's profile Send private message MSN Messenger
PostPosted: Thu Oct 05, 2006 5:21 pm    Post subject: Reply with quote Report

Pour convertir tous ses noms de répertoires et de fichiers du format iso8859 vers le format utf-8, il existe un utilitaire qui s'appelle convmv.

En premier lieu, il faut l'installer, ce que l'on peut faire en reconfigurant ses sources à l'aide de easyurpmi.org

Puis, ouvrir une console, se placer dans le répertoire racine voulu et taper :

convmv --notest -f iso-8859-15 -t utf-8 --nfc -r *

cette commande permet donc de convertir en utf-8 les noms, mais pas le contenu des fichiers textes. Il faudra utiliser le programme iconv.
Les dossiers et fichiers ainsi renommés seront écrasés.

Par contre, j'ai toujours l'affichage des en-têtes de mes messages dans kmail qui affiche des symboles au lieu des accents ?
Back to top
xuo

xuo

Joined: 16 Oct 2004
Posts: 297
Location: Bouc-Bel-Air

View user's profile Send private message
PostPosted: Thu Oct 05, 2006 6:44 pm    Post subject: Reply with quote Report

Mais comment j'ai fait moi, alors, qui n'arrive pas à me débarasser de cet UTF-8 !!!???

Eric.

PS : si quelqu'un peut m'expliquer ce que c'est UTF-8... Car à part mettre des caractères bizarres dans le "man" dans une console ...
Back to top
glyj

glyj

Joined: 16 Sep 2003
Posts: 3864
Location: Nièvre, Bourgogne, France

View user's profile Send private message
PostPosted: Thu Oct 05, 2006 8:45 pm    Post subject: Reply with quote Report

UTF8 est l'encodage de caractères unicode : en principe, c'est un système d'encodage universel (toutes les langues sont supposées être supportées, contrairement au système ISO - XXXX) et une fois que tous les systèmes seront passés à utf8, ben on n'en bougera plus et c'en sera fini des caractères bizarre au lieu des accents.

Il reste le passage délicat de la conversion.
_________________
laptop: HP pavilion dv6500 core2duo T5250 @ 1.50GHz /Nvidia Geforce 8400M GS /MDV 2010 powerpack 32.
Desktop: shuttle SX38/ core2duo E8600 @ 3.3GHz/Nvidia 9400GT/ MDV PWP 2010.0 x86_64
Back to top
Leo Anderson

Leo Anderson

Joined: 05 Nov 2005
Posts: 43

View user's profile Send private message Visit poster's website
PostPosted: Fri Oct 06, 2006 6:23 am    Post subject: Reply with quote Report

Le gros problème de l'UTF, c'est que c'est un jeu de caractères à longueur variable.

Ainsi, en ISO, codé sur 8 bit, on a 256 possibilités de caractères, ce qui n'est évidemment pas assez pour pouvoir gérer le mandarin+l'arabe+le grec+.... sans fin puisque le U veut quand même dire Universel !
(donc même le martien du sud peut être codé en UTF à priori)?

En UTF, le 1er bit indique la présence ou non d'un octet supplémentaire.
Donc, tous les caractères qui ne sont pas dans la table US7ASCII (ISO sur 7 bits), prennent 2 octets ou plus
Mais les 128 premiers caractères sont communs à l'ISO et à l'UTF, c'est la raison pour laquelle les caractères accentués posent problème alors que les carcatères non accentués non ! Wink

[HS]
Quote:
Je ne peux donc pas prendre IE, pour aller le faire tourner sous linux ? ....mince alors.

Oui, c'est bien embêtant car ce serait bien pratique d'avoir IE sous Wine pour lire les flash 8 ! Wink
[/HS]
Back to top
glyj

glyj

Joined: 16 Sep 2003
Posts: 3864
Location: Nièvre, Bourgogne, France

View user's profile Send private message
PostPosted: Fri Oct 06, 2006 6:36 am    Post subject: Reply with quote Report

à propos de IE : il faut que je change ma signature : en fait, au moment ou je l'ai mise, je ne pensais pas qu'on pouvait en avoir besoin, ne serait-ce que pour tester si un site est lisible par les windowsiens.

mais je pense que IES4linux qui télécharge IE sur le net est quand même dans la légalité. (c'est à confirmer par les spécialistes de la licence MS)
_________________
laptop: HP pavilion dv6500 core2duo T5250 @ 1.50GHz /Nvidia Geforce 8400M GS /MDV 2010 powerpack 32.
Desktop: shuttle SX38/ core2duo E8600 @ 3.3GHz/Nvidia 9400GT/ MDV PWP 2010.0 x86_64
Back to top
Fredxx
Sage
Fredxx

Joined: 18 Aug 2005
Posts: 4881
Location: Poitiers

View user's profile Send private message Visit poster's website
PostPosted: Fri Oct 06, 2006 8:40 am    Post subject: Reply with quote Report

et ça, ça peut aider ?
http://linuxfr.org/tips/515.html

par ailleurs, pour le contenu des fichiers, un outil comme kwrite permet pas de choisir son format de caractères au moment d'enregister sous ? comme celui sous windows (je sais pas, je suis au boulot avec windows)?
_________________
Confondateur de l'Association des Utilisateurs Francophones de Mandriva Linux
Back to top
JacquesF

JacquesF

Joined: 18 Mar 2005
Posts: 1036

View user's profile Send private message
PostPosted: Fri Oct 06, 2006 8:55 am    Post subject: Reply with quote Report

Avec la commande convmv, il est possible d'après le man d'exécuter une commande.
Pas de linux en ce moment pour tester, mais il est facile (d'après le man) de lancer ce genre de commande avec la conversion
convmv -f latin1 -t utf-8 -r --exec ``echo #2 >> ListeFichiersAconvertir''
pour chacun des fichiers.
De cette façon, on se crée la liste des fichiers (#1 est l'ancien nom, #2 le nouveau dans l'option --exec) avec les nouveaux noms et il suffit de parcourir le fichier avec un read pour exécuter iconv pour convertir le contenu. Si j'ai le temps et le courage de passer en UTF-8, je ferais un petit script pour faire ça facilement.
Mais de toute manière, ce serait un truc du genre :
while read File ; do iconv param1 param2 $File ; done < ListeFichiersAconvertir
avec param1 et 2 les valeurs qu'il faut mettre pour iconv.

Edit : Réflexion faite, c'est idiot de faire ça, ce n'est pas parce que le nom est à convertir que le contenu doit l'être, et encore moins le contraire...
Va falloir que je prenne des vacances moi

Jacques


Last edited by JacquesF on Mon Oct 09, 2006 6:50 am; edited 1 time in total
Back to top
SRampa

SRampa

Joined: 14 Feb 2005
Posts: 55

View user's profile Send private message
PostPosted: Fri Oct 06, 2006 9:06 am    Post subject: Reply with quote Report

le choix de l'UTF-8 ne se fait qu'au niveau des paramètres de l'utilisateur, c'est bien ça ?? pas au niveau du formatage de la partition ?

donc si je fais une mise à jour simple de la 2006 en 2007, je ne passe pas en UTF-8, c'est bien ça ? y compris pour l'utilisateur root ?

Ensuite, à mois de créer un nouvel utilisateur et de voir ce que ça donne...

en tout cas, vu la quantité de fichiers que j'ai, ce sera impossible de passer en UTF-8... et je ne parle pas des problèmes de conversions de fichiers et d'utilisation de Java ou autre après !... en tout cas, pour moi, une conversion veut dire : conversion manuelle fichier par fichier, en testant avec l'appli qui y accède, bref, c'est impossible !
Back to top
glyj

glyj

Joined: 16 Sep 2003
Posts: 3864
Location: Nièvre, Bourgogne, France

View user's profile Send private message
PostPosted: Fri Oct 06, 2006 9:49 am    Post subject: Reply with quote Report

dans la page : http://qa.mandriva.com/twiki/bin/view/Main/MandrivaLinux2007ReleaseNotes, il y a une rubrique migrer à partir de 2006, et il y a pas mal de détails et la marche à suivre est indiquée.

A+
_________________
laptop: HP pavilion dv6500 core2duo T5250 @ 1.50GHz /Nvidia Geforce 8400M GS /MDV 2010 powerpack 32.
Desktop: shuttle SX38/ core2duo E8600 @ 3.3GHz/Nvidia 9400GT/ MDV PWP 2010.0 x86_64
Back to top
glyj

glyj

Joined: 16 Sep 2003
Posts: 3864
Location: Nièvre, Bourgogne, France

View user's profile Send private message
PostPosted: Fri Oct 06, 2006 9:52 am    Post subject: Reply with quote Report

et si tu n'aimes pas le grand breton : http://qa.mandriva.com/twiki/bin/view/Main/MandrivaLinux2007ReleaseNotesFr
_________________
laptop: HP pavilion dv6500 core2duo T5250 @ 1.50GHz /Nvidia Geforce 8400M GS /MDV 2010 powerpack 32.
Desktop: shuttle SX38/ core2duo E8600 @ 3.3GHz/Nvidia 9400GT/ MDV PWP 2010.0 x86_64
Back to top
SRampa

SRampa

Joined: 14 Feb 2005
Posts: 55

View user's profile Send private message
PostPosted: Fri Oct 06, 2006 10:36 am    Post subject: Reply with quote Report

glyj wrote:
dans la page : http://qa.mandriva.com/twiki/bin/view/Main/MandrivaLinux2007ReleaseNotes, il y a une rubrique migrer à partir de 2006, et il y a pas mal de détails et la marche à suivre est indiquée.

A+


oui, effectivement, j'ai déjà lu cette page...
mais en fait, à aucun moment il n'est fait référence au passage à l'UTF-8 ! d'où mes interrogations !

en fait, j'ai déjà fait la mise à jour de la 2006 à 2007, j'ai eu le problème de la configuration X qui ne s'écrivait pas dans le fichier et un problème avec le driver de ma carte wifi...

pour l'UTF-8, pour le moment, je n'ai remarqué le problème que dans les noms de fichiers... mais je n'ai pas ouvert tout mes documents textes... et de plus, j'ai un autre poste en 2006 encore, donc je m'attends à voir arriver des incompatibilités ! d'où mes interrogations plus haut !!
Back to top
imr

imr

Joined: 11 Apr 2002
Posts: 9698
Location: wild wide est de Paris

View user's profile Send private message Visit poster's website
PostPosted: Fri Oct 06, 2006 3:03 pm    Post subject: Reply with quote Report

Je n'ai pas eu de gros problèmes d'utf-8 sauf dans kmail.
Les dossiers avec des accents posent problèmes, j'ai perdu le contenu de plusieurs (c'était des copies bien sur).
J'ai essayé d'automatiser quelque chose à base d'inconv, mais je n'ai pas réussi, il y a trop de type de charset différent dans tous les fichiers de man .Mail, y compris des Unknown.
J'ai du prendre une autre route plus fastidieuse, mais plus sure.
_________________
pouet!


Last edited by imr on Sun Oct 08, 2006 11:00 am; edited 1 time in total
Back to top
JC_Stiegler

JC_Stiegler

Joined: 14 Mar 2002
Posts: 289
Location: Béziers France

View user's profile Send private message
PostPosted: Fri Oct 06, 2006 7:18 pm    Post subject: Reply with quote Report

Pour qu'il soit accessible directement, je viens d'ouvrir un nouveau fil sur ce sujet :
http://forum.club.mandriva.com/viewtopic.php?t=54123

Il s'agit de la méthode que j'ai utilisée pour résoudre les problèmes posés par l'UTF-8 à l'installation, merci de dire ce que vous en pensez.

Il y a peut-être plus simple...
_________________
Utiliser Mandriva c'est bien, le faire savoir autour de soi c'est mieux !
Back to top
sebdeb

Non Figura

Joined: 23 Jan 2006
Posts: 139
Location: Paris - France

View user's profile Send private message
PostPosted: Sun Oct 08, 2006 9:12 am    Post subject: script de réencodage Reply with quote Report

Bonjour à tous,

j'ai fait le week-end dernier un petit script de réencodage de toute une arborescence. Je viens de prendre le temps de faire une petite page web pour présenter et expliquer la chose : http://sebdeblinux.free.fr/.
Dites-moi ce que vous en pensez, si cela vous est utile et surtout vos suggestions d'améliorations ou rapports de bugs. J'insiste sur le fait de faire vos essais sur une copie de vos données.

Bon courage !

Sébastien
Back to top
JC_Stiegler

JC_Stiegler

Joined: 14 Mar 2002
Posts: 289
Location: Béziers France

View user's profile Send private message
PostPosted: Sun Oct 08, 2006 1:09 pm    Post subject: Re: script de réencodage Reply with quote Report

sebdeb wrote:
j'ai fait le week-end dernier un petit script de réencodage de toute une arborescence. Je viens de prendre le temps de faire une petite page web pour présenter et expliquer la chose : http://sebdeblinux.free.fr/...

Salut Sébastien,

Merci pour cette excellente moulinette. Mandriva pourrait peut-être l'intégrer d'une manière ou d'une autre pour faciliter les migrations.

Je rajoute de ce pas l'URL de ton script sur le petit tutoriel que j'ai écrit sur le forum du club
_________________
Utiliser Mandriva c'est bien, le faire savoir autour de soi c'est mieux !
Back to top
sebdeb

Non Figura

Joined: 23 Jan 2006
Posts: 139
Location: Paris - France

View user's profile Send private message
PostPosted: Sun Oct 08, 2006 1:57 pm    Post subject: Re: script de réencodage Reply with quote Report

jcstiegler wrote:
Mandriva pourrait peut-être l'intégrer d'une manière ou d'une autre pour faciliter les migrations.

Pour çà il aurait fallu l'écrire au mois d'août Wink Peut-être que pour la version 2007.1 on peut envisager un outil graphique "drakeReencoding" qui permet de choisir un dossier et de tout réencoder. Par contre il faut être absolument sûr de ne pas mettre la pagaille.
Pour l'instant mon code ne va pas voir les fichiers cachés (.*) : en effet dans ma boucle for j'ai :
Code:
for fic in *
do
    base_fic=$(basename -- "$fic")
....
done

qui traite bien les noms comportant un espace mais ne prend pas ceux commençant par un point.
Si je mets :
Code:
liste=`ls -A`
for fic in $liste
do
    base_fic=$(basename -- "$fic")
....
done

J'ai les fichiers commençant par un point mais les espaces ne sont pas bien traités...
Back to top
JacquesF

JacquesF

Joined: 18 Mar 2005
Posts: 1036

View user's profile Send private message
PostPosted: Mon Oct 09, 2006 6:36 am    Post subject: Reply with quote Report

Pour ton problème de boucle sur tous les fichiers, mets simplement
Code:
for File in * .* ; do
  if [ $File != "." -a $File != ".." ] ; then
     #Traitement des fichiers
  fi
done


Une boucle for peut parfaitement prendre plusieurs valeurs ou listes de valeurs à traiter. Si il y en a beaucoup (un * sur un gros répertoire peut parfois saturer la taille de la ligne de commande) il faut mieux passer par un xargs.

Pour convertir à la volée le nom du variable, essaye un truc du genre : toto=$(echo $toto | CommandeARéaliser), en général ça fonctionne assez bien, sinon il y a eval qui permet d'évaluer le résultat d'une commande.

Jacques
Back to top
pergie

Non Figura

Joined: 10 Oct 2006
Posts: 2

View user's profile Send private message
PostPosted: Tue Oct 10, 2006 11:15 am    Post subject: Reply with quote Report

J'ai malencontreusement exécuter la commande convmv --notest -f iso-8859-15 -t utf-8 --nfc -r * et cela a eu pour conséquence de me convertir tous les caractères accentués en n'importe quoi...
Existe t'il un moyen de faire marche arrière ??

ahaire wrote:
Pour convertir tous ses noms de répertoires et de fichiers du format iso8859 vers le format utf-8, il existe un utilitaire qui s'appelle convmv.

En premier lieu, il faut l'installer, ce que l'on peut faire en reconfigurant ses sources à l'aide de easyurpmi.org

Puis, ouvrir une console, se placer dans le répertoire racine voulu et taper :

convmv --notest -f iso-8859-15 -t utf-8 --nfc -r *

cette commande permet donc de convertir en utf-8 les noms, mais pas le contenu des fichiers textes. Il faudra utiliser le programme iconv.
Les dossiers et fichiers ainsi renommés seront écrasés.

Par contre, j'ai toujours l'affichage des en-têtes de mes messages dans kmail qui affiche des symboles au lieu des accents ?
Back to top
-Tuxicoman-

Non Figura

Joined: 17 Mar 2006
Posts: 663
Location: eon@jabber.fr

View user's profile Send private message Visit poster's website
PostPosted: Tue Oct 10, 2006 11:37 am    Post subject: Reply with quote Report

Alors finalement, j'ai installé la 2007 en mettant de coté les documents de mon utilisateur. J'ai lancé un "convmv -f latin1 -t utf-8 -r --notest /home/erwan/dossier2006" en suivant le tutoriel http://forum.club.mandriva.com/viewtopic.php?t=54123.

J'ai très peu de fichiers textes bruts. Donc ça a suffit. Mail sous TB, docs openoffice... tout marche comme il faut. Voila, un grosse montagne pour rien en ce qui me concerne.
Back to top
Gibault Stéphane

Gibault Stéphane

Joined: 18 Mar 2006
Posts: 2156
Location: France - Châteauroux

View user's profile Send private message
PostPosted: Tue Oct 10, 2006 12:24 pm    Post subject: Reply with quote Report

Et comment ont fait pour les éxécutables ...

Et pi quand on compile un prog c++, la compilation transforme les caractères accentués ... et la aussi comment ont fait ?
Back to top
chami78

chami78

Joined: 05 Jun 2005
Posts: 545
Location: France, 78 Saint-Cyr l'Ecole

View user's profile Send private message
PostPosted: Tue Oct 10, 2006 12:25 pm    Post subject: Re: script de réencodage Reply with quote Report

sebdeb wrote:
Bonjour à tous,

j'ai fait le week-end dernier un petit script de réencodage de toute une arborescence. Je viens de prendre le temps de faire une petite page web pour présenter et expliquer la chose : http://sebdeblinux.free.fr/.
Dites-moi ce que vous en pensez, si cela vous est utile et surtout vos suggestions d'améliorations ou rapports de bugs. J'insiste sur le fait de faire vos essais sur une copie de vos données.

Bon courage !

Sébastien


Salut,

La première chose à faire dans ton script, c'est de SUPPRIMER TOUS LES ACCENTS Y COMPRIS DES COMMENTAIRES.

Depuis que j'ai lancé un de mes scripts sur un PC américain j'ai compris ma douleur, et c'est devenu une règle absolue.

Wink
_________________
vaut mieux du mégasoft que du microsoft
Back to top
pergie

Non Figura

Joined: 10 Oct 2006
Posts: 2

View user's profile Send private message
PostPosted: Wed Oct 11, 2006 7:36 pm    Post subject: Gros soucis Reply with quote Report

Si quelqu'un pouvait m'indiquer comment revenir à l'option précédente, cela me sortirait d'une pénible situation....
Merci par avance..


pergie wrote:
J'ai malencontreusement exécuter la commande convmv --notest -f iso-8859-15 -t utf-8 --nfc -r * et cela a eu pour conséquence de me convertir tous les caractères accentués en n'importe quoi...
Existe t'il un moyen de faire marche arrière ??

ahaire wrote:
Pour convertir tous ses noms de répertoires et de fichiers du format iso8859 vers le format utf-8, il existe un utilitaire qui s'appelle convmv.

En premier lieu, il faut l'installer, ce que l'on peut faire en reconfigurant ses sources à l'aide de easyurpmi.org

Puis, ouvrir une console, se placer dans le répertoire racine voulu et taper :

convmv --notest -f iso-8859-15 -t utf-8 --nfc -r *

cette commande permet donc de convertir en utf-8 les noms, mais pas le contenu des fichiers textes. Il faudra utiliser le programme iconv.
Les dossiers et fichiers ainsi renommés seront écrasés.

Par contre, j'ai toujours l'affichage des en-têtes de mes messages dans kmail qui affiche des symboles au lieu des accents ?
Back to top
Display posts from previous:   
Post new topic   Reply to topic    Mandriva Forum Index -> Logiciels Divers All times are GMT
Goto page 1, 2  Next
Page 1 of 2

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum


Powered by phpBB © 2001, 2005 phpBB Group