Aller au menu - Aller au contenu

Extraire, trier et filtrer des données


Pour accéder à cette section
Connectez-vous !
connexion_rpx
Page 1 
Pseudo Commentaire
Page 1 
Hors ligne animalmuppet # Posté le 10/09/2008 à 12:11:25
Call me Animal
Avatar
Flux RSS

Ville : Sivry
Pays : Belgique
études : Université de Liege

Yeah premier commentaire :soleil:

Encore un très bon tuto même si j'attends avec impatience les combinaisons possibles de ces différentes commandes.

Secret (cliquez pour afficher)
17/20 ;)

Architecte en doute, agnostique, linuxien dans son coin, et geek à ses heures...

Gustave Parking :
"la célébrité c'est le ridicule moins la honte !"
 
Hors ligne meyxiam # Posté le 10/09/2008 à 13:27:02
Linux a un noyau, Windows a de

Ville : Bellignies
Pays : France métropolitaine
études : EPSI Arras

Ah bah grâce à ton cours, je me remémore vite fait les commandes Unix, juste avant la rentrée c'est le top!

Image utilisateur
Avec Windows XP on été au bord du gouffre, avec Vista on fait un pas en avant!
 
Hors ligne gouttegd # Posté le 10/09/2008 à 15:46:38
Serenity is a RAID 1 array.
Avatar

Citation : M@teo21
Comme vous pourrez le constater, les expressions régulières fonctionnent aussi bien sans le -E. Pourquoi ?
Normalement, cette option sert à activer la gestion des expressions régulières les plus complexes. Dans la pratique, le manuel nous dit que la version GNU de grep (celle qu'on utilise sous Linux) ne fait pas de différence que l'option soit présente ou pas.

Attention, pas tout-à-fait. GNU grep supporte les expressions régulières « étendues » avec ou sans l'option -E, certes, mais la syntaxe est différente !

Sans l'option -E, les caractères ?, +, {, |, (, et ) n'ont pas de signification spéciale (ils matchent une occurence d'eux-même). Il faut les faire précéder d'un antislash pour leur redonner leur sens de métacaractère qu'ils ont avec l'option -E.

Autrement dit,
Code : Bash
1
grep -E '(lin|cir)dna' .bashrc

est équivalent à
Code : Bash
1
grep '\(lin\|cir\)dna' .bashrc

(les deux recherchent "lindna" ou "cirdna" dans le fichier .bashrc), mais pas du tout à
Code : Bash
1
grep '(lin|cir)dna' .bashrc

(qui recherche "(lin|cir)dna").

« Je vous aiderai si vous me promettez d'aider quelqu'un d'autre en retour. » --- Anonyme
« Soyez vigilant lorsque vous vous exprimez dans un forum électronique. Vos fautes de frappes et de syntaxe vous poursuivront pour l'éternité. » --- Linus B. Torvalds

De la gestion automatique des dépendances...
 
Hors ligne kna # Posté le 10/09/2008 à 16:48:34
へへ
Avatar

Et moi blaireau qui l'utilisait sans -E sans me poser de questions (avec les [], ca passe...)

Sinon, dommage que sed manque à l'appel... (même si c'est plus un éditeur qu'un filtre...)

Préciser qu'on peut utiliser les expressions régulières avec find (option -regex) et locate (option --regex) aurait été sympa aussi.

« Le peuple français est incapable d'un régicide » (Louis XVI, 1789)
 
Hors ligne Vizigr0u # Posté le 10/09/2008 à 21:33:46
fooo !
Avatar

études : EPITA

J'ajouterai pour ceux intéressés par les expressions régulières, un lien vers le site d'un zéro (que vous connaissez peut-être si vous avec fréquenté le forum php ;) ) : http://www.expreg.com/

Image utilisateur


Une équipe, 4 membres, un projet : Project: HGF
www.fooo.fr
projet d'étudiants de l'EPITA
 
Hors ligne david96 # Posté le 11/09/2008 à 00:22:00
Avatar

Excellent tuto, merci ! :)
 
Hors ligne david96 # Posté le 11/09/2008 à 00:24:32
Avatar

[HS]J'ai du revenir pour noter seulement le tuto, car lors du commentaire il n'a pas été pris en compte !?[/HS]
 
Hors ligne anonymousguest # Posté le 12/09/2008 à 01:11:21
I'm the Dude
Avatar
Flux RSS

Ville : Tilff
Pays : Belgique
études : FSA ULG

Pour cut, notamment pour le premier exemple :
Code : Console
$ cut -c 2-5 noms.txt 
ran
arce
lber
ean
tép
atri
ince
onat

Il est assez surprenant de ne pas voir uniquement des séries de 4 caractères comme annoncé. C'est facile à comprendre quand on connaît utf-8 mais il serait sans doute bon de dire (sans rentrer dans les détails) que certains caractères, par ex. les caractères accentués, font parfois plus que ce que cut appelle un caractère. Il est précisé plus haut que le nombre d'octets ne correspond pas forcément au nombre de caractères, ça pourrait servir de base pour expliquer le comportement de cut.

Bibles : PHP - MySQL - REGEX - REGEX² - XHTML - CSS
Pas bible : gestion des erreurs
 
Hors ligne Barack Shar # Posté le 13/09/2008 à 10:52:01

Bonjour à tous, je suis nouveau sur le forum, et je vous ai connus en cherchant des information sur KDE 4 qui était présenté dans SVM de septembre.
J'avais rencontré Linux il y a quelques années (1990) alors que je faisait un DUT info. Par contre, suite à une réorientation, cet OS est depuis resté au placard ...

Il est installé depuis une semaine chez moi depuis ce moment, et c'est en grande partie grâce a ce Tuto que j'y ai pris plaisir. Je découvre en ce moment la console (trop lentement à mon goût en raison de mon emploi du temps ...)


Donc bravo et merci pour le temps investi, d'autres Tutos vont m'intéresser par la suite, mais je vais prendre le temps d'approfondir celui-ci.
Hors ligne Rastagong # Posté le 13/09/2008 à 18:05:32
Si vis potes
Avatar
Flux RSS

Ville : Antony
Pays : France métropolitaine

'Tite coquille à la fin de la sous-partie sur grep, tu as oublié un t au mot toujours :
Citation : Le tuto
Comme vous pourrez le constater, les expressions régulières fonctionnent aussi bien sans le -E. Pourquoi ?
Normalement, cette option sert à activer la gestion des expressions régulières les plus complexes. Dans la pratique, le manuel nous dit que la version GNU de grep (celle qu'on utilise sous Linux) ne fait pas de différence que l'option soit présente ou pas. Les expressions régulières sont toujours activées. En clair, vous aurez besoin du -E si vous utilisez grep sur une autre machine de type Unix un jour, mais en attendant vous pouvez très bien vous en passer. Le -E a été conservé pour des raisons de compatibilité.
 
Hors ligne ssmario2 # Posté le 13/09/2008 à 19:12:35

Juste pour signaler que dans le tableau du chapitre Utiliser grep avec des expressions régulières

les significations des deux caractères + et * doivent être inversés.

bonne continuation !
Hors ligne M@teo21 # Posté le 14/09/2008 à 11:45:31
Doh ! Nuts. Mmh, donuts !
Avatar
Admins
Flux RSS

Ville : Paris
Pays : France métropolitaine
études : EFREI

Merci j'ai pris en compte vos signalements d'erreurs et vos suggestions. :)

Image utilisateur

Le premier Livre du Zéro Apprenez à programmer en C est sorti !

Prenez-vous en photo avec dès que vous l'avez reçu !


L'urgent est fait, l'impossible est en cours, pour les miracles, prévoir un délai...
 
Hors ligne yannn # Posté le 26/11/2008 à 11:21:15
Ah; bon!! il est où
Avatar

Bonjour
J'ai crée une fichier "bonjour.odt" dans lequel il y a le mot bonjour
Lorsque je cherche ce mot "quelque soit le chemin" la commande grep ne me donne rien?
Pourquoi?

Et je regardai, et je vis apparaitre un cheval couleur pale, et son cavalier se nommait la Mort, et l'enfer le suivait...
 
Hors ligne yannn # Posté le 26/11/2008 à 17:40:18
Ah; bon!! il est où
Avatar

Re
Encore moi
Je fait honneur au site, "suis un zéro" un vrai
grep non au Traitement de Texte oui au Editeur de Texte et autre editeur de langage.
Ne serait il pas bon de mettre une petite ligne dans le cours pour éviter que des gros blaireaux comme moi mettent la journée pour s'en rendre compte
merci

Et je regardai, et je vis apparaitre un cheval couleur pale, et son cavalier se nommait la Mort, et l'enfer le suivait...
 
Hors ligne yannn # Posté le 26/11/2008 à 18:18:26
Ah; bon!! il est où
Avatar

J'ai juste relevé ça:

-d : afficher uniquement les lignes présentes en double
L'option -d demande à afficher uniquement les lignes présentes en double :

Comme tu as un exemple en triple, ne vaudrait il pas mieux mettre:

-d : afficher uniquement les lignes présentes en double
L'option -d demande à afficher uniquement les lignes qui présentent des doublons

Et je regardai, et je vis apparaitre un cheval couleur pale, et son cavalier se nommait la Mort, et l'enfer le suivait...
 
Hors ligne joedu12 # Posté le 10/02/2009 à 11:22:12
Avatar

Très bon tuto :D

Bon site d'entraide que je soutiens et pétition a signer pour ne plus faire passer votre PC par (la) fenêtre.
 
Hors ligne bluefish63 # Posté le 25/02/2009 à 16:43:48

Par defaut j'ai directement les numéros de ligne avec la commande grep, pas vous ?
Version 2.5.3
Hors ligne Jarode01 # Posté le 13/07/2009 à 11:41:21

A noter que la commande uniq n'est pas très puissante puisque si une accurence est présente plusieurs fois à des lignes qui ne se suivent pas alors uniq ne nous sera d'absolument aucune utilité.
ex:
noms.txt
Code : Console
François
Cédric
François
Marcel
Jonathan
Marcel

nous donnera avec uniq noms.txt exactement la même chose, soit:
Code : Console
uniq noms.txt

François
Cédric
François
Marcel
Jonathan
Marcel


Citation
Bonjour
J'ai crée une fichier "bonjour.odt" dans lequel il y a le mot bonjour
Lorsque je cherche ce mot "quelque soit le chemin" la commande grep ne me donne rien?
Pourquoi?

Et bien peut être parce que c'est un fichier .odt :p

Un SUPER Site et Forum sur l'étude et l'élevage des FOURMIS:
Image utilisateur
 
Hors ligne fondation # Posté le 29/12/2009 à 16:17:13
Avatar

Bonjour, c'est un tuto bien fait.
Continuer ainsi !!!
Hors ligne marcel_07 # Posté le 30/01/2010 à 02:04:42

merci pour le tuto :p
petit souci avec la commande uniq qui ne me supprime pas les doublons
alors que le fichier a été trié. Il me raffiche le fichier initial :colere2:
pire enkor avec l'option -d pour n'afficher ke les lignes ki presente les doublons,
il n'affiche plus rien du tout :o

quelqu'un pourrait m'eclairer
merci
Hors ligne vyk12 # Posté le 20/02/2010 à 20:32:58
alias 85974
Avatar
Validateurs

Ville : Dardilly
Pays : France métropolitaine

A la fin de la partie sur la commande wc, tu dis « Comme vous pouvez le voir, le nombre de caractères est différent du nombre d'octets. ». Cette phrase laisse l'utilisateur dans le flou. Une petite phrase expliquant vite fait pourquoi serait bien, comme « Ceci est dû au fait que l'encodage utilisé est l'unicode et que les caractères spéciaux sont codés sur 2 octets. Sachez qu'un caractère peut au maximum être codé sur 4 octets. ».
 
Hors ligne No1 # Posté le 09/03/2010 à 14:21:02

Merci pour ce tutoriel, j'apprends beaucoup sur Ubuntu.
Grâce à lui, j'arrête de me noyer et je remonte vers la surface.

Un grand Bravo !
Pour accéder à cette section
Connectez-vous !
connexion_rpx