Re: [HS] recherche script batch pour doublons !

2020-02-12 Par sujet ptilou
Le lundi 10 février 2020 21:20:02 UTC+1, Marc Chantreux a écrit :
> salut,
> 
> j'ai nettoyé un répertoire de photos en utilisant ça:
> 
> that_duplicates () {
> local ZERO="\x00"
> xargs -0 sha1sum |
> sed -r "s/ +/$ZERO/" |
> awk -F$ZERO -vORS=$ZERO '!sum[$1]++ {print $2}'
> }
> 
> c'est à utiliser avec un find devant et un xargs -0 rm derrière.
> 
> vu les volumes, la stratégie va compter: si tu as beaucoup de gros fichiers,
> il serait peut-être intéressant de faire le sum seulement sur les
> premiers ce qui permetterait un premier dédoublonage à l'arache.
> 
> cordialement,
> marc

Merci, je l'ai pas essayé ! je comprend pas bien , mais enfin à l’occasion je 
demanderai à quelqu'un qui m'a dit qu'il enseigné !
(l'hexa, et le sum 1, la comparaison semble aléatoire, tu facture combien ton 
travail ?  !)

Par contre y avait un DVD, d'un magazine d’administration de Linux anglophone, 
au Fosdem, personne ne l'a récupéré, y  a 6000 scrript, doit y avoir bonheur ...

-- 
ptilou



Re: [HS] recherche script batch pour doublons !

2020-02-11 Par sujet TScholler

Merci pour cette réponse (fslint).
Mais quelle serait en ligne de commande l'équivalent pour rechercher , 
rélectionner puis effacer les doublons?

Merci.
TS

Le 10/02/2020 à 07:59, Contact a écrit :

Bonjour

fslint (dans les dépôts) vient avec un utilitaire nommé findup

je n'ai jamais utilisé findup (mais j'ai utilisé fslint : ça marche bien)



Fslint est une boîte à outils pour nettoyer la charpie du système de
  fichiers. Il comprend une interface graphique GTK+ ainsi qu'une interface
en ligne de commande et peut être utilisé pour récupérer l'espace disque.
Il possède une interface pour la désinstallation des paquets, et il peut
trouver des choses comme :

    - les fichiers en double
  - les noms de fichiers problématiques
  - les fichiers temporaires
  - les mauvais liens symboliques
  - les répertoires vides
  - les binaires non dénudés




si ça peut aider


Le 10/02/2020 à 06:52, ptilou a écrit :

Bonjour,


J'ai plus de deux terra de données, du à une administration à la 
"légere" je me retrouve avec des doubles voir plus, ne portant pas les 
même: nom, date, etc ...


J'ai fait des sauvegardes, et je cherche un script batch libre, mais 
je peut utiliser perl, aussi, pour avoir un disque de travail plus 
petit !


Quelqu'un peut me donner le script ?

Merci







Re: [HS] recherche script batch pour doublons !

2020-02-10 Par sujet Marc Chantreux
salut,

j'ai nettoyé un répertoire de photos en utilisant ça:

that_duplicates () {
local ZERO="\x00"
xargs -0 sha1sum |
sed -r "s/ +/$ZERO/" |
awk -F$ZERO -vORS=$ZERO '!sum[$1]++ {print $2}'
}

c'est à utiliser avec un find devant et un xargs -0 rm derrière.

vu les volumes, la stratégie va compter: si tu as beaucoup de gros fichiers,
il serait peut-être intéressant de faire le sum seulement sur les
premiers ce qui permetterait un premier dédoublonage à l'arache.

cordialement,
marc



Re: [HS] recherche script batch pour doublons !

2020-02-10 Par sujet hamster
Le 10/02/2020 à 06:52, ptilou a écrit :
> je me retrouve avec des doubles voir plus, ne portant pas les même: nom, 
> date, etc ...
>
> J'ai fait des sauvegardes, et je cherche un script batch libre

Un ami me souffle rdfind dans l'oreillette, mais j'ai pas testé.



Re: [HS] recherche script batch pour doublons !

2020-02-10 Par sujet Maxime G.
Bonjour.

Je me suis servi de jdupes sur un nextcloud hébergeant des archives de 15 ans.
J'ai gagné ~20 Go de doublons accumulés et jamais triés ;)


10 février 2020 07:59 "Contact"  a écrit:

> Bonjour
> 
> fslint (dans les dépôts) vient avec un utilitaire nommé findup
> 
> je n'ai jamais utilisé findup (mais j'ai utilisé fslint : ça marche bien)
> 
> 
> 
> Fslint est une boîte à outils pour nettoyer la charpie du système de
> fichiers. Il comprend une interface graphique GTK+ ainsi qu'une interface
> en ligne de commande et peut être utilisé pour récupérer l'espace disque.
> Il possède une interface pour la désinstallation des paquets, et il peut
> trouver des choses comme :
> 
> - les fichiers en double
> - les noms de fichiers problématiques
> - les fichiers temporaires
> - les mauvais liens symboliques
> - les répertoires vides
> - les binaires non dénudés
> 
> 
> 
> si ça peut aider
> 
> Le 10/02/2020 à 06:52, ptilou a écrit :
> 
>> Bonjour,
>> 
>> J'ai plus de deux terra de données, du à une administration à la "légere" je 
>> me retrouve avec des
>> doubles voir plus, ne portant pas les même: nom, date, etc ...
>> 
>> J'ai fait des sauvegardes, et je cherche un script batch libre, mais je peut 
>> utiliser perl, aussi,
>> pour avoir un disque de travail plus petit !
>> 
>> Quelqu'un peut me donner le script ?
>> 
>> Merci



Re: [HS] recherche script batch pour doublons !

2020-02-09 Par sujet Contact

Bonjour

fslint (dans les dépôts) vient avec un utilitaire nommé findup

je n'ai jamais utilisé findup (mais j'ai utilisé fslint : ça marche bien)



Fslint est une boîte à outils pour nettoyer la charpie du système de
 fichiers. Il comprend une interface graphique GTK+ ainsi qu'une interface
en ligne de commande et peut être utilisé pour récupérer l'espace disque.
Il possède une interface pour la désinstallation des paquets, et il peut
trouver des choses comme :

   - les fichiers en double
 - les noms de fichiers problématiques
 - les fichiers temporaires
 - les mauvais liens symboliques
 - les répertoires vides
 - les binaires non dénudés




si ça peut aider


Le 10/02/2020 à 06:52, ptilou a écrit :

Bonjour,


J'ai plus de deux terra de données, du à une administration à la "légere" je me 
retrouve avec des doubles voir plus, ne portant pas les même: nom, date, etc ...

J'ai fait des sauvegardes, et je cherche un script batch libre, mais je peut 
utiliser perl, aussi, pour avoir un disque de travail plus petit !

Quelqu'un peut me donner le script ?

Merci





Re: [HS] recherche script batch pour doublons !

2020-02-09 Par sujet Manioul

Bonjour,

fdupes ?

On 09/02/2020 19:52, ptilou wrote:

Bonjour,


J'ai plus de deux terra de données, du à une administration à la "légere" je me 
retrouve avec des doubles voir plus, ne portant pas les même: nom, date, etc ...

J'ai fait des sauvegardes, et je cherche un script batch libre, mais je peut 
utiliser perl, aussi, pour avoir un disque de travail plus petit !

Quelqu'un peut me donner le script ?

Merci





[HS] recherche script batch pour doublons !

2020-02-09 Par sujet ptilou
Bonjour,


J'ai plus de deux terra de données, du à une administration à la "légere" je me 
retrouve avec des doubles voir plus, ne portant pas les même: nom, date, etc ...

J'ai fait des sauvegardes, et je cherche un script batch libre, mais je peut 
utiliser perl, aussi, pour avoir un disque de travail plus petit !

Quelqu'un peut me donner le script ?

Merci

-- 
ptilou