Re: Ordnung in Datensalat bringen

2004-07-08 Diskussionsfäden Christoph Löffler
Hallo,
Markus Meyer wrote:
Christoph LÃffler wrote:
Auch mÃglich wÃre ein chmod -R u+rwX,g-rwxst,o-rwxst /home/user
siehe `man chmod`, das grosse X setzt das nur bei Verzeichnissen.

Aber bitte Obacht bei 'chmod -R'. Wenn man symbolische Links in dem
Verzeichnis hat, dann folgt 'chmod' diesem. Von daher ist eigentlich immer
die 'find . -exec chmod' Methode vorzuziehen. Aber das ist ja bei Daten,
die vom Fenster rueberkopiert wurden eher nicht der Fall ;)
Ok, was stimmt jetzt?
aus 'man chmod'
chmod never changes the permissions of symbolic links; the chmod
system call cannot change their permissions. This is not a problem 
since the permissions of symbolic links are never used. However, for 
each symbolic link listed on the command line, chmod changes the 
permissions of the pointed-to file. In contrast, chmod ignores 
symbolic links encountered during recursive directory traversals.

Heisst, dass fÃr einen SymLink, den ich auf der Kommandozeile 
angebe, die Datei verÃndert wird, statt dem Link, die ja nie 
verÃndert werden.

Aber eben, beim rekursiven abarbeiten von Dateien und Verzeichnissen 
werden symbolische Links ignoriert.

phoenix:~# chmod --version
chmod (coreutils) 5.0.91
GrÃÃe
Chris
--
---
*  Christoph LÃffler - c.loeffler AT xtraport DOT de  *
*  Linux-User #346921 - visit http://counter.li.org/  *
*  Fingerprint: GnuPG *
*  9082 0E53 50C1 209C 0E6F 4E3A 26F0 83F3 072B 44B0  *
---
--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Jan Trippler
Am Mittwoch, 7. Juli 2004 20:01 schrieb Klaus Becker:
[...]
> Er versucht, mit Knoppix oder Mandrake10.0 *.jpg-Bilder zu öffnen
> oder z. B. *.doc-Dateien mit OO. Nichts geht. Den Befehl "file"
> kannte ich nicht, müssen wir erst noch ausprobieren.

file versucht anhand der "magic number" von Dateien bzw. durch eine 
Kurzanalyse der Inhalte herauszufinden, um was für einen Dateityp 
es sich handelt.

Bei Bildern kann Dir identify aus dem ImageMagick-Paket noch besser 
helfen.

> Die Dateien wurden mit rsync von einer Festplatte auf eine andere
> kopiert. Die Festplatte hat aber ein Problem: Mandrake kann sie
> nicht lesen und startet nicht, wenn sie eingehängt ist, knoppix
> stört das nicht, aber unter knoppix lassen sich nur einige der
> Dateien öffnen. Hier liegt sicher das Problem. Meiner Meinung
> nach ist es ein Hardware-Problem, das zuerst gelöst werden muss.
> Die Kopie der Dateien mit rsync von einer Festplatte, die ein
> Problem, ist sicher in die Hose gegangen.

Dann kannst Du z. B. über die Dateigröße und evtl. über eine 
Prüfsumme (md5sum, cksum) mal prüfen, ob die Dateien auch noch die 
gleichen sind wie auf der Originalplatte.

Jan



Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Klaus Becker
On Wednesday 07 July 2004 19:18, Jan Trippler wrote:
> Am Mittwoch, 7. Juli 2004 15:39 schrieb Klaus Becker:
> [Dateien nicht lesbar]
>
> > er hat "chown -R user /home/user" und dann "chmod -R 777
> > /home/user" eingegeben. (777 ist zuviel des Guten, aber es war
> > nur provisorisch für einen schnellen Test).
> >
> > "$chown user:grupe * -Rv" kenne ich nicht, du meinst sicher
> > "$chown user:groupe * -Rv" ? Ohne Angabe von /home/user?
> >
> > Aber auch als root sind die Dateien nicht lesbar, daher befürchte
> > ich, dass es nicht nur an den Zugriffsrechten liegt. Die Dateien
> > sind aber da, konqueror gibt ihre Grösse an.
>
> Was heisst denn "nicht lesbar"? Welche Fehlermeldung kommt? Was sagt
> "file "?
>
> Jan

Hallo Jan,

das Ganze spielt sich bei einem Kumpel ab, der von Tuten und Blasen (noch) 
keine Ahnung hat. Ich versuche, per Telefon seine Probleme zu lösen und ihn 
in Linux einzuführen. Im Moment hat er keine Internetverbindung.

Er versucht, mit Knoppix oder Mandrake10.0 *.jpg-Bilder zu öffnen oder z. B. 
*.doc-Dateien mit OO. Nichts geht. Den Befehl "file" kannte ich nicht, müssen 
wir erst noch ausprobieren.

Die Dateien wurden mit rsync von einer Festplatte auf eine andere kopiert. Die 
Festplatte hat aber ein Problem: Mandrake kann sie nicht lesen und startet 
nicht, wenn sie eingehängt ist, knoppix stört das nicht, aber unter knoppix 
lassen sich nur einige der Dateien öffnen. Hier liegt sicher das Problem.
Meiner Meinung nach ist es ein Hardware-Problem, das zuerst gelöst werden 
muss. Die Kopie der Dateien mit rsync von einer Festplatte, die ein Problem, 
ist sicher in die Hose gegangen.


bye
Klaus





-- 
       .~.        http://katalogdeutsch.net
       /V\        annuaire des ressources internet
     //    \\      pour l'allemand
    /(     )\
     ^`~'^    powered by Linux
 
 Veuillez ne pas me joindre de textes aux formats Word ou 
 PowerPoint, mais plutôt aux formats «html», «pdf», «rtf» ou «txt». Merci.
 Cf: http://www.fsf.org/philosophy/no-word-attachments.fr.html



Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Markus Meyer
Christoph LÃffler wrote:
> 
> Auch mÃglich wÃre ein chmod -R u+rwX,g-rwxst,o-rwxst /home/user
> 
> siehe `man chmod`, das grosse X setzt das nur bei Verzeichnissen.

Aber bitte Obacht bei 'chmod -R'. Wenn man symbolische Links in dem
Verzeichnis hat, dann folgt 'chmod' diesem. Von daher ist eigentlich immer
die 'find . -exec chmod' Methode vorzuziehen. Aber das ist ja bei Daten,
die vom Fenster rueberkopiert wurden eher nicht der Fall ;)


Gruss,

Markus


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)




Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Jan Trippler
Am Mittwoch, 7. Juli 2004 15:39 schrieb Klaus Becker:
[Dateien nicht lesbar]
> er hat "chown -R user /home/user" und dann "chmod -R 777
> /home/user" eingegeben. (777 ist zuviel des Guten, aber es war
> nur provisorisch für einen schnellen Test).
>
> "$chown user:grupe * -Rv" kenne ich nicht, du meinst sicher
> "$chown user:groupe * -Rv" ? Ohne Angabe von /home/user?
>
> Aber auch als root sind die Dateien nicht lesbar, daher befürchte
> ich, dass es nicht nur an den Zugriffsrechten liegt. Die Dateien
> sind aber da, konqueror gibt ihre Grösse an.

Was heisst denn "nicht lesbar"? Welche Fehlermeldung kommt? Was sagt 
"file "?

Jan



Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Alexander Schmehl
* Klaus Becker <[EMAIL PROTECTED]> [040707 17:32]:

>> find $HOME/das-80GB-Verzeichnis/ -type f -exec chmod 600 {} ';'
>> find $HOME/das-80GB-Verzeichnis/ -type d -exec chmod 700 {} ';'
> Worin besteht der unterschied zu "chmod -R 600 /home/user"?

Hast du dein Kommando mal probiert? Es geht schief, wenn es
Unterverzeichnise gibt, die Daten enthalten, weil du nicht mehr in die
Unterverzeichnisse wechelsn kannst. Und das dieses Szenario eintritt ist
doch relativ wahrscheinlich.


Yours sincerely,
  Alexander


signature.asc
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Michelle Konzack
Am 2004-07-07 17:32:26, schrieb Klaus Becker:
>On Wednesday 07 July 2004 17:17, Michelle Konzack wrote:

>> find $HOME/das-80GB-Verzeichnis/ -type f -exec chmod 600 {} ';'
>> find $HOME/das-80GB-Verzeichnis/ -type d -exec chmod 700 {} ';'
>
>Worin besteht der unterschied zu "chmod -R 600 /home/user"?

Das keine micht einemal Du mehr ins Verzeichnis Wecheln kannst, 
wenn Du es einaml verlassen hast. Es fehlt das "eXecutable" Flag

Dateien mit 600 sind wichlich NUR von DIR und ROOT lesbar, genauso 
wie Verzeichnis mit 700 NUR von DIR und ROOT betreten werden dürfen.

>Klaus

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Christoph Löffler
Hi,
Klaus Becker wrote:
On Wednesday 07 July 2004 17:17, Michelle Konzack wrote:
Am 2004-07-07 14:26:45, schrieb Rainer Bendig, Digitally Impressed:
$chown user:grupe * -Rv
Besser währe:
chown -R user. *
# Der Punkt setzt automatisch die Richtige GROUP für den Benutzer
find $HOME/das-80GB-Verzeichnis/ -type f -exec chmod 600 {} ';'
find $HOME/das-80GB-Verzeichnis/ -type d -exec chmod 700 {} ';'

Worin besteht der unterschied zu "chmod -R 600 /home/user"?
dabei wird alles (auch Verzeichnisse) auf 600 gesetzt, Michelles 
Lösung sorgt dafür, dass Verzeichnisse das Recht gesetzt bekommen, 
dass der User hineinwechseln kann.

Auch möglich wäre ein chmod -R u+rwX,g-rwxst,o-rwxst /home/user
siehe `man chmod`, das grosse X setzt das nur bei Verzeichnissen.
Grüße
Chris
--
---
*  Christoph Löffler - c.loeffler AT xtraport DOT de  *
*  Linux-User #346921 - visit http://counter.li.org/  *
*  Fingerprint: GnuPG *
*  9082 0E53 50C1 209C 0E6F 4E3A 26F0 83F3 072B 44B0  *
---
--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Klaus Becker
On Wednesday 07 July 2004 17:17, Michelle Konzack wrote:
> Am 2004-07-07 14:26:45, schrieb Rainer Bendig, Digitally Impressed:
> >$chown user:grupe * -Rv
>
> Besser währe:
>
> chown -R user. *
> # Der Punkt setzt automatisch die Richtige GROUP für den Benutzer
>
> find $HOME/das-80GB-Verzeichnis/ -type f -exec chmod 600 {} ';'
> find $HOME/das-80GB-Verzeichnis/ -type d -exec chmod 700 {} ';'

Worin besteht der unterschied zu "chmod -R 600 /home/user"?

Klaus



Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Michelle Konzack
Am 2004-07-07 14:26:45, schrieb Rainer Bendig, Digitally Impressed:

>$chown user:grupe * -Rv

Besser währe: 

chown -R user. *
# Der Punkt setzt automatisch die Richtige GROUP für den Benutzer

find $HOME/das-80GB-Verzeichnis/ -type f -exec chmod 600 {} ';'
find $HOME/das-80GB-Verzeichnis/ -type d -exec chmod 700 {} ';'
 ^^^
# Kann natürlich auch etwas liberaler gewählt werden :-)

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Klaus Becker
On Wednesday 07 July 2004 14:26, Rainer Bendig, Digitally Impressed wrote:
> Hossa Klaus, *,
>
> Klaus Becker schrieb am 07.07.2004 14:21:
> > Hallo Leute,
> >
> > mein Freund hat seine 80 GB Dateien unter /home/user kopiert und mit
> > entsprechenden Rechten ausgestattet, kann aber keine einzige Datei lesen.
> > Konqueror zeigt z. B. für jedes Bild einen kleinen Fotoapparat.
>
> $chown user:grupe * -Rv
>
> Das setzt deinen Freund "user" als eigentümer der Dateien fest. Leider
> reicht ein einfaches kopieren und chmodden als root nicht aus (na ja,
> leider, das ist ganz gut so...)

Hallo Rainer,

er hat "chown -R user /home/user" und dann "chmod -R 777 /home/user" 
eingegeben. (777 ist zuviel des Guten, aber es war nur provisorisch für einen 
schnellen Test).

"$chown user:grupe * -Rv" kenne ich nicht, du meinst sicher
"$chown user:groupe * -Rv" ? Ohne Angabe von /home/user?

Aber auch als root sind die Dateien nicht lesbar, daher befürchte ich, dass es 
nicht nur an den Zugriffsrechten liegt. Die Dateien sind aber da, konqueror 
gibt ihre Grösse an.

bye
Klaus




Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Gerd Terlutter
Klaus Becker wrote:
Hallo Leute,
mein Freund hat seine 80 GB Dateien unter /home/user kopiert und mit 
entsprechenden Rechten ausgestattet, kann aber keine einzige Datei lesen. 
Konqueror zeigt z. B. für jedes Bild einen kleinen Fotoapparat.

Da die Deteien alle von Win98 kommen, liegt das Problem vermutlich dort. Wer 
kann helfen?

Klaus
wieso fangen neue threads mitllerweile wieder mit Re: an? kann dein 
mailclient keine neuen threads erstellen?

--
# Gerd Terlutter | Müller+Blanck Software GmbH #
# office:+49 40 500 171-1| http://www.mplusb.de#


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Rainer Bendig, Digitally Impressed
Hossa Klaus, *,
Klaus Becker schrieb am 07.07.2004 14:21:
Hallo Leute,
mein Freund hat seine 80 GB Dateien unter /home/user kopiert und mit 
entsprechenden Rechten ausgestattet, kann aber keine einzige Datei lesen. 
Konqueror zeigt z. B. für jedes Bild einen kleinen Fotoapparat.
$chown user:grupe * -Rv
Das setzt deinen Freund "user" als eigentümer der Dateien fest. Leider 
reicht ein einfaches kopieren und chmodden als root nicht aus (na ja, 
leider, das ist ganz gut so...)

--
so long,
Rainer Bendig aka mindz PGP/GPG key  (ID: 0x1D2BE499)
http://DigitallyImpressed.com   get it from wwwkeys.de.pgp.net
for contacting me take a look on http://digitallyimpressed.com/contact
--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Klaus Becker
Hallo Leute,

mein Freund hat seine 80 GB Dateien unter /home/user kopiert und mit 
entsprechenden Rechten ausgestattet, kann aber keine einzige Datei lesen. 
Konqueror zeigt z. B. für jedes Bild einen kleinen Fotoapparat.

Da die Deteien alle von Win98 kommen, liegt das Problem vermutlich dort. Wer 
kann helfen?

Klaus



Re: Ordnung in Datensalat bringen

2004-07-06 Diskussionsfäden Thomas Piekarski
On Sunday, the  4. July 2004 [UTC: 1088931207]
[EMAIL PROTECTED] (Joerg Rieger) writes...
> 
> Also sowas mach ich auch:
> 
> find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D >
> double.txt
> 
> Dauert bei 80 GB gaaanz schön lang.
> 

Weshalb verwendest du bei einer solchen Datenmenge und bei einem
solchen Zweck MD5 Checksummen? Da bei diesem Zweck die Sicherheit der
Checksummen kaum eine Rolle spielt, waere es doch schneller wenn du
auf einfachere Checksummen zurueckgreifen wurdest, wie zum Beispiel 
SFV (simple file verify) oder CSV (comma seperated vaules). Solche
Checksummen sind mit cfv schneller generiert als MD5
Checksummen.


Gruss, Thomas.

___
Packete:

Package: cfv
Section: utils
Filename: pool/main/c/cfv/cfv_1.11-1_all.deb
Description: 
tests and creates .sfv, .csv and md5 files
cfv is a utility to both test and create .sfv (Simple File
Verify).csv, and md5sum files. These files are commonly used
to ensure the correct retrieval or storage of data.



pgpWYkG2N53kq.pgp
Description: PGP signature


Re: Ordnung in Datensalat bringen

2004-07-05 Diskussionsfäden Joerg Rieger
On Sun, Jul 04, 2004 at 08:34:38PM +0200, Dieter Franzke wrote:
> On Sunday 04 July 2004 20:23, Joerg Rieger wrote:
> > On Sun, Jul 04, 2004 at 08:04:59PM +0200, Thomas Vollmer wrote:
> > > On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
> > >
> > > [...]
> > >
> > > > Also sowas mach ich auch:
> > > >
> > > > find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D >
> > > > double.txt
> > > >
> > > > Dauert bei 80 GB gaaanz schön lang.
> > >
> > > außerdem hat der Ansatz ein weiteres Problem. Er findet Doubletten nur
> > > bei 100%iger  Gleichheit. Man denke mal an JPEGs bei denen mal der EXIF
> > > Header angefasst wurde, das Bild gedreht oder eine Farbkorrektur
> > > vorgenommen wurde. Oder diverse Officeformate wo bei einer Version nur
> > > mal auf Speichern gedrückt wurde. Dies sind inhaltlich gleiche Dateien
> > > deren Hash sich aber durchaus unterscheidet.
> >
> > Das ist richtig. Nur würde es ungleich aufwendiger, wenn man, wie in
> > deinen Beispielen, noch solche Fälle berücksichtigen würde.
> 
> für so etwas gibt es auch fertiges:
> filedupe, läuft bei mir unter BSD.
> Ob es ein .deb gibt entzieht sich im Moment meiner Kenntnis

Zumindest in unstable gibts eins Package: fdupes

Geht auch deutlich flotter zur Sache als meine "Lösung" bei gleichen 
Daten:

fdupes
real0m3.000s
user0m1.518s
sys 0m0.625s

find+md5sum&co
real0m37.227s
user0m20.852s
sys 0m4.438s


-- 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Dieter Franzke
Hi,

On Sunday 04 July 2004 20:23, Joerg Rieger wrote:
> On Sun, Jul 04, 2004 at 08:04:59PM +0200, Thomas Vollmer wrote:
> > On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
> > > On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
> > > > Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
> > > > >Michelle Konzack schrieb am 03.07.2004 22:30:
> >
> > [...]
> >
> > > Also sowas mach ich auch:
> > >
> > > find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D >
> > > double.txt
> > >
> > > Dauert bei 80 GB gaaanz schön lang.
> >
> > außerdem hat der Ansatz ein weiteres Problem. Er findet Doubletten nur
> > bei 100%iger  Gleichheit. Man denke mal an JPEGs bei denen mal der EXIF
> > Header angefasst wurde, das Bild gedreht oder eine Farbkorrektur
> > vorgenommen wurde. Oder diverse Officeformate wo bei einer Version nur
> > mal auf Speichern gedrückt wurde. Dies sind inhaltlich gleiche Dateien
> > deren Hash sich aber durchaus unterscheidet.
>
> Das ist richtig. Nur würde es ungleich aufwendiger, wenn man, wie in
> deinen Beispielen, noch solche Fälle berücksichtigen würde.

für so etwas gibt es auch fertiges:
filedupe, läuft bei mir unter BSD.
Ob es ein .deb gibt entzieht sich im Moment meiner Kenntnis


ciao


dieter 



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Joerg Rieger
On Sun, Jul 04, 2004 at 08:04:59PM +0200, Thomas Vollmer wrote:
> On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
> > On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
> > > Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
> > > >Michelle Konzack schrieb am 03.07.2004 22:30:
> 
> [...]
> 
> > Also sowas mach ich auch:
> >
> > find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D >
> > double.txt
> >
> > Dauert bei 80 GB gaaanz schön lang.
> 
> außerdem hat der Ansatz ein weiteres Problem. Er findet Doubletten nur 
> bei 100%iger  Gleichheit. Man denke mal an JPEGs bei denen mal der EXIF 
> Header angefasst wurde, das Bild gedreht oder eine Farbkorrektur 
> vorgenommen wurde. Oder diverse Officeformate wo bei einer Version nur 
> mal auf Speichern gedrückt wurde. Dies sind inhaltlich gleiche Dateien 
> deren Hash sich aber durchaus unterscheidet.

Das ist richtig. Nur würde es ungleich aufwendiger, wenn man, wie in 
deinen Beispielen, noch solche Fälle berücksichtigen würde.

-- 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Joerg Rieger
On Sun, Jul 04, 2004 at 03:06:18PM +0200, Klaus Becker wrote:
> On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
> > find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D > double.txt
> >
> > Dauert bei 80 GB gaaanz schön lang.
> 
> mit Sicherheit, aber da kann man nichts dran machen. Ich hab's mal 
> ausprobiert: funktionniert, aber eine Frage: warum md5sum, und wenn md5sum 
> schon notwendig ist, ist das Anzeigen der Ergebnisse von md5sum wirklich 
> nützlich und kann man es nicht eventuell abstellen?

Nun, stell dir einfach mal die frage:
Wie stellt man am besten fest, ob eine oder mehrere Dateien gleich sind?

Jetzt könnte man natürlich spontan sagen: Ist doch klar, gleicher 
Dateiname auch gleiche Datei.

Das geht aber nicht mit jeder Datei gut. Z.B.: gibts mit Sicherheit bei 
vielen Source Code Dateien eine Datei names Makefile oder README's etc.

Ok, dann nächste Kriterium: Dateigrösse oder Dateidatum. Aber wenn man 
kurz darüber nachdenkt, geht das u.U. ebenfalls in die Hose. Eine 
gleichnamige Textdatei kann ja gleichgross sein, aber völlig 
unterschiedlichen Inhalt haben.

Daher der Umweg über einen Hashwert. Anhand des Hashwertes wird 
die Liste der Dateien sortiert und nur doppelte Hash Werte werden 
letzendlich ausgegeben. Man könnte die Ausgabe dann nochmal bearbeiten 
und den Hash wieder entfernen:

find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D | awk '{print $2}' - > 
double.txt


-- 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Thomas Vollmer
On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
> On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
> > Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
> > >Michelle Konzack schrieb am 03.07.2004 22:30:

Hi,

[...]

> Also sowas mach ich auch:
>
> find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D >
> double.txt
>
> Dauert bei 80 GB gaaanz schön lang.

außerdem hat der Ansatz ein weiteres Problem. Er findet Doubletten nur 
bei 100%iger  Gleichheit. Man denke mal an JPEGs bei denen mal der EXIF 
Header angefasst wurde, das Bild gedreht oder eine Farbkorrektur 
vorgenommen wurde. Oder diverse Officeformate wo bei einer Version nur 
mal auf Speichern gedrückt wurde. Dies sind inhaltlich gleiche Dateien 
deren Hash sich aber durchaus unterscheidet.

Gruß
Thomas

-- 
IRC: TomseDive  Jabber: [EMAIL PROTECTED]   ICQ: 4843585


pgptdtZekDAYS.pgp
Description: PGP signature


Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Michelle Konzack
Hallo Klaus, 

Am 2004-07-04 15:06:18, schrieb Klaus Becker:

>auf jeden Fall vielen Dank, das ist genau das, was mein Kumpel suchte. Er hat 
>übrigens inzwischen seine Dateien mit knoppix und rsync auf die gewollte 
>Festplatte kopiert. Sonderbar ist, dass sich auf der Zielpartition viel mehr 
>Dateien befinden als auf der Quellpartition. Das gilt für manche Ordner, bei 
>anderen Ordnern stimmt die Zahl der darin befindlichen Dateien überein.

Sieht nach einem UTF-8 problem aus :-)
Hatte Peer am Anfang auch. Wegen WinXP und dem Samba-Server

>tschüs
>Klaus

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Klaus Becker
On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
> On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
> > Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
> > >Hossa *,
> > >
> > >Michelle Konzack schrieb am 03.07.2004 22:30:
> > >>Also Peer, ein Bekannter von mir in Offenburg hat als erstes die
> > >>hash-Werte aller Dateien ermittelt und dann sortiert...
> > >
> > >dazu gibt es nen nettes prog ... "md5tree"  nur hab ich im Augenblick
> > >keine Ahnung woher das beziehen ist ...  Auch ne kurze googlei blieb
> > >ohne nennenswerte ergebnisse ...
> >
> > Ja, ich hatte es aber mit md5sums gemacht.
> > Also ich habe es mit find und ner schleife.
> > Jedesmal wenn find eine Datei gefunden hat, hat er den die md5-Summe
> > berechnet, in eine Datei geschrieben, ein TABSTOP angehängt und dann
> > den Pfad/Datei.
>
> Also sowas mach ich auch:
>
> find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D > double.txt
>
> Dauert bei 80 GB gaaanz schön lang.

mit Sicherheit, aber da kann man nichts dran machen. Ich hab's mal 
ausprobiert: funktionniert, aber eine Frage: warum md5sum, und wenn md5sum 
schon notwendig ist, ist das Anzeigen der Ergebnisse von md5sum wirklich 
nützlich und kann man es nicht eventuell abstellen?

auf jeden Fall vielen Dank, das ist genau das, was mein Kumpel suchte. Er hat 
übrigens inzwischen seine Dateien mit knoppix und rsync auf die gewollte 
Festplatte kopiert. Sonderbar ist, dass sich auf der Zielpartition viel mehr 
Dateien befinden als auf der Quellpartition. Das gilt für manche Ordner, bei 
anderen Ordnern stimmt die Zahl der darin befindlichen Dateien überein.

Aber 1. schreibt rsync nicht auf die Quellpartition, 2. war sie nicht mit 
Schreibrechten gemountet. Es kann sich IMHO nur um ein Anzeige-Problem von 
knoppix und/oder konqueror handeln.

tschüs
Klaus



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Michelle Konzack
Am 2004-07-04 10:53:27, schrieb Joerg Rieger:

>Also sowas mach ich auch:
>
>find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D > double.txt
>
>Dauert bei 80 GB gaaanz schön lang.

:-)

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Martin Schmitz
Michelle Konzack <[EMAIL PROTECTED]> writes:

> Am 2004-07-03 15:55:33, schrieb Klaus Becker:
>>Hallo Leute,
>
>>Vielleicht gibt es ein Skript um so etwas zu automatisieren oder vielleicht 
>>ist jemand bereit, ein Skript zu erstellen? Ich kann leider nicht 
>>programmieren, sonst wÃrde ich es selbst versuchen. Ich denke an den Einsatz 
>>von diff, find usw. 
>
> Also Peer, ein Bekannter von mir in Offenburg hat als erstes die 
> hash-Werte aller Dateien ermittelt und dann sortiert...
>
> Mit der Tabelle dann die doppelten gelÃscht... usw...

Das funktioniert aber nur in Offenburg!

scnr,
Martin


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Joerg Rieger
On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
> Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
> >Hossa *,
> >Michelle Konzack schrieb am 03.07.2004 22:30:
> >
> >>Also Peer, ein Bekannter von mir in Offenburg hat als erstes die 
> >>hash-Werte aller Dateien ermittelt und dann sortiert...
> >dazu gibt es nen nettes prog ... "md5tree"  nur hab ich im Augenblick 
> >keine Ahnung woher das beziehen ist ...  Auch ne kurze googlei blieb 
> >ohne nennenswerte ergebnisse ...
> 
> Ja, ich hatte es aber mit md5sums gemacht.
> Also ich habe es mit find und ner schleife.
> Jedesmal wenn find eine Datei gefunden hat, hat er den die md5-Summe 
> berechnet, in eine Datei geschrieben, ein TABSTOP angehängt und dann 
> den Pfad/Datei. 

Also sowas mach ich auch:

find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D > double.txt

Dauert bei 80 GB gaaanz schön lang.

-- 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Michelle Konzack
Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
>Hossa *,
>Michelle Konzack schrieb am 03.07.2004 22:30:
>
>>Also Peer, ein Bekannter von mir in Offenburg hat als erstes die 
>>hash-Werte aller Dateien ermittelt und dann sortiert...
>dazu gibt es nen nettes prog ... "md5tree"  nur hab ich im Augenblick 
>keine Ahnung woher das beziehen ist ...  Auch ne kurze googlei blieb 
>ohne nennenswerte ergebnisse ...

Ja, ich hatte es aber mit md5sums gemacht.
Also ich habe es mit find und ner schleife.
Jedesmal wenn find eine Datei gefunden hat, hat er den die md5-Summe 
berechnet, in eine Datei geschrieben, ein TABSTOP angehängt und dann 
den Pfad/Datei. 

Naja, unter Linux gibt es immer mehr wege.

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Rainer Bendig, Digitally Impressed
Hossa *,
Michelle Konzack schrieb am 03.07.2004 22:30:
Also Peer, ein Bekannter von mir in Offenburg hat als erstes die 
hash-Werte aller Dateien ermittelt und dann sortiert...
dazu gibt es nen nettes prog ... "md5tree"  nur hab ich im Augenblick 
keine Ahnung woher das beziehen ist ...  Auch ne kurze googlei blieb 
ohne nennenswerte ergebnisse ...

--
so long,
Rainer Bendig aka mindz PGP/GPG key  (ID: 0x1D2BE499)
http://DigitallyImpressed.com   get it from wwwkeys.de.pgp.net
for contacting me take a look on http://digitallyimpressed.com/contact
--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)


Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Michelle Konzack
Am 2004-07-03 15:55:33, schrieb Klaus Becker:
>Hallo Leute,

>Vielleicht gibt es ein Skript um so etwas zu automatisieren oder vielleicht 
>ist jemand bereit, ein Skript zu erstellen? Ich kann leider nicht 
>programmieren, sonst würde ich es selbst versuchen. Ich denke an den Einsatz 
>von diff, find usw. 

Also Peer, ein Bekannter von mir in Offenburg hat als erstes die 
hash-Werte aller Dateien ermittelt und dann sortiert...

Mit der Tabelle dann die doppelten gelöscht... usw...

>bye
>Klaus

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Klaus Becker
On Saturday 03 July 2004 17:36, Dieter Franzke wrote:
> Hi,
>
> On Saturday 03 July 2004 16:40, Klaus Becker wrote:
> > On Saturday 03 July 2004 15:55, Klaus Becker wrote:
> > > Hallo Leute,
> > >
> > > es geht immer noch um den Rechner eines Freundes, der 80 GB/GO von
> > > einer Festplatte auf eine andere kopieren muss.
> > >
> > > Wenn die Daten einmal kopiert sind, kommt das 2. Problem: unter den 80
> > > GB kommen viele Daten und Ordner mehrfach vor, kurz es herrscht Chaos.
> > > Manuell dauert es sicher Tage und Wochen, um da Ordnung rein zu
> > > bringen, und die Wahrscheinlichkeit menschlicher Fehler ist gross.
> > >
> > > Vielleicht gibt es ein Skript um so etwas zu automatisieren oder
> > > vielleicht ist jemand bereit, ein Skript zu erstellen? Ich kann leider
> > > nicht programmieren, sonst würde ich es selbst versuchen. Ich denke an
> > > den Einsatz von diff, find usw.
> >
> > Ich sollte vielleicht noch präzisieren: das Ziel ist, von allen Dateien
> > nur eine Version zu behalten, und zwar die (zeitlich) letzte.

Ich erfahre gerade, die Dateien haben alle das gleiche Datum.

>
> man rsync
> man find
> man tar

Ok, aber ich kann nicht mein Leben damit verbringen, es gibt vielleicht Leute, 
die so ein Skript schon haben oder es relativ schnell schreiben können. Ich 
würde Stunden dafür brauchen, ohne sicher zu sein, dass ich mein Ziel 
erreiche. Listen sind doch auch dafür da, um um konkrete Hilfe zu bitten.

>
> hat das mit rsync denn nicht funktioniert?
> Wie hast du rsync aufgerufen?

rsync -auv --ignore-errors Quelle Ziel

Die Sache läuft zur Zeit, mein Freund ruft mich an, wenn alles fertig ist.

Klaus



Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Dieter Franzke
Hi,

On Saturday 03 July 2004 16:40, Klaus Becker wrote:
> On Saturday 03 July 2004 15:55, Klaus Becker wrote:
> > Hallo Leute,
> >
> > es geht immer noch um den Rechner eines Freundes, der 80 GB/GO von einer
> > Festplatte auf eine andere kopieren muss.
> >
> > Wenn die Daten einmal kopiert sind, kommt das 2. Problem: unter den 80 GB
> > kommen viele Daten und Ordner mehrfach vor, kurz es herrscht Chaos.
> > Manuell dauert es sicher Tage und Wochen, um da Ordnung rein zu bringen,
> > und die Wahrscheinlichkeit menschlicher Fehler ist gross.
> >
> > Vielleicht gibt es ein Skript um so etwas zu automatisieren oder
> > vielleicht ist jemand bereit, ein Skript zu erstellen? Ich kann leider
> > nicht programmieren, sonst würde ich es selbst versuchen. Ich denke an
> > den Einsatz von diff, find usw.
>
> Ich sollte vielleicht noch präzisieren: das Ziel ist, von allen Dateien nur
> eine Version zu behalten, und zwar die (zeitlich) letzte.

man rsync
man find
man tar

hat das mit rsync denn nicht funktioniert?
Wie hast du rsync aufgerufen?

dieter



Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Klaus Becker
On Saturday 03 July 2004 15:55, Klaus Becker wrote:
> Hallo Leute,
>
> es geht immer noch um den Rechner eines Freundes, der 80 GB/GO von einer
> Festplatte auf eine andere kopieren muss.
>
> Wenn die Daten einmal kopiert sind, kommt das 2. Problem: unter den 80 GB
> kommen viele Daten und Ordner mehrfach vor, kurz es herrscht Chaos. Manuell
> dauert es sicher Tage und Wochen, um da Ordnung rein zu bringen, und die
> Wahrscheinlichkeit menschlicher Fehler ist gross.
>
> Vielleicht gibt es ein Skript um so etwas zu automatisieren oder vielleicht
> ist jemand bereit, ein Skript zu erstellen? Ich kann leider nicht
> programmieren, sonst würde ich es selbst versuchen. Ich denke an den
> Einsatz von diff, find usw.

Ich sollte vielleicht noch präzisieren: das Ziel ist, von allen Dateien nur 
eine Version zu behalten, und zwar die (zeitlich) letzte.

bye
Klaus



Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Klaus Becker
Hallo Leute,

es geht immer noch um den Rechner eines Freundes, der 80 GB/GO von einer 
Festplatte auf eine andere kopieren muss.

Wenn die Daten einmal kopiert sind, kommt das 2. Problem: unter den 80 GB 
kommen viele Daten und Ordner mehrfach vor, kurz es herrscht Chaos. Manuell 
dauert es sicher Tage und Wochen, um da Ordnung rein zu bringen, und die 
Wahrscheinlichkeit menschlicher Fehler ist gross.

Vielleicht gibt es ein Skript um so etwas zu automatisieren oder vielleicht 
ist jemand bereit, ein Skript zu erstellen? Ich kann leider nicht 
programmieren, sonst würde ich es selbst versuchen. Ich denke an den Einsatz 
von diff, find usw. 

bye
Klaus