Des Rätsels Lösung zu Re: Server verliert Netzwerkverbindung unter Etch

2006-08-30 Diskussionsfäden Jan Luehr
ja hallo erstmal,...

z
Am Freitag, 18. August 2006 14:30 schrieb Jan Luehr:
 ja hallo erstmal,..

 langsam habe ich das Gefühl, dass sich eine ungünstige Aura um meinen
 Server breitgemacht hat.
 Derzeit habe ich das Problem, dass der Server die Verbindung zum
 Netzwerkverliert (ohne Einträge in der dmesg). Nach einem ifdown / ifup
 findet er sie wieder. 

Es lagen zwei Probleme vor:
- Eine der Netzwerkkarten (die DLink-LWL-Link) ist wohl defekt (oder es liegt 
ein Treiber Problem vor), daher verlor sie sehr schnell die Verbindung zum 
Netzwerk.
- Weiterhin bestand ein IP-Adress-Konflikt, der ebenfalls zu 
Verbindungsausfällen führte.

Keep smiling
yanosz



Re: Server verliert Netzwerkverbindung unter Etch, Nachtrag

2006-08-21 Diskussionsfäden Peter Kuechler
Am Samstag, den 19.08.2006, 15:07 +0200 schrieb Peter Kuechler:
 Am Samstag, 19. August 2006 11:58 schrieb Peter Kuechler:
  Am Freitag, 18. August 2006 14:30 schrieb Jan Luehr:
   ja hallo erstmal,..
  
   langsam habe ich das Gefühl, dass sich eine ungünstige Aura um meinen
   Server breitgemacht hat.
[...]
 So eben ist es wieder aufgetreten, wieder die gleichen Symtome:
 
 Ping an die eigene IP geht, raus geht nix mehr. 
 Netzwerkkartenmodul sk98lin entladen/geladen hat nix gebracht.
 
 Sehr merkwürdig.
 Leider hatte ich vorhin keine Zeit um noch etwas zu experimentieren, beim 
 nächsten mal werd ich noch etwas mehr testen.

So, neue Ergebnisse:-(
Als heute Morgen ins Büro kam sah mein Arbeitsplatzrechner etqwas dumm
aus: 

Kein Netzwerkzugang mehr!

Gleiche Hardware wie zu Hause, Kernel 2.6.18-rc4.
Ich habe jetzt wieder einen 2.6.17.9 installiert, verspreche mir davon
aber nicht sehr viel. Grund:

Ich habe mir die Orginalmail noch mal durchgelesen. Da war die Rede von
Kerneln ab 2.6.15. Zu dieser Zeit hatte ich die Probleme aber noch
nicht. Ausserdem habe ich hier Server laufen mit Kerneln u.a. 
1x 2.6.16.11
3x 2.6.17.2
Keiner hat dieses Problem. 

Auf den anderen Servern laufen noch ältere Kernel, dürfte hier nicht
interessant sein.

Was mir aber auffällt ist, das die Rechner, auf denen das auftritt
tagesaktuelle SID sind, auf den Servern allerdings eine etwas ältere
SID. Könnte sich das Problem nicht auch mit einem Softwarepaket
eingeschlichen haben?

Das erschein mir inzwischen wahrscheinlicher.

-- 
mfg Peter Küchler


Informations- und Kommunikationstechnik (IKT)
Planungsverband Ballungsraum 
Frankfurt / Rhein-Main 
Poststraße 16 
60329 Frankfurt am Main 
Tel.: +49 69 2577-1301 
Fax.: +49 69 2577-41301 
E-Mail: [EMAIL PROTECTED] 
www.planungsverband.de



Re: Server verliert Netzwerkverbindung unter Etch

2006-08-21 Diskussionsfäden Jan Luehr
ja hallo erstmal,..

Am Freitag, 18. August 2006 14:40 schrieb Dirk Ullrich:
 Das gibt es massig mögliche Ursachen. Um sich erstmal einen Überblick
 zu verschaffen:
 (1) Was hast Du sonst an PCI-Ressourcen?
  (Was gibt z.B. lspci aus?)

00:00.0 Host bridge: Intel Corporation 955X Express Memory Controller Hub (rev 
81)
00:01.0 PCI bridge: Intel Corporation 955X Express PCI Express Root Port (rev 
81)
00:1c.0 PCI bridge: Intel Corporation 82801G (ICH7 Family) PCI Express Port 1 
(rev 01)
00:1c.5 PCI bridge: Intel Corporation 82801GR/GH/GHM (ICH7 Family) PCI Express 
Port 6 (rev 01)
00:1d.0 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI #1 
(rev 01)
00:1d.1 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI #2 
(rev 01)
00:1d.2 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI #3 
(rev 01)
00:1d.3 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI #4 
(rev 01)
00:1d.7 USB Controller: Intel Corporation 82801G (ICH7 Family) USB2 EHCI 
Controller (rev 01)
00:1e.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev e1)
00:1e.2 Multimedia audio controller: Intel Corporation 82801G (ICH7 Family) 
AC'97 Audio Controller (rev 01)
00:1f.0 ISA bridge: Intel Corporation 82801GB/GR (ICH7 Family) LPC Interface 
Bridge (rev 01)
00:1f.1 IDE interface: Intel Corporation 82801G (ICH7 Family) IDE Controller 
(rev 01)
00:1f.2 IDE interface: Intel Corporation 82801GB/GR/GH (ICH7 Family) Serial 
ATA Storage Controller IDE (rev 01)
00:1f.3 SMBus: Intel Corporation 82801G (ICH7 Family) SMBus Controller (rev 
01)
01:00.0 VGA compatible controller: ATI Technologies Inc RV370 5B60 [Radeon 
X300 (PCIE)]
01:00.1 Display controller: ATI Technologies Inc RV370 [Radeon X300SE]
02:00.0 PCI bridge: Intel Corporation 6702PXH PCI Express-to-PCI Bridge A (rev 
09)
02:00.1 PIC: Intel Corporation 6700/6702PXH I/OxAPIC Interrupt Controller A 
(rev 09)
03:07.0 Ethernet controller: D-Link System Inc DL2000-based Gigabit Ethernet 
(rev 07)
04:00.0 Ethernet controller: Intel Corporation 82573L Gigabit Ethernet 
Controller

 (2) Wie ist / sind Deine Netzwerkkarte / -karten konfiguriert?
  (Inhalt von /etc/network/interfaces)

# The loopback network interface
auto lo eth0 eth1
iface lo inet loopback

# The primary network interface
#allow-hotplug eth0
#iface eth0 inet dhcp
iface eth1 inet static
address 192.168.1.204
netmask 255.255.224.0
broadcast 192.168.32.255
gateway 192.168.1.253

iface eth0 inet static
address 192.168.100.204
netmask 255.255.255.0
#   broadcast 192.168.32.255
#   gateway 192.168.1.253

(eth0 ist die Inboard Intel-GBit, eth1, die D-Link LWL. Je nach dem, was ich 
gerade teste, kommentiere)

Keep smiling
yanosz



Re: Server verliert Netzwerkverbindung unter Etch

2006-08-21 Diskussionsfäden Jan Luehr
ja hallo erstmal,...

Am Freitag, 18. August 2006 15:36 schrieb Gerhard Brauer:
 Gruesse!

 * Jan Luehr [EMAIL PROTECTED] schrieb am [18.08.06 14:30]:
  ja hallo erstmal,..
 
  langsam habe ich das Gefühl, dass sich eine ungünstige Aura um meinen
  Server breitgemacht hat.

 Irgendein Win-Rechner in der Nähe? ;-)

Nein - nur BSD. Evtl. piekst der Teufel

  Derzeit habe ich das Problem, dass der Server die Verbindung zum
  Netzwerkverliert (ohne Einträge in der dmesg).

 Definiere Netzwerk verliert genauer.
 Ist die Verbindung nur auf der Protokoll-Ebene (tcp, ping etc.) weg
 oder auch z.B. auf MAC-Ebene (also arp, was sagt arping)?

Nur auf Protokollebene. arping kommt weiter durch.

Danke,
Keep smiling
yanosz



Re: Server verliert Netzwerkverbindung unter Etch, Nachtrag

2006-08-21 Diskussionsfäden Jan Luehr
ja hallo erstmal,...

Am Montag, 21. August 2006 10:28 schrieb Peter Kuechler:
 Am Samstag, den 19.08.2006, 15:07 +0200 schrieb Peter Kuechler:
  Am Samstag, 19. August 2006 11:58 schrieb Peter Kuechler:
   Am Freitag, 18. August 2006 14:30 schrieb Jan Luehr:
ja hallo erstmal,..
   
langsam habe ich das Gefühl, dass sich eine ungünstige Aura um meinen
Server breitgemacht hat.

 [...]

  So eben ist es wieder aufgetreten, wieder die gleichen Symtome:
 
  Ping an die eigene IP geht, raus geht nix mehr.
  Netzwerkkartenmodul sk98lin entladen/geladen hat nix gebracht.
 
  Sehr merkwürdig.
  Leider hatte ich vorhin keine Zeit um noch etwas zu experimentieren, beim
  nächsten mal werd ich noch etwas mehr testen.

 So, neue Ergebnisse:-(
 Als heute Morgen ins Büro kam sah mein Arbeitsplatzrechner etqwas dumm
 aus:

 Kein Netzwerkzugang mehr!

 Gleiche Hardware wie zu Hause, Kernel 2.6.18-rc4.
 Ich habe jetzt wieder einen 2.6.17.9 installiert, verspreche mir davon
 aber nicht sehr viel. Grund:

 Ich habe mir die Orginalmail noch mal durchgelesen. Da war die Rede von
 Kerneln ab 2.6.15. Zu dieser Zeit hatte ich die Probleme aber noch
 nicht. Ausserdem habe ich hier Server laufen mit Kerneln u.a.
 1x 2.6.16.11
 3x 2.6.17.2
 Keiner hat dieses Problem.

 Auf den anderen Servern laufen noch ältere Kernel, dürfte hier nicht
 interessant sein.

 Was mir aber auffällt ist, das die Rechner, auf denen das auftritt
 tagesaktuelle SID sind, auf den Servern allerdings eine etwas ältere
 SID. Könnte sich das Problem nicht auch mit einem Softwarepaket
 eingeschlichen haben?

Eh - das wäre denkbar. Ich habe nur keinen blassen Schimmer woran das liegt. 
Nur welches Paket wäre dazu in der Lage?

Keep smiling
yanosz



Re: Server verliert Netzwerkverbindung unter Etch, Nachtrag

2006-08-21 Diskussionsfäden Peter Kuechler
Am Montag, den 21.08.2006, 12:01 +0200 schrieb Jan Luehr:
 ja hallo erstmal,...
 
 Am Montag, 21. August 2006 10:28 schrieb Peter Kuechler:
  Am Samstag, den 19.08.2006, 15:07 +0200 schrieb Peter Kuechler:
   Am Samstag, 19. August 2006 11:58 schrieb Peter Kuechler:
Am Freitag, 18. August 2006 14:30 schrieb Jan Luehr:
 ja hallo erstmal,..

 langsam habe ich das Gefühl, dass sich eine ungünstige Aura um meinen
 Server breitgemacht hat.
[...]
  Was mir aber auffällt ist, das die Rechner, auf denen das auftritt
  tagesaktuelle SID sind, auf den Servern allerdings eine etwas ältere
  SID. Könnte sich das Problem nicht auch mit einem Softwarepaket
  eingeschlichen haben?
 
 Eh - das wäre denkbar. Ich habe nur keinen blassen Schimmer woran das liegt. 
 Nur welches Paket wäre dazu in der Lage?

Gute Frage, ich weiß es nicht.
Wie geht man ein solches Problem, bzw. solch eine Suche ran?
Das wird was werden...



-- 
mfg Peter Küchler


Informations- und Kommunikationstechnik (IKT)
Planungsverband Ballungsraum 
Frankfurt / Rhein-Main 
Poststraße 16 
60329 Frankfurt am Main 
Tel.: +49 69 2577-1301 
Fax.: +49 69 2577-41301 
E-Mail: [EMAIL PROTECTED] 
www.planungsverband.de



Re: Server verliert Netzwerkverbindung unter Etch

2006-08-21 Diskussionsfäden Gerhard Brauer
Gruesse!
* Jan Luehr [EMAIL PROTECTED] schrieb am [21.08.06 11:59]:
 Am Freitag, 18. August 2006 15:36 schrieb Gerhard Brauer:
 
   Derzeit habe ich das Problem, dass der Server die Verbindung zum
   Netzwerkverliert (ohne Einträge in der dmesg).
 
  Definiere Netzwerk verliert genauer.
  Ist die Verbindung nur auf der Protokoll-Ebene (tcp, ping etc.) weg
  oder auch z.B. auf MAC-Ebene (also arp, was sagt arping)?
 
 Nur auf Protokollebene. arping kommt weiter durch.

Sehr ungewöhnlich, v.a. wenn man Peter's Mail hinzuzieht.
Nach meinen (immer noch bescheidenen) Netzwerkkenntnissen würde das
momentan heißen:
 - die NICs+Hardware+Switches/Kabel sind ok, da der arping geht.
 - Problem müßte also auf der Software-Seite sein (kernel und userland)

Ich kenne dieses Problem eigentlich nur aus zwei Fällen: doppelte IP
oder doppelte MAC im Subnetz. Kannst du beides ausschließen?
Ich gehe mal davon aus, daß du dich bei den Tests ob das Netz weg ist
auf ping konzentriert hast. Und zwar ping IP von beiden Seiten.
Ansonsten käme da noch ein wildgewordenes DNS ins Spiel.

Dein Server hat eine feste lokale IP? Oder DHCP?

Da daß Problem ja anscheinend bei dir leicht zu reproduzieren ist würde
ich:

a) jeweils einen ping IP Server-Client starten
b) jeweils auch einen arping Server-Client

Wenn der Zusammenbruch auftritt kontrollieren: läuft einer der Pings
noch und laufen die arpings noch.
Auch ein traceroute Client - Server in diesem Moment wäre interessant.

Kann _am_ Server in diesem Moment:
a) die lokale IP des eth0 angepingt werden?
b) das gleiche mit dem lo Device?

Läuft auf dem Server eine Software, die reinpfuschen könnte? Also
kandidaten wie iptables, QoS, TrafficShaper, etc?

Eine probate Methode wäre auch per ethereal oder tcpdump den Traffic auf
der NIC mitzuschneiden und nachdem das Problem auftritt zu schauen, was
gegen Ende passiert ist.

 Danke,
 Keep smiling
 yanosz 

Gruß
Gerhard
-- 
MSCI = M$cro Soft Certificated Installer


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Server verliert Netzwerkverbindung unter Etch

2006-08-21 Diskussionsfäden Gerhard Brauer
Gruesse!
* Gerhard Brauer [EMAIL PROTECTED] schrieb am [21.08.06 15:07]:
 
 Wenn der Zusammenbruch auftritt kontrollieren: läuft einer der Pings
 noch und laufen die arpings noch.
 Auch ein traceroute Client - Server in diesem Moment wäre interessant.
 
 Kann _am_ Server in diesem Moment:
 a) die lokale IP des eth0 angepingt werden?
 b) das gleiche mit dem lo Device?

Nachtrag: bitte auch mal kontrollieren ob zu diesem Zeitpunkt die
NIC-Module noch geladen sind (wenn modular) und was ein ifconfig ethX am
Server dann zeigt.
Auch mal einen Blick nach /proc/interrupts werfen, ob in der ERR-Spalte
ein Wert  0 steht.

Gruß
Gerhard
-- 
Wer mich mag kann mit mir machen was ich will...


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Server verliert Netzwerkverbindung unter Etch

2006-08-19 Diskussionsfäden Peter Kuechler
Am Freitag, 18. August 2006 14:30 schrieb Jan Luehr:
 ja hallo erstmal,..

 langsam habe ich das Gefühl, dass sich eine ungünstige Aura um meinen
 Server breitgemacht hat.

Das kenn ich:-(
Hier läuft ein tagesaktuelles SID.

 Derzeit habe ich das Problem, dass der Server die Verbindung zum
 Netzwerkverliert (ohne Einträge in der dmesg). Nach einem ifdown / ifup
 findet er sie wieder. Ich habe schon:
 - Die hotplug-Einträge aus der /etc/network/interfaces entfernt
 - Statt der onboard e1000-NIC (das nur mit 100MBps läuft) eine D-Link LWL
 NIC verwendet.
 (Somit auch einen anderen Switch und ein anderes Kabel)
 - Die Position des Servers im Netzwerka verändert (andere Wege durch die
 Switches, nur ein Switch zwischen Server und Client)
 - Einen anderen Kernel verwendet
 - Einen anderen Systemtyp verwendet (i386 statt amd64)
 - Auf udev verzichtet.

 Generell kann ich sagen:
 - Je neuer der Kernel ist, desto schneller ist die Verbindung weg.
 Werte für das Intel NIC:
 2.6.15: ca 1h
 2.6.16: ca. 1-10min
 2.6.17: ca 10-60 sec

Ganz genau so ist es bzw. war es bei meinem Rechner nicht, es hat stark 
variiert.

 - Die Intel-NIC hält die Verbindung spürbar länger als die D-Link-LWL-NIC
 - Ich habe sonst keinerlei Zusammenhänge feststellen können.

Ich hauch nicht.

 Woran könnte das liegen?

Ich betreibe auf dem Rechner mitlerweile 2.6.18-rc4 und habe bis jetzt den 
Eindruck, das es besser geworden ist. Vieleicht hilft es ja.




-- 
mfg Peter Küchler





Re: Server verliert Netzwerkverbindung unter Etch, Nachtrag

2006-08-19 Diskussionsfäden Peter Kuechler
Am Samstag, 19. August 2006 11:58 schrieb Peter Kuechler:
 Am Freitag, 18. August 2006 14:30 schrieb Jan Luehr:
  ja hallo erstmal,..
 
  langsam habe ich das Gefühl, dass sich eine ungünstige Aura um meinen
  Server breitgemacht hat.

 Das kenn ich:-(
 Hier läuft ein tagesaktuelles SID.
[...]
  Woran könnte das liegen?

 Ich betreibe auf dem Rechner mitlerweile 2.6.18-rc4 und habe bis jetzt den
 Eindruck, das es besser geworden ist. Vieleicht hilft es ja.

Kommando zurück:-(

So eben ist es wieder aufgetreten, wieder die gleichen Symtome:

Ping an die eigene IP geht, raus geht nix mehr. 
Netzwerkkartenmodul sk98lin entladen/geladen hat nix gebracht.

Sehr merkwürdig.
Leider hatte ich vorhin keine Zeit um noch etwas zu experimentieren, beim 
nächsten mal werd ich noch etwas mehr testen.



-- 
mfg Peter Küchler





Server verliert Netzwerkverbindung unter Etch

2006-08-18 Diskussionsfäden Jan Luehr
ja hallo erstmal,..

langsam habe ich das Gefühl, dass sich eine ungünstige Aura um meinen Server 
breitgemacht hat.
Derzeit habe ich das Problem, dass der Server die Verbindung zum 
Netzwerkverliert (ohne Einträge in der dmesg). Nach einem ifdown / ifup 
findet er sie wieder. Ich habe schon:
- Die hotplug-Einträge aus der /etc/network/interfaces entfernt
- Statt der onboard e1000-NIC (das nur mit 100MBps läuft) eine D-Link LWL NIC 
verwendet.
(Somit auch einen anderen Switch und ein anderes Kabel)
- Die Position des Servers im Netzwerka verändert (andere Wege durch die 
Switches, nur ein Switch zwischen Server und Client)
- Einen anderen Kernel verwendet
- Einen anderen Systemtyp verwendet (i386 statt amd64)
- Auf udev verzichtet.

Generell kann ich sagen:
- Je neuer der Kernel ist, desto schneller ist die Verbindung weg.
Werte für das Intel NIC: 
2.6.15: ca 1h
2.6.16: ca. 1-10min
2.6.17: ca 10-60 sec
- Die Intel-NIC hält die Verbindung spürbar länger als die D-Link-LWL-NIC
- Ich habe sonst keinerlei Zusammenhänge feststellen können.

Woran könnte das liegen?

Danke,
Keep smiling
yanosz



Re: Server verliert Netzwerkverbindung unter Etch

2006-08-18 Diskussionsfäden Dirk Ullrich

Das gibt es massig mögliche Ursachen. Um sich erstmal einen Überblick
zu verschaffen:
(1) Was hast Du sonst an PCI-Ressourcen?
(Was gibt z.B. lspci aus?)
(2) Wie ist / sind Deine Netzwerkkarte / -karten konfiguriert?
(Inhalt von /etc/network/interfaces)

Dirk



Re: Server verliert Netzwerkverbindung unter Etch

2006-08-18 Diskussionsfäden Gerhard Brauer
Gruesse!
* Jan Luehr [EMAIL PROTECTED] schrieb am [18.08.06 14:30]:
 ja hallo erstmal,..
 
 langsam habe ich das Gefühl, dass sich eine ungünstige Aura um meinen Server 
 breitgemacht hat.

Irgendein Win-Rechner in der Nähe? ;-)

 Derzeit habe ich das Problem, dass der Server die Verbindung zum 
 Netzwerkverliert (ohne Einträge in der dmesg). 

Definiere Netzwerk verliert genauer.
Ist die Verbindung nur auf der Protokoll-Ebene (tcp, ping etc.) weg
oder auch z.B. auf MAC-Ebene (also arp, was sagt arping)?

 Generell kann ich sagen:
 - Je neuer der Kernel ist, desto schneller ist die Verbindung weg.

Ein Zeichen, das der Kernel immer schneller wird ;-) Danke, Linus!

 Woran könnte das liegen?
 
 Danke,
 Keep smiling
 yanosz

Gruß
Gerhard
-- 
Linux ist wenn es trotzdem geht...


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)