PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Geisterbugs im gesamten System



lynix
03.08.06, 10:05
Hi@all!

Sorry für den nichtssagenden Topictitel, aber ich weiß nicht wie ich es sonst treffend bezeichnen sollte. Zwei DInge vorweg: Es handelt sich hier um ein vor ca. 1 Woche installiertes Gentoo 2006.0 System und ich würde mich definitiv nicht als Linux-n00b bezeichnen :)

Ein einfacher Tagesausschnitt, der meine Problematik skizziert:

Ich schalte heute Morgen den Rechner ein, er bootet und hängt sich beim Starten von GDM auf (voller Systemfreeze, weder Numlock noch Maus reagieren). Ich mache einen Reboot, diesmal startet GDM durch und ich kann mich einloggen. In Gnome bemerke ich dann, dass ich keine Soundeffekte habe und entschließe mich spontan testweise zu einem weiteren Reboot. Diesmal informiert mich beim Starten von GDM eine Fehlermeldung, es könne mein GDM-Theme nicht geladen werden und er würde versuchen, das Standard-Theme zu laden, was er mir mit einer weiteren Fehlermeldung als unmöglich quittiert und mit einem eingefrorenem GDM abschließt. Allerdings schaffe ich es diesmal, in eine (ALT+F1) Konsole zu wechseln und sehe mir als root mal die Logs an. Was mir dabei auffällt ist, dass nirgendwo auch nur ein einziger Fehler verzeichnet wird! Es sollte doch das Fehlen des GDM-Skins im GDM-Log verzeichnet werden? Naja jedenfalls ist nichts zu entdecken und ich mache... richtig, einen Reboot :) Oh Wunder, oh Wunder, diesmal bootet alles korrekt, ESD wird auch richtig gestartet, ich habe Sound und will gerade meine Platten mit e2label umbenennen, als mir folgende Meldung (als root!!!) in der Konsole ausgegeben wird: "sh: /usr/bin/less: Keine Berechtigung". Ein Blick in /usr/bin zeigt mir Unmengen defekter Symlinks (die sind nicht da, wenn das System korrek hochgefahren ist) und einen interessanten Eintrag für less:

?rws-wsrw- 23175 2535086018 1887839300 456 4. Mai 2017 less
Ich wette, wenn ich jetzt einen Reboot mache, geht wieder irgendetwas anderes nicht...

Diese Art von Problemen habe ich erst seit ca. 3 Tagen, weiß aber leider nicht mehr, was genau ich geändert oder hinzugefügt haben könnte, um es auszulösen.
Einen Hardwaredefekt an den Platten oder dem RAM möchte ich vorerst ausschließen, denn wenn das System mal richtig hochgefahren ist, arbeitet es tadellos.

Hat irgendjemand eine Idee, wo ich mit der Suche nach der Ursache/den Ursachen anfangen könnte? Systeminfos werden natürlich auf Anfrage gepostet, in Kürze hier mal paar Eckdaten:

- Gentoo 2006.0 auf AMD64-Architektur, alles up-to-date
- Kernel 2.6.16-gentoo-r13
- AMD Sempron64 3000+
- 1024MB RAM (DDR333)
- Asrock K8-Upgrade NF3
- GeForce FX 5900XT (AGP)
- SB Audigy 2 Platinum
- Gnome 2.14.2


Ich krieg noch Zustände hier...

Gruß,

lynix

pibi
03.08.06, 10:10
Einen Hardwaredefekt an den Platten oder dem RAM möchte ich vorerst ausschließen, denn wenn das System mal richtig hochgefahren ist, arbeitet es tadellos.Genau darauf wuerde ich aber tippen, am ehesten auf einen Harddiskfehler. Boote doch mal ein Knoppix von CD, ohne irgendwelche Partitionen auf der Disk zu mounten. Auch kein Swapfile benutzen.

Gruss Pit.

marce
03.08.06, 10:10
klingt aber leider verdächtig nach Hardware...


... wobei ich eher auf NT oder MB / Speicher / CPU tippen würde, evtl. aber auch nur ein ranziger Steckkontakt....

mabus
03.08.06, 10:18
Welche Logfiles hast du überprüft. Die Tatsache dass der mal Probleme hat das Default-Theme zu laden, dass er mal Einfriert und deine Ausgabe deuten für mich sehr stark auf ein defektes Dateisystem hin und/oder nach nem Hard Disk Fehler.

lynix
03.08.06, 10:38
Moin!

Danke für eure vielen Antworten! :D

Also ich hab jetzt drei mal "fsck.ext3 -vfy /dev/hda3" durchlaufen lassen. Bei den ersten beiden Malen hat er Unmengen Fehler korrigiert, beim letzten Durchgang keine mehr gefunden.
Okay, das würde ja eure Vermutung nach Festplattendefekt unterstützen, aber warum ist dann immer nur meine ext3-Partition betroffen? Auf der Platte liegen auch noch meine ext2-Bootpartition und mein Swap und die sind beide nie defekt...
Daher: Wie können auf einem ext3-Dateisystem (mit full-journaling) noch Fehler entstehen außer durch eine defekte Platte?

Ich überprüfe jetzt mal alle Steckverbindungen. S.M.A.R.T. ist unzuverlässig oder? Sonst würde ich mir nämlich mal die Auswretung der Platte über S.M.A.R.T. anschauen...

Netzteil könnte noch zutreffen... meine zweite IDE-Platte geht ab und zu aus und direkt wieder an, da vermute ich einen Wackelkontakt am Stromstecker, aber komischerweise hat die Platte nie Fehler im Dateisystem :)


Gruß,

lynix

lynix
03.08.06, 10:40
Welche Logfiles hast du überprüft. Die Tatsache dass der mal Probleme hat das Default-Theme zu laden, dass er mal Einfriert und deine Ausgabe deuten für mich sehr stark auf ein defektes Dateisystem hin und/oder nach nem Hard Disk Fehler.

Ich hab überptüft:

/var/log/messages
/var/log/dmesg
/var/log/Xorg.0.log
/var/log/gdm/:0.log




Genau darauf wuerde ich aber tippen, am ehesten auf einen Harddiskfehler. Boote doch mal ein Knoppix von CD, ohne irgendwelche Partitionen auf der Disk zu mounten. Auch kein Swapfile benutzen.

Gruss Pit.

Knoppix 3.8 bootet tadellos und fand auch keine Fehler auf der suspekten Platte (hab ich vorgestern probiert).


Gruß,

lynix

mabus
03.08.06, 10:58
Moin!
Also ich hab jetzt drei mal "fsck.ext3 -vfy /dev/hda3" durchlaufen lassen. Bei den ersten beiden Malen hat er Unmengen Fehler korrigiert, beim letzten Durchgang keine mehr gefunden.
Okay, das würde ja eure Vermutung nach Festplattendefekt unterstützen, aber warum ist dann immer nur meine ext3-Partition betroffen? Auf der Platte liegen auch noch meine ext2-Bootpartition und mein Swap und die sind beide nie defekt...
Daher: Wie können auf einem ext3-Dateisystem (mit full-journaling) noch Fehler entstehen außer durch eine defekte Platte?

Naja, entstehen können Inkonsistenzen auch durch unsauberes abschliessen bei Schreibzugriffen. Fehler im Dateisystem müssen nicht zwangsläufig durch ein Defekt der Platte her rühren.
Falls aber bald schon wieder neue Fehler im Dateisystem auftreten ohne vorherige nennenswerte Vorkommnisse, solltest du lieber schon prophylaktisch ein Backup erstellen, sofern du es nicht eh regelmässig machst :)



Ich überprüfe jetzt mal alle Steckverbindungen. S.M.A.R.T. ist unzuverlässig oder? Sonst würde ich mir nämlich mal die Auswretung der Platte über S.M.A.R.T. anschauen...

Über die Zuverlässigkeit kann ich jetzt nichts sagen, aber lieber ein Anhaltspunkt, als keiner.



Netzteil könnte noch zutreffen... meine zweite IDE-Platte geht ab und zu aus und direkt wieder an, da vermute ich einen Wackelkontakt am Stromstecker, aber komischerweise hat die Platte nie Fehler im Dateisystem :)

Das solltest du nicht Vermutungen anstellen sondern die Ursache genau prüfen. Dies kann nämlich solche Inkonsistenzen hervorrufen und im ungünstigsten Falle auch zum Defekt führen.

Interessant ist halt jetzt ob die Probleme im Betrieb nach der Bereinigung immer noch auftreten.

lynix
03.08.06, 12:12
Moin!

Also die Steckverbindungen hab ich jetzt alle gesichert und werde jetzt mal ein Tool emergen, um S.M.A.R.T. auszulesen.
Die Kiste läuft jetzt wie bereits prophezeiht einwandfrei ohne irgendwelche Aussetzer, Schreib- oder Lesefehler oder Ähnliches. Der Problemkomplex tritt immer nur bei den ersten paar Boots des Tages/Tagesabschnittes auf, wenn die Kiste einmal läuft läuft sie...

Ein Backup habe ich noch, aber es würde mich ärgern, jetz schon wieder mein System neu aufsetzen zu müssen :)


Gruß,

lynix

lynix
03.08.06, 12:40
So, während dem Arbeiten ist mir gerade aufgefallen, dass einige Gnome-Symbole im Menü fehlen und ich hab einen fsck.ext3 -nf durchlaufen lassen und er hat schon wieder Fehler gefunden. AUßerdem habe ich bemerkt, dass mein lost+found-Ordner ziemlich gefüllt aussieht.

Nun das sieht dann ja doch nach Plattenfehler aus... so ein Mist :(


Gruß,

lynix

lynix
03.08.06, 13:00
Okay, nach einem "init 1" und anschließendem fsck.ext3, um die gerade gefundenen und nicht korrigierten Fehler zu beheben werden eben diese auf einmal nicht mehr gefunden. Außerdem weiß ich jetzt, warum manchmal der Sound in Gnome nicht geht: esd bemängelt ein "old or corrupted" configfile - also auch Plattenfehlerindiz.

Das heißt jetzt also Useflags und Kernelconfig sichern und System auf ner andeen Platte neu aufsetzen, uff.... nicht schon wieder *heul*
Naja, s isch ä Elend... ;)

Gruß,

lynix

Stephanw
03.08.06, 18:25
Aus meiner sehr persönlichen Erfahrung möchte ich noch ein Tipp mit an die Hand geben:

Wie sieht das Festplattenkabel aus? Das war in nicht nur einem Fall Schuld an vergleichbaren Symptomen...

Gruß Stephan

lynix
06.08.06, 18:02
Hi, Stephan!

THX für den Tip, hatte ich allerdings schon getestet. Hab mir noch am Donnerstag ne neue Platte gekauft und bin jetzt am Reinstallieren und Rüberziehen der Daten - was eine Sträflingsarbeit...

Naja wenigstens bin ich jetzt die Bugs los und ein weiteres Mal Gentoo-Installieren bringt immer aha-Erlebnisse und somit vertiefte Systemkenntnisse mit sich ;)


Gruß,

lynix

Stephanw
06.08.06, 21:26
Okay dann war die Platte hinüber... etwas teurer als n Kabel aber wenigstens funktionierts jetzt...


Naja wenigstens bin ich jetzt die Bugs los und ein weiteres Mal Gentoo-Installieren bringt immer aha-Erlebnisse und somit vertiefte Systemkenntnisse mit sich

Es gibt da jemanden der dieses Leid mit dir teilt, und zwar genau in diesem Moment...

Gruß Stephan

bla!zilla
06.08.06, 22:09
Es gibt da jemanden der dieses Leid mit dir teilt, und zwar genau in diesem Moment...


Ihr habt beide mein volles Mitgefühl. Ich werde heute Nacht meine Workstation auch mal wieder sichern. Ich glaub wenn ich die neuinstallieren müsste.... OMG!