Remotedumpanalyse im Zug

Ich hatte mich ja vor einiger Zeit darüber gefreut, das auf Solaris geschwenkt ist. Der Prozess lief nicht ohne Probleme. Insbesondere liefen die Admins in einen Fehler im sockfs rein. Ein Kommentator hatte darauf hingewiesen, das bei der Sonnenblen.de ein entsprechender Artikel steht, der auf Probleme mit solaris hinwies. Ich habe mir das Problem dann angeguckt, während ich im Zug sass zurück von der CeBIT. Das Problem konnte aus meiner Sicht relativ schnell eingegrenzt werden. Man wird abwarten müssen, aber ich bin mir ziemlich sicher, das die Herren in diesen Bug gelaufen sind Was mir da auffällt, ist die Tatsache das viele neu dazugekommene Solaris Admins ein wenig das Handwerkszeug fehlt, um mit den ganzen feinen Tools umzugehen, die Solaris so bietet, um herauszufinden, was eigentlich vorgeht. Ich möchte daher eine Buchempfehlung hier aussprechen:


Solaris Performance and Toolsbeschreibt vieles, was in Solaris/Openolaris zum Thema Observability gemacht worden ist und wie es funktioniert. Was mir in letzter Zeit auffällt, ist ohnehin ein Verlust an Handwerkskönnen bei Administratoren. Crashdumpanalysen haben mittlerweile den Ruf des Arkanen und viele Installieren erst mal neue Kernel und schieben das Problem in eine falsche Ecke und versuchen dann in irgendwelchen Foren Hilfe zu bekommen. Dabei bietet jedes Unix gute Möglichkeiten herauszufinden, herauszufinden wo es hakt. Mir war irgendwie schon klar, als ich reingeguckt habe, das es am Ende genau wegen den möglicherweise fehlenden Patches boeses Blut geben wird. Ich habe mich gefragt, ob ich mir das wirklich antun wollte. Ich habe dann trotzdem mal geguckt, was das Problem ist. Und es fehlte ja auch ein Patch: 124255-03. Was will man aber machen: Wenn man weiss, das auf dem System ein groesseres werbeunterstütztes Communityportal läuft, ist sozusagen der Ruf der Plattform in Geiselhaft genommen. Es ist also eine Loss-Loss-Situation: Hilft man nicht, wird ein anderes Betriebsystem zurückgeschwenkt, ergo sehr schlechte Presse. Es heisst dann: “Solaris ist instabil”. Dabei muesste es heissen: “Unsere Version von Solaris enthielt einen Bug, der unter relativ seltenen Umständen auftaucht, der aber schon seit geraumer Zeit gefixed ist. Da wir aber keinen Wartungsvertrag haben und nicht Opensolaris eingesetzt haben, konnten wir den Bug nicht fixen”. Aber das sagt ja keiner. Und nun darf ich mir tatsächlich die Kommentare anhoeren, das es ja wohl unerhört sei, das man für Patches für Fehler, die einen Panic ausloesen “die Hand aufzuhalten”. Was Unsinn ist: Im nächsten Update von Solaris wird der Patch enthalten sein und in Opensolaris ist der Patch auch enthalten. Wichtig ist nur, zu wissen, wie man mit Solaris arbeiten wird, um am Anfang die richtige Distribution zu wählen. Bei Linux fragt man sich ja auch ob man SLES oder RHAS nimmt oder ob der Community Support von Debian, Gentoo oder Ubuntu aussreicht. Ich werde gleich auf jeden Fall noch einen weiteren Artikel schreiben, in dem ich meine Gedanken zur Wahl der korrekten Solarisvariante zusammenfasse. Okay, jetzt habe ich mir meinen Frust ausm Kopf geschrieben und gehe jetzt duschen …