Raspberry Pi nicht mehr erreichbar

  • Hallo zusammen,


    mein Raspberry Pi 4b (Buster) hat vor ca. 4 Wochen das 1. mal angefangen rumzuzicken, d.h. er war nicht mehr über ssh ansprechbar, homebridge lief nicht mehr, kein Internet wegen pi-hole, kein zugriff über vnc.

    Gestern abend das gleiche. Gerade eben nochmals!


    Netzstecker raus und wieder rein hat erstmal geholfen.

    Er hängt am LAN über einen switch an einer Fritzbox.

    Ich wüsste nicht dass er sonst irgendwie überlastet wäre. Config-UI-x zeigt mir momentan eine Last von 7% und Temp bei 47°.


    Installiert sind u.a. homebridge (2 Instanzen), deconz, node-red, influxDB & grafana, pi-hole, motioneye, mosquitto


    Das einzige was sich verändert hat bevor dem erneuten Ereignis gestern abend, waren updates der homebridge selber auf die 1.3.1 sowie diverser plugins, aber eigentlich war ich der Meinung alles lief und daher glaube nicht dass es damit zusammenhängt.


    Verabschiedet sich die SD-Karte?


    Wo bzw. in welchem log kann ich dem ganzen denn am besten auf den Grund gehen?

    dank euch!


    edit: achja, gestern hatte ich dann pi-hole als DNS in der fritzbox rausgenommen damit zumindest wieder Internet lief und da ich bisher dies noch gar nicht wieder zurückgestellt hatte sollte eigentlich auch pi-hole nicht der Verursacher sein


    edit 2: hier noch ein paar Schnipsel aus dem hb log... so um den dreh 13:10 Uhr war wohl der crash.

    stutzig macht mich der Eintrag von hb supervisor, 13:04 Uhr reiht sich nach 13:10 ein... aber wohl auch eher zu ignorieren?!

    13:36 habe ich dann per Netzstecker nen hard reboot initiiert.

    2 Mal editiert, zuletzt von EinMalik ()

  • Wenn ich das richtig lese, läuft er nach dem Neustart erstmal.

    Mal in /var/log/ sehen

    Boot.log

    error

    syslog

    Platz ist noch auf der karte?

    Ist der Radprofi noch Ping bar? Wenn ssh usw. nicht mehr geht.

    Wenn die SD sich sichern lässt, scheint sie io zu sein. Die SD kann aber auch schleichend sterben, lesen/schreiben dauert ewig.

    Eine Sicherung ist immer von Vorteil.

  • ping werde ich beim nächsten mal testen

    16GB Karte ist zu 55% belegt - Backups sind vorhanden, von daher nicht kritisch, nur ärgerlich wenn man nicht weiß woran es liegt und es so unregelmäßig auftritt.


    im Anhang das syslog von gestern abend, den pi neugestartet hatte ich dann erst am nächsten Morgen

    um hier die Weißheit rauszulesen benötige ich allerdings Unterstützung von wahren Experten :) :

  • Wenn die SD sich sichern lässt, scheint sie io zu sein.


    Nee, das würde ich so nicht unterschreiben. Meine defekte SD ließ sich zwar lesen, verweigerte sich aber jedwedem Schreibvorgang. Hab seitdem immer eine Karte mit 1:1 Backup in Reserve. Ich würde also mal die SD wechseln und schauen, ob die Kiste immer noch zickt.

  • so heute Nacht war es wieder so weit :cursing:

    Pi lässt sich jedenfalls nicht mehr anpingen.

    Habe zuerst den switch vermutet... der Pi und mein iMac hängen am selben switch, auch mein Mac hatte dann kein Netzwerk mehr. Pi abgestöpselt dann ging es, Pi wieder rein, Netzwerk weg. Das Netzwerkkabel vom Mac dann an den Pi brachte aber leider auch keine Besserung was Erreichbarkeit des Pi angeht... also wohl mal wieder nen hard reboot...

  • Was hast du da für einen Switch dazwischen?

  • Sorry für die späte Antwort... ich hatte ähnliche Probleme. z.B haben Bewegungsmelder dann irgendwann nicht mehr reagiert. Habe auch ewig gesucht.... bei mir lag es am Netgear switch, der irgendein "Multicast Storm" verhindern wollte. Hab nun auch den d-link - keine Probleme mehr.


    Ist es an der FB auch schon aufgetreten?

  • Ist es an der FB auch schon aufgetreten?

    seitdem läuft der Pi durchgehend... da ich das Phänomen aber leider in unregelmäßigen Abständen hatte will ich mich noch nicht zu früh freuen... so etwas erschwert die Fehlersuche immer ungemein.
    Also falls noch jmd aus den logs schlau wird und hier Ursachenforschung betreiben mag, immer gern :)

  • tadaaa! heute Nacht war es dann wieder so weit :cursing:

    also der switch war es also nicht, evtl Pihole?

    ich werd aus dem log nicht wirklich schlau... um 01:32 Uhr schien wohl noch alles zu laufen, dann werden die Einträge strange... v.a. die zeitliche Unordnung im log: 01:32 - 01:39 - 01:46 - 01:35 verwirrt, aber liegt evtl "nur" da dran und erschwert die Leserlichkeit?


    Mar 11 01:35:22 raspberrypi systemd-timesyncd[332]: System clock time unset or jumped backwards, restoring from recorded timestamp: Thu 2021-03-11 01:35:21 CET\



    so und hat der pi da um 01:35 Uhr dann einfach nen reboot gemacht?


    dann lief es wieder kanpp 1 Minute (oder 10? bis 01:46Uhr ?) und dann Tot? Um 7:26 hab ich jedenfalls den Netzstecker gezogen und wieder eingesteckt.

  • Hi EinMalik


    Konntest du die Ursache inzwischen finden? Ich verwende einen Pi3, jedoch geht es mir seit Wochen ähnlich.


    Alles löuft ca. eine Woche einwandfrei und auf einmal alles tot....


    Bei mir tritt dies auf, seit ich auf homebridge 1.3x bin.......


    Was ich aktuell beobachte, dass der freie Arbeitsspeicher anfangs mit 0,45 GB ausgegeben wird, nach einiger Zeit ist dieser dann nur noch bei 0,19 GB......


    Wen ich neustarte läuft wieder alles, meine ganzen 12-13 Instanzen....


    Ich muss mal die Speicherkarte tauschen, um diese auszuschließen.


    Was noch auffällt, nach dem Neustart sind meine Aqara Kontaktsensoren in Homekit ca. 1-2 Stunden nicht verfügbar...... alles andere löuft.


    Am Xiaomi Gateway liegt es nicht, dort reagieren die Sensoren alle sofort in der Mija Home App.


    Oder deutet dies alles darauf hin, dass der Pi mit meinem Setup überlastet ist und ich auf nen 4er gehen sollte?

  • det


    Haben sich deine Probleme auf deinem Pi3 erledigt oder was hast du gemacht?


    Du hattest doch seit homebridge.1.3x auch Performance Probleme, oder?

  • Du hattest doch seit homebridge.1.3x auch Performance Probleme, oder?

    Ja, seit gestern auf einem Pi4 mit 4GB RAM migriert.

    Seit gestern alls wieder fein, ssh Zugriff u.s.w.

    Muss es noch beobachten, vor allem warte ich noch auf ein Plugin Update wie das dann läuft.

    Das ausstehende Update ist das Tado-Platform Plugin.

    Da da alle Thermostate neu konfiguriert werden, muss ich erstmal die damit verbundenen Szenen und Auslöser sichern.

  • Also meine Probleme sind seit ca. Dezember... wann war doch gleich homebridge 1.3.x Release?

    Bei mir lief schon immer alles auf nem 4B, ich glaube nicht dass hierin das Problem liegt... außer Updates und Migration zu hb-Service habe ich nichts verändert... leider genug Stellschrauben um eine gezielte Ursachenforschung betreiben zu können 😕

  • det


    Hast du das aktuelle homebridge-image verwendet und alles neu aufgesetzt oder hast du deine homebridge configs und Instanzen alle übernommen?


    Ich hab mir heute auch mal nen 4er bestellt, bin mir aber noch unschlüssig, ob ich homebridge komplett neu aufsetzen soll unter der neuen Logik oder nochmals meine 12-13 Instanzen nochmals in der „alten“ Welt einfach mal mitnehme....

  • ich habe (im groben):

    - Original Raspberry Image 2021-01-11-raspios-buster-armhf aufgespielt auf 16GB Karte

    - einige Pakete deinstalliert

    - Hardware inbetrieb genommen, deCONZ, ntpd Einstellungen

    - Tools, homebridge, und plugin*s installiert

    - Daten-Ordner übernommen

    - Dienste gestartet

  • det


    Läuft bei dir dann so auch schon homebridge service? Und hast du deine Instanzen übernommen oder die „child bridges“ angelegt?


    Ich bin am überlegen, wieviel Aufwand mir aktuell das Ganze wert ist, jetzt gleich auf die neue Logik zu kommen.


    Oder ob ich einfach mal die bisherige Struktur auf den Pi 4 übernehme und warte bis sschuste einen charmanten Weg gefunden hat, auf hb-service zu switchen

  • Ich habe alles 1 zu 1 übernommen,

    also keine child bridges und kein hb-services benutzt.


    Ich vermute auch das meine Home-Datenbank bei Apple teilweise corrupt ist und es keinen Editor dafür gibt.

    Muss ich bestimmt von Grundauf alles nochmal neu machen.

  • Ich habe alles 1 zu 1 übernommen,

    also keine child bridges und kein hb-services benutzt.


    Ich vermute auch das meine Home-Datenbank bei Apple teilweise corrupt ist und es keinen Editor dafür gibt.

    Muss ich bestimmt von Grundauf alles nochmal neu machen.

    Das befürchte ich so bei mir auch 👌


    Dann werd ich wohl auch erst mal „nur“ alles 1:1 übernehmen. Solange es noch keinen Zwang gibt, nur den hb service zu nutzen

  • bei mir lag das Problem bei Pihole, seit den letzten update kommt es sporadisch zum Crash beim FTL.

    Danach ist der Pi nichtmehr erreichbar.


    Hier ist es der Link


    in der Konsole eingeben:

    Code
    pihole checkout ftl development

    seither keine Abstürze gehabt.