Website Offline von 6:00 bis 16:20



Bis zu 350 € für alle Fahrer von Elektroautos!
» Jetzt die höchste Quote am Markt sichern
» Oder direkt FIX 85 € erhalten.

Bereits jetzt THG-Quote für 2024 beantragen! Sichere dir deinen Quoten-Anspruch bevor die Prämie sinkt!
(Werbung)
Status
Für weitere Antworten geschlossen.

IO

Administrator
18.06.2018
86
München
Hallo miteinander,

heute morgen um 6 Uhr ist der GAU beim Backup passiert.
Auf diesem Server gibt es 2 SSD Festplatten die im Raid 1 laufen. Raid 1 bedeutet, dass alle Daten auf beiden Platten jeweils angelegt werden.
Wenn eine ausfällt kann diese ersetzt werden und alles ist wieder in Ordnung. Die Daten werden nachgezogen.
Heute morgen sind innerhalb von 20-30 Minuten BEIDE Festplatten ausgefallen.
Die Wahrscheinlichkeit für so ein Event ist sehr sehr gering. Beide waren Defekt und somit alle Daten weg.

Es erfolgt aber auch jeden morgen noch ein externes Backup. Somit konnten alle Daten wiederhergestellt werden.
Leider fehlt aber der gestrige Tag da das Backup immer morgens angefertigt wird.
Bitte entschuldigt die Unannehmlichkeiten. Das war ein Tagesprojekt.

Grüße

IO
 
  • Like
Wertungen: Kamikaze

Werni

Bekanntes Mitglied
19.02.2019
2.040
Heidenrod
Hi,

also eher kein Backup-Gau, sondern ein RAID-Gau ;-) Gerade bei SSDs ist das wirklich sehr unwahrscheinlich, außer, da ist ein Bug drin.

Waren das zufällig HP-Enterprise SSDs?


Danke auf jeden Fall für die schnelle Wiederherstellung!

Gruß,

Werner
 

Emil

Bekanntes Mitglied
04.04.2006
2.876
Warum soll die Wahrscheinlichkeit bei identischen SSDs und Raid1 gering sein?

Beide SSDs sind identisch und die Fertigungstoleranz der Chips ist mittlerweile gering, so dass ein Ausfall innerhalb von wenigen geschriebenen TB statt finden kann.

Zu beachten ist dass beide SSD die identische Zahl an Schreibvorgänge mit den identischen Daten erhalten. Die Algorithmen für das Wear leveling sind in der Regel deterministisch und verursachen intern die gleichen Operationen.

Auch andere Fehler die an der Zahl der Schreibvorgänge hängen, können Fehler auslösen. Das ist dann effektiv wie ein Single Point of Failure.

Ich kann nur dazu raten zwei verschiedene SSD Fabrikate mit gleicher Kapazität zu verwenden, und nicht wie von vielen empfohlen völlig identische SSDs.

Die andere Möglichkeit ist eine der SSDs 1 Mal nach einiger Zeit mit einer aus einem anderen System zu tauschen. Dann ist auch die Wahrscheinlichkeit dass sie zeitnah ausfallen nahezu 0.
 
  • Like
Wertungen: Andreas106

IO

Administrator
18.06.2018
86
München
Erst einmal danke fürs Mitgefühl.

@Werni
Intel SSD

@Emil
ich kenne die Kalkulation. Es waren aber zwei SSDs mit einer unterschiedlicher Lifetime.
Dazu waren die IOs nicht bis zum ende ausgereizt. Das Monitoring hätte besser sein können.
Im Grunde hast du recht, trotzdem ist es ärgerlich, wenn es passiert - und sehr aufwändig.

Grüße
IO
 
  • Like
Wertungen: Kamikaze und weiss

R.M

Bekanntes Mitglied
24.12.2006
10.248
Erst einmal danke fürs Mitgefühl.

@Werni
Intel SSD

@Emil
ich kenne die Kalkulation. Es waren aber zwei SSDs mit einer unterschiedlicher Lifetime.
Dazu waren die IOs nicht bis zum ende ausgereizt. Das Monitoring hätte besser sein können.
Im Grunde hast du recht, trotzdem ist es ärgerlich, wenn es passiert - und sehr aufwändig.

Grüße
IO
Sorry aber SSD für sowas einzusetzen ist suboptimal da die Speicherzellen nur etwa 500 mal beschreibbar sind. bei unseren verschlüsselten Firmenlaptops liegt die durchschnittliche Lebensdauer der SSD deutlich unter einem Jahr
 

Emil

Bekanntes Mitglied
04.04.2006
2.876
Dann hast Du schlechte SSDs gekauft, oder Software die wirklich ständig große Datenmengen schreibt.

Wir haben Windows Rechner mit Samsung 840 PRO, die laufen schon seit mehr als 7 Jahren, und sind nach Samsung Magican immer noch gut.


Wir hatten noch nie eine kaputte SSD und setzen diese schon seit mehr als 10 Jahren ein. Meist werden diese wegen Vergrößerung der Speicherkapazität nach spätestens 5 Jahren sowieso ersetzt, und kommen dann in weniger genutzte Rechner.

Was natürlich hilft is Overprovisioning. Wir setzen auf unseren Cloud Servern mittlerweile SSDs mit 4-8 TB ein, die aber nicht voll genutzt werden. Wir nutzten praktisch nur Samsung oder Sabrent, jetzt hauptsächlich als M.2.

Hier noch ein Langzeittest.
 
Zuletzt bearbeitet:

Kamikaze

Aktives Mitglied
Sorry aber SSD für sowas einzusetzen ist suboptimal da die Speicherzellen nur etwa 500 mal beschreibbar sind. bei unseren verschlüsselten Firmenlaptops liegt die durchschnittliche Lebensdauer der SSD deutlich unter einem Jahr
Also auf meinem Spiele-, Heimkino- und Heimbüro-Rechner laufen ebenfalls seit >5 Jahren SSDs unter recht hoher Lese-/Schreibbelastung und auch diese sind laut Diagnosetool noch einwandfrei.
Mein Uralt-Laptop hat eine SSD, die bereits > 12 Jahre alt sind (läuft inzwischen als Mini-Server 24/7) - bislang ebenfalls ohne jede Ausfallserscheinung.
In sofern stimme ich Emil zu: Das klingt nach ziemlich schlechten SSDs oder (wahrscheinlicher) fehlerhaften Einstellungen (z.B. tägliche Defragmentierung - braucht eine SSD nicht, verkürzt aber die Lebensdauer massiv).

Nachtrag:
Das war die billigste SSD, die ich auf die Schnelle finden konnte (WD blue 500GB 2,5"):
MTTF (Mean Time To Failure), von 1,75 Mio. Stunden, bis zu 500 TBW (geschriebenen Terabyte)
Die MTTF-Zeit liegt umgerechnet bei ~200 Jahren im 24/7-Betrieb!
Die 500 TBW entsprechend dabei etwa 1000 Schreibzyklen auf JEDER ZELLE! Also 1000 mal KOMPLETT voll machen und wieder löschen! (Die Hauptlast in Sachen Lesen/Schreiben sollte im RAM stattfinden und die Festplatte/SSD ist idR. hauptsächlich Langfrist-Datengrab. Wenn die SSD RAM substituieren muss ist das natürlich auch nicht zuträglich für die Lebensdauer.)
 
Zuletzt bearbeitet:
  • Like
Wertungen: Emil

IO

Administrator
18.06.2018
86
München
Ja, das hat aber nichts mit den Anwendungen zu tun die wir am laufen haben.
SSD werden in der kompletten Hosting Industrie verwendet. Da die Zugriffszeiten deutlich höher sind als bei HDD. Wir reden hier nicht von einem Hobby Projekt.
Das ist ein eigener Rack im Rechenzentrum und keine Bastellösung bei mir im Keller. :LOL:
Trotzdem danke für euer Feedback.
 
Zuletzt bearbeitet:
  • Like
Wertungen: Kamikaze
Status
Für weitere Antworten geschlossen.

Anmelden

Neue Themen