короче это опять случилось и снова SPB-2 Питер

НОВАЯ НОДА
на Альма-9
которую 35 дней назад я собрал



Честно после такого мне просто уже не хочется даже делать ВДС-ки на базе Селектел
Но т.к. я продал несколько вечных там — придется 10-15 лет терпеть теперь.
Может быть в 2026 они родят новый процессор и с 256 озу и я мигрирую людей.
Или может быть они станут «дата-центром для хостеров» как я описывал и я просто куплю собственное железо туда и мигрирую людей.
Ну короче это уже не случайности
Это какие-то ЗАКОНОМЕРНОСТИ
Тоже самое как я испытывал боль когда пользовался selectel storage которое убивало мои картинки лет 10 назад, только я восстановлю их все, пройдет еще пол года и снова авария.
Пойду диски гляну
=== START OF INFORMATION SECTION ===
Model Number: Samsung SSD 990 PRO 2TB
Serial Number: S7HENJ0Y207518R
Firmware Version: 5B2QJXD7
PCI Vendor/Subsystem ID: 0x144d
IEEE OUI Identifier: 0x002538
Total NVM Capacity: 2,000,398,934,016 [2.00 TB]
Unallocated NVM Capacity: 0
Controller ID: 1
NVMe Version: 2.0
Number of Namespaces: 1
Namespace 1 Size/Capacity: 2,000,398,934,016 [2.00 TB]
Namespace 1 Utilization: 996,065,914,880 [996 GB]
Namespace 1 Formatted LBA Size: 512
Namespace 1 IEEE EUI-64: 002538 42514040d6
Local Time is: Thu Nov 13 07:01:16 2025 MSK
Firmware Updates (0x16): 3 Slots, no Reset required
Optional Admin Commands (0x0017): Security Format Frmw_DL Self_Test
Optional NVM Commands (0x0055): Comp DS_Mngmt Sav/Sel_Feat Timestmp
Log Page Attributes (0x2f): S/H_per_NS Cmd_Eff_Lg Ext_Get_Lg Telmtry_Lg *Other*
Maximum Data Transfer Size: 512 Pages
Warning Comp. Temp. Threshold: 82 Celsius
Critical Comp. Temp. Threshold: 85 Celsius
Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 9.61W — - 0 0 0 0 0 0
1 + 9.61W — - 1 1 1 1 0 0
2 + 9.61W — - 2 2 2 2 0 0
3 — 0.0500W — - 3 3 3 3 4200 3500
4 — 0.0050W — - 4 4 4 4 2200 22200
Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 0
=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 38 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 1%
Data Units Read: 3,079,986 [1.57 TB]
Data Units Written: 24,623,476 [12.6 TB]
Host Read Commands: 264,798,556
Host Write Commands: 728,249,076
Controller Busy Time: 4,127
Power Cycles: 47
Power On Hours: 1,028
Unsafe Shutdowns: 39
Media and Data Integrity Errors: 0
Error Information Log Entries: 0
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 38 Celsius
Temperature Sensor 2: 47 Celsius
Error Information (NVMe Log 0x01, 16 of 64 entries)
No Errors Logged
=== START OF INFORMATION SECTION ===
Model Number: Samsung SSD 990 PRO 2TB
Serial Number: S7HENJ0Y203634P
Firmware Version: 5B2QJXD7
PCI Vendor/Subsystem ID: 0x144d
IEEE OUI Identifier: 0x002538
Total NVM Capacity: 2,000,398,934,016 [2.00 TB]
Unallocated NVM Capacity: 0
Controller ID: 1
NVMe Version: 2.0
Number of Namespaces: 1
Namespace 1 Size/Capacity: 2,000,398,934,016 [2.00 TB]
Namespace 1 Utilization: 997,852,426,240 [997 GB]
Namespace 1 Formatted LBA Size: 512
Namespace 1 IEEE EUI-64: 002538 4251402a55
Local Time is: Thu Nov 13 07:03:45 2025 MSK
Firmware Updates (0x16): 3 Slots, no Reset required
Optional Admin Commands (0x0017): Security Format Frmw_DL Self_Test
Optional NVM Commands (0x0055): Comp DS_Mngmt Sav/Sel_Feat Timestmp
Log Page Attributes (0x2f): S/H_per_NS Cmd_Eff_Lg Ext_Get_Lg Telmtry_Lg *Other*
Maximum Data Transfer Size: 512 Pages
Warning Comp. Temp. Threshold: 82 Celsius
Critical Comp. Temp. Threshold: 85 Celsius
Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 9.61W — - 0 0 0 0 0 0
1 + 9.61W — - 1 1 1 1 0 0
2 + 9.61W — - 2 2 2 2 0 0
3 — 0.0500W — - 3 3 3 3 4200 3500
4 — 0.0050W — - 4 4 4 4 2200 22200
Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 0
=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 36 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 0%
Data Units Read: 2,778,798 [1.42 TB]
Data Units Written: 8,619,894 [4.41 TB]
Host Read Commands: 152,429,212
Host Write Commands: 223,970,351
Controller Busy Time: 481
Power Cycles: 47
Power On Hours: 826
Unsafe Shutdowns: 41
Media and Data Integrity Errors: 0
Error Information Log Entries: 0
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 36 Celsius
Temperature Sensor 2: 39 Celsius
Error Information (NVMe Log 0x01, 16 of 64 entries)
No Errors Logged
Хуй знает
Блять новое железо
Все должно быть охуенно
ЧТО НЕ ТАК?
7 комментариев
[ 0.964431] nvme 0000:03:00.0: platform quirk: setting simple suspend
[ 0.964490] nvme nvme0: pci function 0000:14:00.0
[ 0.964496] nvme nvme1: pci function 0000:03:00.0
[ 0.969627] nvme nvme1: D3 entry latency set to 10 seconds
[ 0.970843] nvme nvme0: D3 entry latency set to 10 seconds
[ 0.972025] nvme nvme1: 16/0/0 default/read/poll queues
[ 0.973400] nvme nvme0: 16/0/0 default/read/poll queues
[ 0.973937] nvme1n1: p1 p2 p3 p4 p5 p6
[ 0.975368] nvme0n1: p1 p2 p3 p4 p5 p6
[root@n4-new ~]#
35 дней ему, спустя 35 дней завис
[ 4.975857] nvme nvme0: pci function 0000:0a:00.0
[ 4.975912] nvme nvme1: pci function 0000:0f:00.0
[ 4.989469] nvme nvme0: Shutdown timeout set to 10 seconds
[ 4.989479] nvme nvme1: Shutdown timeout set to 10 seconds
[ 4.994886] nvme nvme1: 32/0/0 default/read/poll queues
[ 4.995318] nvme nvme0: 32/0/0 default/read/poll queues
[ 4.996623] nvme1n1: detected capacity change from 0 to 2000398934016
[ 4.997058] nvme0n1: detected capacity change from 0 to 2000398934016
[ 4.997584] nvme1n1: p1 p2 p3 p4 p5
[ 4.998147] nvme0n1: p1 p2 p3 p4 p5
[root@n3-9950x ~]#
Альма-8 который
зависал многократно
лично у меня, когда была проблема с диском, в dmesg висели ошибки
если бы они не пожмотничали размер диска
ОВХ люто зажмотило если помнишь, при 256 озу, там вообще пиздец невозможно создавать вдс тупо из-за мелкого диска
Селектел терпимо, но все равно при 192 озу — диска не хватает под ВДС
поэтому я делаю raid-0