FSea MGMT Computer, диагностика, проверка логов (Работает стабильно… пока не начинает работать)

Данный пк MGMT используется для удаленного админитратирования сетей на судне Fishing Sea. С данным ПК появились проблемы такие, он зачастую находится не в сети и не доступен никак через удаленные доступ. Данный ПК снят с сервеной для дальнейшей его диагностики.

Подключил ПК вторым кабелем к рабочему монитору в офисе, включился для своих параметров довольно таки быстро. Произведен сбор логов работы пк согласно этой статьи. Данные Логи были проанализированый и выявлены следующие ошибки и придупреждения:

:red_circle: КРИТИЧНОЕ (на это нужно обратить внимание):

1) Неожиданные перезагрузки / потери питания

:one: Неожиданные перезагрузки / потери питания

Kernel-Power 41

The system has rebooted without cleanly shutting down first

:pushpin: Это не программная ошибка, а следствие:

  • резкого отключения питания,

  • зависания с последующим ребутом,

  • проблем БП, материнской платы или перегрева.

:warning: Это главный тревожный сигнал в логах.

Что касается ошибок по потери питания, MGMT запитан от системы VICTRON (ошибка возникает либо с плохим блоком питания, либо совокупность вытекающих пролем)

2) Ограничение производительности процессора

:two: Ограничение производительности процессора

Kernel-Processor-Power, Event ID 37

The speed of processor is being limited by system firmware
до 86 398 секунд (~24 часа!)

:pushpin: Означает:

  • перегрев CPU,

  • ограничение BIOS/UEFI,

  • плохое охлаждение,

  • иногда — деградация VRM на плате.

:light_bulb: Это напрямую объясняет:

  • тормоза,

  • подвисания,

  • нестабильность системы.

3) Ошибка файловой системы (ОЧЕНЬ ВАЖНО)

:three: Ошибка файловой системы (ОЧЕНЬ ВАЖНО)

NTFS 55

A corruption was discovered in the file system structure on volume E:

:pushpin: Уже есть повреждение файловой системы на диске E:
Причины:

  • резкое отключение питания,

  • умирающий HDD / SSD,

  • плохой кабель или порт.

:warning: Если игнорировать — будут:

  • потери данных,

  • зависания,

  • синие экраны.

:orange_circle: СЕРЬЁЗНО, НО ВТОРИЧНО:

1) Массовые ошибки служб Windows

:one: Массовые ошибки служб Windows

  • ClipSVC

  • Capability Access Manager

  • Microsoft Account Sign-in Assistant

  • Software Protection

  • Windows Error Reporting

  • Defender Network Inspection

:pushpin: Все они падают по тайм-ауту 7000 / 7009 / 7031 / 7034.

Причина чаще всего НЕ сами службы, а:

  • тормоза системы,

  • проблемы диска,

  • повреждённые системные файлы,

  • последствия жёсткого выключения.


2) DCOM 10010 / 10005 / 10029

:two: DCOM 10010 / 10005 / 10029

:pushpin: Очень много, но:

  • это следствие, а не причина;

  • почти всегда возникает при проблемах со службами, диском и питанием.

:red_exclamation_mark: Исправлять DCOM бессмысленно, пока не устранена первопричина.

:yellow_circle: НЕ КРИТИЧНО (можно игнорировать)

НЕ КРИТИЧНО (можно игнорировать)

DistributedCOM 10016 — стандартная «болезнь» Windows

Bluetooth BTHUSB — ограниченные функции адаптера

Network link disconnected — просто кабель не подключён

Time-Service DNS ошибки — временное отсутствие сети

TPM Secure Boot keys — не влияет на стабильность

Файлы логов представлены за последние 30 дней полный, и с только с ошибками:

Файлы логов .txt; .evtx

MGMT_LOG_.txt (5.1 MB)

MGMT_LOG_30_Days_.txt (795.0 KB)

MGMT_LOG_evtx.rar (1.4 MB)

Доролнительная информация/Параметры ПК MGMT:

Параметры системы, температура, частота - CPU, RAM, стресс тест, температура в сервеной:

P.S. Если на мониторе выбрать другой источник входящего сигнала, потом обратно переключиться на MGMT то нет изображения, и раздупляется только через кнопку перезагрузки. При Загрузки OS с внешнего жесткого дистка, данная проблема не наблюдается, я свободно переключаесь между источниками видео входа.

Сейчас ПК Работает от внешнего HDD (IODD ST400) с подгруженной Windows PE. Включенна диагностика, с записью логов температур системных компонентов.

GPGPU Benchmark / system stability test

2 Likes

В Тестовой нагрузке ПК Отработал 2 часа 26 минут температуры CPU и GPU не поднялись выше 50 грудусов по цельсию, SSD 30 градусов. Корпус нагрелся соответсвенно, так как выступает пассивным охлаждением ПК.

Дальнейшие дейстсвия: полный BackUP раздела SSD операционной системы, разбор пк, замена SSD, установка и тест работы.

1 Like