Как проверить серверную память на ошибки

I need to replace the memory in my system and I’m not quite sure how to determine if the memory is ECC or Non-ECC. How do I determine this?

asked Mar 24, 2015 at 21:15

James Mertz's user avatar

James MertzJames Mertz

26k41 gold badges108 silver badges163 bronze badges

11

For Windows 7 you can run the following command in command prompt:

wmic MEMORYCHIP get DataWidth,TotalWidth

If the TotalWidth value is larger than the DataWidth value you have ECC memory.

Example output:

//ECC Memory
DataWidth  TotalWidth
64         72

//Non-ECC Memory
DataWidth  TotalWidth
64         64

A better way to determine is via the following command:

wmic memphysical get memoryerrorcorrection

This will return a code based on the type of memory installed:

Value Meaning 
0 (0x0) Reserved 

1 (0x1) Other 

2 (0x2) Unknown 

3 (0x3) None 

4 (0x4) Parity 

5 (0x5) Single-bit ECC 

6 (0x6) Multi-bit ECC 

7 (0x7) CRC

Dan Is Fiddling By Firelight's user avatar

answered Mar 24, 2015 at 21:19

James Mertz's user avatar

James MertzJames Mertz

26k41 gold badges108 silver badges163 bronze badges

15

For FreeBSD (and probably most unix like platforms):

dmidecode -t 17

Example output:

# dmidecode 2.12
SMBIOS 2.5 present.

Handle 0x1100, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x1000
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 2048 MB
        Form Factor: DIMM
        Set: 1
        Locator: DIMM1
        Bank Locator: Not Specified
        Type: DDR2
        Type Detail: Synchronous
        Speed: 667 MHz
        Manufacturer: AD00000000000000
        Serial Number: 00002062
        Asset Tag: 010839
        Part Number: HYMP125P72CP8-Y5
        Rank: 2

The Total Width: 72 bits is the part you are looking for.

More information in detecting this in Linux can be found here on our sister site unix.stackexchange.com.

More information on how error correcting code works can be found in this simple post where I showed how you could use extra bits to detect and correct errors. This is why we have DIMMs which are 64 bits wide (8 bytes of data wide) or 72 bits wide (64 data plus extra bits to store redundant information).

19.07.2022 — Minor update now that ECC DDR5 is out. DDR5 is not 64 bit normal or 64+8 for ECC. It instead has two 32 bit channels, and more bits are needed for ECC. So expect 80 bits for ECC on DDR5.

answered Mar 24, 2015 at 21:30

Hennes's user avatar

9

If you look at the physical memory module, ECC will usually have 9 (sometimes more) chips. Non-ECC will have only 8 (or rarely, 8×2=16).

ECC vs non-ECC
(Image courtesy of Puget Systems)

Mokubai's user avatar

Mokubai

87.1k25 gold badges200 silver badges223 bronze badges

answered Mar 25, 2015 at 20:24

BlueRaja - Danny Pflughoeft's user avatar

7

inxi can do that:

$ sudo inxi -m -xxx
Memory:    Array-1 capacity: 32 GB devices: 4 EC: None
           Device-1: ChannelA-DIMM0 size: 4 GB speed: 1333 MHz type: DDR3 (Synchronous)
           bus width: 64 bits manufacturer: Kingston part: KHX1600C9D3/4GX serial: B7ED5A53

...

Here non ECC-RAM modules are used EC: None

answered Mar 25, 2015 at 19:08

Jonas Stein's user avatar

Jonas SteinJonas Stein

9963 gold badges12 silver badges29 bronze badges

2

On a Mac you can look in the System Information application to determine ECC status of the Computer and each RAM module.

/Applications/Utilities/System Information

Select Memory on the right pane, under the hardware section.

Then with the «Memory Slots» listing selected. The window below should show an ECC status.

See picture below:

System Information App window

Also as an FYI each RAM slot will have a Status field if there is a problem detected in a RAM module the status will be a value other than «OK»

answered Mar 25, 2015 at 23:44

MrDaniel's user avatar

MrDanielMrDaniel

1,3424 gold badges14 silver badges27 bronze badges

2

You might also try a free app like Belarc. Gives a bunch more info about your system also…

I have used the software a few times. I have no affiliation with this software, but I do know that it is used by some universities.

I can not provided a screen shot of the results because it contains confidential data, but the web site should provide some examples. Its pretty straight forward (and fast), download the file, run it and the results are presented.

answered Mar 25, 2015 at 20:09

htm11h's user avatar

htm11hhtm11h

1076 bronze badges

1

I need to replace the memory in my system and I’m not quite sure how to determine if the memory is ECC or Non-ECC. How do I determine this?

asked Mar 24, 2015 at 21:15

James Mertz's user avatar

James MertzJames Mertz

26k41 gold badges108 silver badges163 bronze badges

11

For Windows 7 you can run the following command in command prompt:

wmic MEMORYCHIP get DataWidth,TotalWidth

If the TotalWidth value is larger than the DataWidth value you have ECC memory.

Example output:

//ECC Memory
DataWidth  TotalWidth
64         72

//Non-ECC Memory
DataWidth  TotalWidth
64         64

A better way to determine is via the following command:

wmic memphysical get memoryerrorcorrection

This will return a code based on the type of memory installed:

Value Meaning 
0 (0x0) Reserved 

1 (0x1) Other 

2 (0x2) Unknown 

3 (0x3) None 

4 (0x4) Parity 

5 (0x5) Single-bit ECC 

6 (0x6) Multi-bit ECC 

7 (0x7) CRC

Dan Is Fiddling By Firelight's user avatar

answered Mar 24, 2015 at 21:19

James Mertz's user avatar

James MertzJames Mertz

26k41 gold badges108 silver badges163 bronze badges

15

For FreeBSD (and probably most unix like platforms):

dmidecode -t 17

Example output:

# dmidecode 2.12
SMBIOS 2.5 present.

Handle 0x1100, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x1000
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 2048 MB
        Form Factor: DIMM
        Set: 1
        Locator: DIMM1
        Bank Locator: Not Specified
        Type: DDR2
        Type Detail: Synchronous
        Speed: 667 MHz
        Manufacturer: AD00000000000000
        Serial Number: 00002062
        Asset Tag: 010839
        Part Number: HYMP125P72CP8-Y5
        Rank: 2

The Total Width: 72 bits is the part you are looking for.

More information in detecting this in Linux can be found here on our sister site unix.stackexchange.com.

More information on how error correcting code works can be found in this simple post where I showed how you could use extra bits to detect and correct errors. This is why we have DIMMs which are 64 bits wide (8 bytes of data wide) or 72 bits wide (64 data plus extra bits to store redundant information).

19.07.2022 — Minor update now that ECC DDR5 is out. DDR5 is not 64 bit normal or 64+8 for ECC. It instead has two 32 bit channels, and more bits are needed for ECC. So expect 80 bits for ECC on DDR5.

answered Mar 24, 2015 at 21:30

Hennes's user avatar

9

If you look at the physical memory module, ECC will usually have 9 (sometimes more) chips. Non-ECC will have only 8 (or rarely, 8×2=16).

ECC vs non-ECC
(Image courtesy of Puget Systems)

Mokubai's user avatar

Mokubai

87.1k25 gold badges200 silver badges223 bronze badges

answered Mar 25, 2015 at 20:24

BlueRaja - Danny Pflughoeft's user avatar

7

inxi can do that:

$ sudo inxi -m -xxx
Memory:    Array-1 capacity: 32 GB devices: 4 EC: None
           Device-1: ChannelA-DIMM0 size: 4 GB speed: 1333 MHz type: DDR3 (Synchronous)
           bus width: 64 bits manufacturer: Kingston part: KHX1600C9D3/4GX serial: B7ED5A53

...

Here non ECC-RAM modules are used EC: None

answered Mar 25, 2015 at 19:08

Jonas Stein's user avatar

Jonas SteinJonas Stein

9963 gold badges12 silver badges29 bronze badges

2

On a Mac you can look in the System Information application to determine ECC status of the Computer and each RAM module.

/Applications/Utilities/System Information

Select Memory on the right pane, under the hardware section.

Then with the «Memory Slots» listing selected. The window below should show an ECC status.

See picture below:

System Information App window

Also as an FYI each RAM slot will have a Status field if there is a problem detected in a RAM module the status will be a value other than «OK»

answered Mar 25, 2015 at 23:44

MrDaniel's user avatar

MrDanielMrDaniel

1,3424 gold badges14 silver badges27 bronze badges

2

You might also try a free app like Belarc. Gives a bunch more info about your system also…

I have used the software a few times. I have no affiliation with this software, but I do know that it is used by some universities.

I can not provided a screen shot of the results because it contains confidential data, but the web site should provide some examples. Its pretty straight forward (and fast), download the file, run it and the results are presented.

answered Mar 25, 2015 at 20:09

htm11h's user avatar

htm11hhtm11h

1076 bronze badges

1

Методика тестирования памяти

Автор Сообщение
 
Прилепленное (важное) сообщение

СообщениеДобавлено: 08.02.2006 16:12 

[профиль]

Member

Статус: Не в сети
Регистрация: 10.11.2003
Откуда: Киев

Prime95:
Prime95 v.26.6 x64
Prime95 v.27.1 x86
Prime95 является клиентом распределенных вычислений для решения математической задачи – поиска простых чисел Мерсенна. Как и любой другой подобный клиент, программа загружает задание с центрального сервера, производит необходимые вычисления и возвращает результат. Но компьютерным энтузиастам Prime95 известна благодаря другим способностям – ее можно использовать как достаточно эффективный тест стабильности компьютера. Сравнение полученных результатов с эталонными помогает выявить ошибки в работе связки процессор–память (правда, определить, что именно «виновато» в возникновении ошибок – процессор или же память, бывает затруднительно). Имеется три режима проверки стабильности, причем Large FFT более эффективно тестирует CPU, а Blend – память. Для уверенности в стабильности рекомендуется тестирование праймом проводить не менее 3 часов, а для железной стабильности не менее 12.

S&M:
— S&M v.1.9.1 — страница описания и загрузки проекта.
— S&M 1.9.1+
Программа поддерживает несколько процессоров (от номера версии), имеет оптимизированные тесты прогрева с обнаружением ошибок под процессоры AMD, Intel Pentium4 и Core2. Тест памяти может проверять любой объем памяти. Тестирование так-же сегментами, тесты сделаны по образу и подобию TM1 и TM2.
Тест диска, особенно тест интерфейса, тоже вовсе не декоративный элемент программы. :)

MemTest 4.0 (HCI Design):
Эта незатейливая программка, как вы наверное догадались из названия, тестирует память. Для большей нагрузки, рекомендуется использовать несколько копий программы одновременно, указав в каждой объем доступной памяти деленный на количество запущенных копий. Как вариант особо изощренного тестирования — запустите количество экземпляров соответствующее количеству ядер вашего процессора, привязав каждый к отдельному ядру через диспетчер задач.

MemTest86+ 4.2
Известен наверное всем. Утилита работает из под DOS, и отлично тестирует память на дефекты. В качестве теста стабильности памяти для разогнанной системы подходит слабо (очень долго выявляет ошибки). Для разогнанной системы желательно пройти несколько полных циклов тестирования (хотя бы три). Для тестирования систем на базе Sandy Bridge используйте версию не младше 4.2.

TestMem5
Новый тест памяти от камрада serj, подробности можно прочесть в теме

TestMem5. Программа имеет очень гибкие настройки и оптимизирована под современные многоядерные процессоры.

Windows Memory Diagnostic:
Программа компании Microsoft, предназначенная для тестирования оперативной памяти компьютера на наличие ошибок. Утилита инсталлирует себя на дискету или сохраняет ISO-образ для создания загрузочного компакт-диска. Тестировать можно любые типы памяти (объем тестируемой памяти ограничен — до 4 ГБ)

Вспомогательные утилиты, мониторинг:

CPU-Z — Информационная утилита, кажет полную информацию о процессоре, Vcore, множитель, шины, SPD, информацию о видеокарте и матплате.
CPU Tweaker — кажет полную информацию о процессоре, множители, шины, текущие тайминги, SPD, имеет встроенный мониторинг температур, позволяет изменять тайминги и множители на лету.
Memory Throttle 1.01 — Утилита для проверки памяти процессоров Sandy Bridge на предмет перегрева/троттлинга. Позволяет заблокировать троттлинг памяти.
Realtemp — наиболее актуальное средство мониторинга температур для процессоров Core (2, i7). Кажет VID (для всех камней кроме nehalem), Distance to tjmax, Thermal Status (индикатор TM1).
Core Temp — аналог Real Temp по функционалу, мониторинг температур, по ссылке в комплекте с программой идет гаджет для рабочего стола для Win 7.
HWMonitor — мониторинг всех температур, напряжений, оборотов вентиляторов, температур видеокарты и HDD. Занижает температуру по сравнению с Real Temp на два градуса.
Speed Fan — мониторинг температур и практически всех параметров системы начиная от оборотов вентиляторов, заканчивая smart. Помимо мониторинга позволяет регулировать обороты вентиляторов подключенных к материнской плате.
ThrottleStop Показывает параметры энергосбережения, турбобуста, потребляемую мощность, реальный множитель для всех ядер. Ну и как видно из названия позволяет заблокировать троттлинг, а так же тонко настроить энергосбережение.

Материалы по теме:
Тестирование памяти

Реклама

Партнер
 
Imax-overclocker

Member

Статус: Не в сети
Регистрация: 22.08.2005
Откуда: Копейск

Всё тому же :)

Tonny писал(а):

S&M


_________________
.•°*”` .•°*”` • • <<<Only Trance>>> • • `”*°•. `”*°•.

 
Lord_of_Darkness

Member

Статус: Не в сети
Регистрация: 03.01.2004
Откуда: Питер

Tonny Все просто — верить всему :) Т.е. если все перечисленные тесты пройдены, то память стабильна.


_________________
Здесь так мало тех, с кем легко говорить,

Еще меньше тех, с кем не страшно молчать (c)

 
Silver8-)

Member

Статус: Не в сети
Регистрация: 26.09.2004
Откуда: Горький

СадаМаза рулит, единственный тест который находит ошибки, когда другие ужи пройдены, не слабо нагружает память.


_________________
AII 240 3700Mgh/2x2048Mb/AMD HD7750/HD1,5Tb+HD2Tb+2.5″USB2.0 640Gb+2.5″USB3.0 1Tb/Prodigy HD2 DE=>Beyerdynamic DT250/250ohm+Dialog AB30

 
Ан-124

Member

Статус: Не в сети
Регистрация: 07.10.2004
Откуда: Харьков (UA)

Silver8-)

Silver8-) писал(а):

единственный тест который находит ошибки

жжош, у меня почему-то голдмемори 6.64 единственная в опред. случаях находит…


_________________
No Brakes — No Tuning!!!

 
vansergeich

Member

Статус: Не в сети
Регистрация: 08.03.2005
Откуда: взял?!

Tonny Раз S&M находит ошибки, значит проблема есть. Но она не обязательно связана с памятью — в ошибках, наиденных S&M может быть также виноваты остальные компоненты системы — например матплата.


_________________
Настоящее — сегодня :)

 
Shurik Dribenetc

I’ll be back

Статус: Не в сети
Регистрация: 09.02.2005
Откуда: Оттуда

Tonny Для нача GoldMemory надо юзать в режиме долго. Но ни как не Quick.

Но верить надо, только совокупности всех тестов.

Так как, очень часто, при прохождении двух из трех тестов, третий находит ошибку и не обязательно это S&M…

 
Tonny

Member

Статус: Не в сети
Регистрация: 10.11.2003
Откуда: Киев

Lord_of_Darkness, Shurik Dribenetc, Ан-124

так и есть, действительно не всегда S&M даёт гарантию — тест прошёл, а 3Dmark2005 вылетел на первом же

Shurik Dribenetc нажаль, режим Долго не доступен в шароварной версии

 
macarena

Member

Статус: Не в сети
Регистрация: 11.12.2003
Откуда: николаев (UA)

вставлю и свои 5копеек

тест садомызы пройден в режиме цикл… но вылет в 01марке в тесте Матрица (вроде сильно нагружает память)

голдмемори сразу показала ошибки…

поддерживаю! нужно верить совокупности 5-7 тестов


_________________
Нет предела совершенству!

 
2k

Member

Статус: Не в сети
Регистрация: 27.09.2005
Откуда: Магнитогорск

Для каждой памяти индивидуально всё это. У тов. Overclockera на TCCD мог часами крутится Прайм, но СуперПи 32М не проходило. У меня же на DT-D43, СуперПи является самым слабым тестом… Как то раз, пройдя несколько раз СуперПи 32М, комп вывалился из Прайма на 2-й (!!!) минуте. Так что только полный набор тестов может доказать полную стабильность системы. В этот набор у меня включен в обязательном порядке Half Life 2, который вылетает при малейшем переразгоне.

 
Alex-Alex

Member

Статус: Не в сети
Регистрация: 12.02.2005
Откуда: Питер

2k

Цитата:

У тов. Overclockera на TCCD мог часами крутится Прайм, но СуперПи 32М не проходило

у меня таж самая тема с uccc — только супер пи.


_________________
Зашел в интернет

 
overme

Member

Статус: Не в сети
Регистрация: 17.08.2005
Откуда: Москва

4 часа Прайма — это мало. Время нужно увеличивать в разы — самый надежный вариант.


_________________
IMHO

 
Shurik Dribenetc

I’ll be back

Статус: Не в сети
Регистрация: 09.02.2005
Откуда: Оттуда

overme

overme писал(а):

4 часа Прайма — это мало. Время нужно увеличивать в разы — самый надежный вариант.

Прайм нельзя считать объективным тестом памяти, так как он может вылететь из-за любого сбоя в системе, будь то проц, чипсет… И ошибка в прайме, не говорит о том, что виновата память…

 
kfrdfylf

Member

Статус: Не в сети
Регистрация: 23.11.2004
Откуда: Питер

Срочно надо протестить память. Скачал Memtest. В чем суть этой программы? Сейчас запустил, прошло 447% Coverage, пишет в заголовке окна 0 ошибок. В чем суть этой проги вообще?


_________________
ICQ 329-525-412

 
Snow

Member

Статус: Не в сети
Регистрация: 29.01.2003
Откуда: Моск. область
Фото: 0

kfrdfylf писал(а):

В чем суть этой проги вообще?

э-э-э. Ну типа память проверяет и все такое.


_________________
TSC! Russia Team
WoT — Zlobny_Bobr

 
Gennadii

kfrdfylf Если нужно серьёзно проверить память, так чтобы в дальнейшем, к ней не возникало никаких вопросов: нужно 1. Скачать ISO для CD или Floppi с сайта

http://www.memtest.org/

программу memtest 86+ (сейчас помоему версия 1.86) на свой HD.

2. Записать этот образ на CD или Floppi (в зависимости от того что скачали).

3. Загрузиться с этого CD или Floppi.

4. Проверка начнётся автоматически.

Лично у меня была проблема, то что проблема именно с ОЗУ показала только эта программа, другие (стартующие из под Windows — показывали что ОЗУ — OK). Так как программа стартует из под собственного Линукса — она проверяет весь диапазон памяти, в отличии от Windows’ких тестов которые тестируют только свободный (в момент теста) диапазон ОЗУ.

 
kfrdfylf

Member

Статус: Не в сети
Регистрация: 23.11.2004
Откуда: Питер

Gennadii Snow спасибо, понял. А время прохождения примерно сколько составляет?


_________________
ICQ 329-525-412

 
Root

Advanced member

Статус: Не в сети
Регистрация: 30.08.2003
Откуда: Санкт-Петербург

kfrdfylf

зависит от скорости компа. Но один полный цикл вроде в районе 10минут. Да и не все баги вылезают на первом проходе :( Лучше на ночь поставить гонятся memtest86+, а на утро посмотреть резалт.


_________________
{:€ дед в законе :-) нородный окодемег
почетный пользователь OpenSuSE 11.3
Ремонт и модернизация ноутбуков IBM (Lenovo) ThinkPad

 
Gennadii

kfrdfylf Точно как сказал Root, но при этом (если оставлять на ночь), нужно незабыть переключить режим отображения результатов, т.к по умолчанию — текущий результат затирает предидущий. Как его переключить написано при вызове хелпа из программы (нужно нажать какую то клавишу или Tab, или Shift, или Backspase — непомню).

Кто сейчас на конференции

Сейчас этот форум просматривают: bc36, FTW_260, Gaarox и гости: 20

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Лаборатория

Новости

Проверить работоспособность оперативной памяти может потребоваться когда есть подозрения, что синие экраны смерти Windows вызваны проблемами с RAM, или Вы просто хотите убедиться что с Вашей оперативной памятью всё в порядке и она работает без сбоев.

1. Средство проверки памяти Windows
2. Проверка памяти в Memtest86+
3. Проверка стабильности памяти в MemTest64

1. Средство проверки памяти Windows — это встроенная утилита Windows, позволяет проверить RAM на ошибки. Для её запуска, нажмите клавиши Win+R на клавиатуре, введите mdsched и нажать Enter, или воспользуйтесь поиском Windows 10 и 8, введите запрос «Средство проверки памяти Windows».

После запуска утилиты Вам будет предложено перезагрузить компьютер для выполнения проверки памяти на ошибки. Выбираем «Выполнить перезагрузку и проверку».

После перезагрузки начнется выполнение сканирования.

В процессе сканирования можно нажать клавишу F1 для изменения параметров проверки:
Набор тестов — базовый, обычный или широкий.
Использование кэша — вкл или выкл.
Число проходов теста — максимум 15.

По завершении процесса проверки, компьютер перезагрузится и после входа в систему, через несколько минут в правом нижнем углу экрана — отобразит результаты проверки в виде короткого уведомления.

Иногда бывает что уведомление с результатом не появляется, в этом случае используйте утилиту «Просмотр событий» Windows, введите соответствующий запрос в поиске Windows для ее запуска.

В Просмотре событий выберите «Журналы Windows» -> «Система» и найдите сведения о результатах проверки памяти — MemoryDiagnostics-Results, по двойному клику по событию или внизу окна во вкладке «Общие» Вы увидите результат, «Память компьютера проверена с помощью средства проверки памяти Windows; ошибок не обнаружено», это если с памятью всё в прядке.


2. Проверка памяти в Memtest86+.

Скачайте Memtest86+ с официального сайта для создания загрузочной флешки

В процессе сканирования можно нажать клавишу F1 для изменения параметров проверки:
Набор тестов — базовый, обычный или широкий.
Использование кэша — вкл или выкл.
Число проходов теста — максимум 15.

По завершении процесса проверки, компьютер перезагрузится и после входа в систему, через несколько минут в правом нижнем углу экрана — отобразит результаты проверки в виде короткого уведомления.

Иногда бывает что уведомление с результатом не появляется, в этом случае используйте утилиту «Просмотр событий» Windows, введите соответствующий запрос в поиске Windows для ее запуска.

В Просмотре событий выберите «Журналы Windows» -> «Система» и найдите сведения о результатах проверки памяти — MemoryDiagnostics-Results, по двойному клику по событию или внизу окна во вкладке «Общие» Вы увидите результат, «Память компьютера проверена с помощью средства проверки памяти Windows; ошибок не обнаружено», это если с памятью всё в прядке.


2. Проверка памяти в Memtest86+.

Скачайте Memtest86+ с официального сайта для создания загрузочной флешки

Распакуйте архив, запустите «Memtest86+ USB Installer.exe», выберите флешку и нажмите кнопку «Create», установщик сделает флешку загрузочной с утилитой memtest86+

После того, как загрузочный накопитель с утилитой Memtest86+ готов, заходим в BIOS, в меню загрузки (Boot) устанавливаем в приоритет загрузку с нашей флешки, сохраняем настройки и перезагружаемся. Каких-то действий с вашей стороны не потребуется, тест начнется автоматически.

Прервать тест Вы можете в любой момент, нажав клавишу Esc.

В случае, если будут обнаружены ошибки, это будет выглядеть как на скриншоте ниже.


3. Проверка стабильности памяти в MemTest64

MemTest64 — это автономная утилита, которая позволяет проверять системную память на наличие проблем на аппаратном уровне. Она имеет графический интерфейс и может быть запущена из под Windows. Данной утилитой можно проверить память на стабильность после её разгона, или установок таймингов.

Скачать утилиту MemTest64 можно с официального сайта.

По умолчанию память тестируется неопределенное количество раз, но вы можете ограничить ее время выполнения. Чем дольше работает тест, тем точнее обнаружение неисправностей.

После завершения теста, если всё в порядке, утилита сообщит что в ходе теста ошибок не обнаружено

5 команд для проверки использования памяти в Linux

  1. бесплатная команда. Бесплатная команда — самая простая и удобная в использовании команда для проверки использования памяти в Linux. …
  2. 2. / proc / meminfo. Следующий способ проверить использование памяти — это прочитать файл / proc / meminfo. …
  3. vmstat. Команда vmstat с параметром s отображает статистику использования памяти во многом так же, как и команда proc. …
  4. верхняя команда. …
  5. хтоп.

5 июн. 2020 г.

Как проверить память на наличие ошибок?

Как проверить оперативную память с помощью средства диагностики памяти Windows

  1. Найдите «Диагностика памяти Windows» в меню «Пуск» и запустите приложение. …
  2. Выберите «Перезагрузить сейчас и проверить наличие проблем». Windows автоматически перезагрузится, запустит тест и снова загрузится в Windows. …
  3. После перезапуска дождитесь сообщения о результате.

20 мар. 2020 г.

Как узнать, неисправен ли DIMM Linux?

Вы можете получить помощь с помощью команды «dmidecode -t memory» (или dmidecode -t 16). Он напечатает полезную информацию, такую ​​как канал, слот и номер детали, чтобы идентифицировать поврежденный димм памяти.

Как мне проверить память моего сервера?

Чтобы определить статистику использования памяти на сервере, выполните следующие действия:

  1. Войдите на сервер по SSH.
  2. В командной строке введите следующую команду: free -m. Для облегчения чтения используйте параметр -m для отображения статистики использования памяти в мегабайтах. …
  3. Интерпретируйте свободный вывод команды.

Как решить проблемы с памятью в Linux?

Как устранить проблемы с памятью на сервере Linux

  1. Процесс неожиданно остановлен. Внезапно завершенные задачи часто являются результатом нехватки памяти в системе, когда вмешивается так называемый убийца нехватки памяти (OOM).…
  2. Текущее использование ресурсов. …
  3. Проверьте, не находится ли ваш процесс под угрозой. …
  4. Отключить перед фиксацией. …
  5. Увеличьте объем памяти на вашем сервере.

6 ночей. 2020 г.

Что происходит при выходе из строя ОЗУ?

Если ваша оперативная память не работает должным образом, приложения на вашем компьютере не будут работать нормально. Ваша операционная система будет работать очень медленно. Кроме того, ваш веб-браузер станет медленнее. На открытие уйдет больше времени.

Как мне устранить проблемы с моей оперативной памятью?

ОСНОВНОЕ УСТРАНЕНИЕ НЕПОЛАДОК

  1. Убедитесь, что у вас есть правильный модуль памяти для вашего компьютера. На веб-сайте производителя вы можете найти номер детали. …
  2. Убедитесь, что вы правильно настроили память. …
  3. Переустановите модуль. …
  4. Поменять местами модули. …
  5. Очистите гнездо и контакты на модуле памяти. …
  6. Обновите BIOS.

Как исправить сбой памяти?

В зависимости от того, что вызывает ошибки памяти, вы можете попробовать следующие варианты:

  1. Заменить модули RAM (наиболее распространенное решение)
  2. Установите тайминги RAM по умолчанию или консервативные.
  3. Увеличьте уровни напряжения RAM.
  4. Уменьшите уровни напряжения процессора.
  5. Примените обновление BIOS, чтобы исправить проблемы несовместимости.
  6. Отметить диапазоны адресов как «плохие»

Что такое сбой DIMM?

Модуль DIMM не проходит тестирование памяти в BIOS из-за неисправимых ошибок памяти (UCE). Возникают UCE, и расследование показывает, что ошибки возникли из памяти. Более 24 исправляемых ошибок (CE) возникают в течение 24 часов с одного модуля DIMM, и ни один другой модуль DIMM не отображает другие CE.

Что такое DIMM в Linux?

DIMM (модуль памяти с двумя линиями) — это тип компьютерной памяти, изначально имеющей 64-битный формат, что обеспечивает быструю передачу данных. DIMM — это модуль, который содержит одну или несколько микросхем оперативной памяти (RAM) на небольшой печатной плате с контактами, которые соединяют его с материнской платой компьютера. … Вместо этого можно использовать один модуль DIMM.

Какая польза от команды Dmidecode в Linux?

Команда dmidecode используется, когда пользователь хочет получить информацию об аппаратном обеспечении системы, такую ​​как процессор, оперативная память (DIMM), сведения о BIOS, память, серийные номера и т. д. системы Linux в читаемом формате.

Как проверить использование сервера?

Способы запуска монитора ресурсов

  1. Щелкните меню «Пуск» и введите ресурс… затем выберите «Монитор ресурсов».
  2. Щелкните правой кнопкой мыши область панели задач и выберите в меню «Диспетчер задач», затем на вкладке «Производительность» выберите «Открыть монитор ресурсов».
  3. Запускаем команду resmon.

18 мар. 2019 г.

Как проверить использование памяти запросами?

Вы можете отслеживать использование памяти на уровне базы данных следующим образом.

  1. Запустите SQL Server Management Studio и подключитесь к серверу.
  2. В обозревателе объектов щелкните правой кнопкой мыши базу данных, по которой нужно создавать отчеты.
  3. В контекстном меню выберите «Отчеты» -> «Стандартные отчеты» -> «Использование памяти объектами, оптимизированными для памяти».

17 мар. 2017 г.

Как проверить память на сервере AIX?

Если вы хотите получить максимальное количество процессов виртуальной памяти в вашей системе, вы можете использовать #svmon -P. Вывод команды topas показывает нам объем памяти как вычислительный процент, который является виртуальной памятью.

Как проверить память на сервере?

Очень часто (раз в час) вылетает строки в сислог:

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150211] [Hardware Error]: Corrected error, no action required.

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150228] [Hardware Error]: CPU:6 (10:8:0) MC4_STATUS[Over|CE|MiscV|-|AddrV|CECC]: 0xdc4a400053080813

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150238] [Hardware Error]: Error Addr: 0x0000001729eb00e0

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150243] [Hardware Error]: MC4 Error (node 1): DRAM ECC error detected on the NB.

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150274] [Hardware Error]: cache level: L3/GEN, mem/io: MEM, mem-tx: RD, part-proc: SRC (no timeout)

в связи с чем вопрос, я так понимаю проблема в памяти? Как можно ее проверить, если она ECC?


  • Вопрос задан

    более трёх лет назад

  • 311 просмотров

Если есть возможность, то прогоните через memtester. Тут, правда, бабка надвое сказала — память может корректировать битые данные и до memtest ошибка не долетит.

Вообще, ЕЦЦ на то и ЕЦЦ, чтобы администратор не заморачивался ошибками памяти, вот вам даже пишут:

Corrected error, no action required.

Так что лично мой вердикт: не обращайте внимания. Если начнут вдруг крашиться программы и паниковать ядро, вот тогда обращайте.

Пригласить эксперта


  • Показать ещё
    Загружается…

12 июн. 2023, в 20:59

500 руб./в час

12 июн. 2023, в 20:47

10000 руб./в час

12 июн. 2023, в 19:14

25000 руб./за проект

Минуточку внимания

Оглавление

  • Вступление
  • Коррекция ошибок
  • Финансовая сторона
  • Тестовый стенд
  • Методика тестирования
  • Результаты тестирования
    • Тест памяти
    • 3DMark
    • 7Zip
    • Cinebench
    • CrystalMark
    • Fritz
    • LinX
    • wPrime
    • AIDA64 Extreme
  • Заключение

Вступление

На сегодняшний день на просторах Рунета можно встретить открытые темы на форумах с вопросами – стоит ли брать рабочую станцию с ECC-памятью или можно обойтись обычной? В данных ветках можно прочесть множество противоречивых утверждений, и часть из них говорит о том, что коррекция ошибок сильно замедляет память, а следовательно и ЦП. Но мало кто это проверял на деле на современных процессорах.

Сегодня мы разберемся в этом вопросе и сравним производительность серверного процессора с обоими типами памяти. Но для начала небольшой экскурс.

Коррекция ошибок

Для чего необходима коррекция? И почему в работе памяти возникают ошибки? Перед ответом на эти вопросы следует разделить ошибки на два типа:

  • Аппаратные ошибки;
  • Случайные ошибки.

Причиной появления аппаратных ошибок является дефектная микросхема DRAM, а случайные ошибки возникают под воздействием излучения, альфа-частиц, элементарных частиц и прочего. Соответственно, первые в принципе неисправимы – если чип дефектный, то поможет только его замена; а вот вторые могут быть исправлены.

Почему же так необходима коррекция ошибок в рабочих станциях и серверах? Однобитовая ошибка в 64-битном слове меняет содержимое ячейки памяти, а в конечном итоге на жесткий диск может быть записано другое число, другие данные, при этом компьютер не зафиксирует эту подмену. А изменение бита в оперативной памяти может вызвать сбой программы, что для рабочей станции и сервера недопустимо.

рекомендации

3060 дешевле 30тр в Ситилинке

3070 Gigabyte Gaming за 50 тр с началом

<b>13900K</b> в Регарде по СТАРОМУ курсу 62

3070 Gainward Phantom дешевле 50 тр

10 видов <b>4070 Ti</b> в Ситилинке — все до 100 тр

13700K дешевле 40 тр в Регарде

MSI 3050 за 25 тр в Ситилинке

13600K дешевле 30 тр в Регарде

4080 почти за 100тр — дешевле чем по курсу 60

12900K за 40тр с началом в Ситилинке

RTX 4090 за 140 тр в Регарде

Компьютеры от 10 тр в Ситилинке

3060 Ti Gigabyte дешевле 40 тр в Регарде

3070 дешевле 50 тр в Ситилинке

-7% на 4080 Gigabyte Gaming

Для обнаружения изменения битов памяти можно использовать метод подсчета контрольной суммы, но он позволяет лишь обнаруживать ошибки без их исправления.

В свое время было предложено много различных способов решения данной проблемы, но на сегодняшний день наибольшее распространение получил метод коррекции ошибок или ECC (Error-Correcting Code). Данный метод позволяет автоматически исправлять однобитовые ошибки в 64-битном слове – SEC (Single Error Correction) и детектировать двухбитовые – DED (Double Error Detection).

Физическая реализация ECC заключается в размещении дополнительной микросхемы памяти на модуле ОЗУ – соответственно, при одностороннем дизайне модуля памяти вместо восьми чипов располагается девять, а при двустороннем вместо шестнадцати – восемнадцать. Таким образом, ширина модуля становится не 64 бита, а 72 бита.

Метод коррекции ошибок работает следующим образом: при записи 64 бит данных в ячейку памяти происходит подсчет контрольной суммы, составляющей 8 бит. Когда процессор обращается к этим данным и производит считывание, проводится повторный подсчет контрольной суммы и сравнение с исходной. Если суммы не совпадают – произошла ошибка. Если она однобитовая, то неправильный бит исправляется автоматически, если двухбитовая – детектируется и сообщается ОС.

Финансовая сторона

Прежде чем приступить к тестированию, необходимо затронуть финансовый вопрос.

Стоимость обычного модуля памяти DDR3-1600 с напряжением 1.35 В и объемом 8 Гбайт составляет около 3600 рублей, а с коррекцией ошибок – 4800 рублей. На первый взгляд ECC-память выходит на 30-35% дороже, что, в целом, не позволяет их сравнивать в силу существенно большей стоимости последней. Но почему же тогда такой вопрос возникает при сборке рабочей станции? Все просто – необходимо смотреть на данный вопрос шире, а именно – смотреть на общую стоимость рабочей станции.

Ценник однопроцессорной станции на базе четырехъядерного восьмипоточного Xeon (настольные процессоры серий i5 и i7 не поддерживают ECC-память) с 32 Гбайтами памяти, материнской платы с чипсетом C222/С224/С226 (десктопные наборы логики Z87/Z97 и другие также не поддерживают память с коррекцией ошибок) будет превышать 70 000 рублей (при условии, что устанавливаются серверные SSD с повышенным ресурсом). А если включить в эту стоимость и дискретную видеокарту, и прочие сопутствующие компоненты, например, ИБП, то ценник из пятизначного превратится в шестиизначный, перевалив планку в 100 000 рублей.

Покупка 32 Гбайт памяти с коррекцией ошибок потребует дополнительных 4-6 тысяч рублей, что по отношению к общей стоимости рабочей станции не превышает 5%, то есть не является критичным. Также переход от десктопного к серверному железу предоставит и другие преимущества, например: интегрированные графические карты P4600 в процессорах Intel Xeon E3-1200 третьего поколения получили оптимизированные драйверы, которые должны повышать производительность в профессиональных приложениях, например, в CAD; поддержка технологии Intel VT-d, которая позволяет пробрасывать устройства в виртуальную среду, например, видеокарты; прочие серверные технологии – Intel AMT или IPMI, WatchDog и другие, которые также могут оказаться полезными.

Таким образом, хоть и сама ECC-память стоит заметно дороже обычной, в общей стоимости рабочей станции данная статья затрат является несущественной, и переплата не превышает 5%.

Тестовый стенд

Для данного обзора использовалась следующая конфигурация:

  • Материнская плата: Supermicro X10SAE (Intel C226, LGA 1150);
  • Процессор: Xeon E3-1245V3 (Turbo Boost – off, EIST – off, HT – on);
  • Оперативная память:
    • 2x Kingston DDR3-1600 ECC 8 Гбайт (KVR16LE11/8 CL11, 1.35 В);
    • 2x Kingston DDR3-1600 8 Гбайт (KVR16LN11/8 CL11, 1.35 В);
  • ОС: Windows 8.1 Pro 64-bit.

Методика тестирования

В рамках тестирования были произведены замеры производительности как при одноканальном режиме работы ИКП, так и при двухканальном. Суммарный объем ОЗУ составил 8 (один модуль) и 16 Гбайт (два модуля) соответственно.

Программное обеспечение:

  • 3DMark 2006 1.2;
  • 7Zip 9.20;
  • AIDA64 Extreme 5.20.3400;
  • Cinebench R15;
  • CrystalMark 2004R3;
  • Fritz 4.20;
  • LinX 0.6.5;
  • wPrime 2.10.

Результаты тестирования

Тест памяти

Перед тем, как приступить к тестированию, проведем замер пропускной способности памяти и латентности.

550x378 31 KB. Big one: 1019x701 26 KB

В случае, если будут обнаружены ошибки, это будет выглядеть как на скриншоте ниже.


3. Проверка стабильности памяти в MemTest64

MemTest64 — это автономная утилита, которая позволяет проверять системную память на наличие проблем на аппаратном уровне. Она имеет графический интерфейс и может быть запущена из под Windows. Данной утилитой можно проверить память на стабильность после её разгона, или установок таймингов.

Скачать утилиту MemTest64 можно с официального сайта.

По умолчанию память тестируется неопределенное количество раз, но вы можете ограничить ее время выполнения. Чем дольше работает тест, тем точнее обнаружение неисправностей.

После завершения теста, если всё в порядке, утилита сообщит что в ходе теста ошибок не обнаружено

5 команд для проверки использования памяти в Linux

  1. бесплатная команда. Бесплатная команда — самая простая и удобная в использовании команда для проверки использования памяти в Linux. …
  2. 2. / proc / meminfo. Следующий способ проверить использование памяти — это прочитать файл / proc / meminfo. …
  3. vmstat. Команда vmstat с параметром s отображает статистику использования памяти во многом так же, как и команда proc. …
  4. верхняя команда. …
  5. хтоп.

5 июн. 2020 г.

Как проверить память на наличие ошибок?

Как проверить оперативную память с помощью средства диагностики памяти Windows

  1. Найдите «Диагностика памяти Windows» в меню «Пуск» и запустите приложение. …
  2. Выберите «Перезагрузить сейчас и проверить наличие проблем». Windows автоматически перезагрузится, запустит тест и снова загрузится в Windows. …
  3. После перезапуска дождитесь сообщения о результате.

20 мар. 2020 г.

Как узнать, неисправен ли DIMM Linux?

Вы можете получить помощь с помощью команды «dmidecode -t memory» (или dmidecode -t 16). Он напечатает полезную информацию, такую ​​как канал, слот и номер детали, чтобы идентифицировать поврежденный димм памяти.

Как мне проверить память моего сервера?

Чтобы определить статистику использования памяти на сервере, выполните следующие действия:

  1. Войдите на сервер по SSH.
  2. В командной строке введите следующую команду: free -m. Для облегчения чтения используйте параметр -m для отображения статистики использования памяти в мегабайтах. …
  3. Интерпретируйте свободный вывод команды.

Как решить проблемы с памятью в Linux?

Как устранить проблемы с памятью на сервере Linux

  1. Процесс неожиданно остановлен. Внезапно завершенные задачи часто являются результатом нехватки памяти в системе, когда вмешивается так называемый убийца нехватки памяти (OOM).…
  2. Текущее использование ресурсов. …
  3. Проверьте, не находится ли ваш процесс под угрозой. …
  4. Отключить перед фиксацией. …
  5. Увеличьте объем памяти на вашем сервере.

6 ночей. 2020 г.

Что происходит при выходе из строя ОЗУ?

Если ваша оперативная память не работает должным образом, приложения на вашем компьютере не будут работать нормально. Ваша операционная система будет работать очень медленно. Кроме того, ваш веб-браузер станет медленнее. На открытие уйдет больше времени.

Как мне устранить проблемы с моей оперативной памятью?

ОСНОВНОЕ УСТРАНЕНИЕ НЕПОЛАДОК

  1. Убедитесь, что у вас есть правильный модуль памяти для вашего компьютера. На веб-сайте производителя вы можете найти номер детали. …
  2. Убедитесь, что вы правильно настроили память. …
  3. Переустановите модуль. …
  4. Поменять местами модули. …
  5. Очистите гнездо и контакты на модуле памяти. …
  6. Обновите BIOS.

Как исправить сбой памяти?

В зависимости от того, что вызывает ошибки памяти, вы можете попробовать следующие варианты:

  1. Заменить модули RAM (наиболее распространенное решение)
  2. Установите тайминги RAM по умолчанию или консервативные.
  3. Увеличьте уровни напряжения RAM.
  4. Уменьшите уровни напряжения процессора.
  5. Примените обновление BIOS, чтобы исправить проблемы несовместимости.
  6. Отметить диапазоны адресов как «плохие»

Что такое сбой DIMM?

Модуль DIMM не проходит тестирование памяти в BIOS из-за неисправимых ошибок памяти (UCE). Возникают UCE, и расследование показывает, что ошибки возникли из памяти. Более 24 исправляемых ошибок (CE) возникают в течение 24 часов с одного модуля DIMM, и ни один другой модуль DIMM не отображает другие CE.

Что такое DIMM в Linux?

DIMM (модуль памяти с двумя линиями) — это тип компьютерной памяти, изначально имеющей 64-битный формат, что обеспечивает быструю передачу данных. DIMM — это модуль, который содержит одну или несколько микросхем оперативной памяти (RAM) на небольшой печатной плате с контактами, которые соединяют его с материнской платой компьютера. … Вместо этого можно использовать один модуль DIMM.

Какая польза от команды Dmidecode в Linux?

Команда dmidecode используется, когда пользователь хочет получить информацию об аппаратном обеспечении системы, такую ​​как процессор, оперативная память (DIMM), сведения о BIOS, память, серийные номера и т. д. системы Linux в читаемом формате.

Как проверить использование сервера?

Способы запуска монитора ресурсов

  1. Щелкните меню «Пуск» и введите ресурс… затем выберите «Монитор ресурсов».
  2. Щелкните правой кнопкой мыши область панели задач и выберите в меню «Диспетчер задач», затем на вкладке «Производительность» выберите «Открыть монитор ресурсов».
  3. Запускаем команду resmon.

18 мар. 2019 г.

Как проверить использование памяти запросами?

Вы можете отслеживать использование памяти на уровне базы данных следующим образом.

  1. Запустите SQL Server Management Studio и подключитесь к серверу.
  2. В обозревателе объектов щелкните правой кнопкой мыши базу данных, по которой нужно создавать отчеты.
  3. В контекстном меню выберите «Отчеты» -> «Стандартные отчеты» -> «Использование памяти объектами, оптимизированными для памяти».

17 мар. 2017 г.

Как проверить память на сервере AIX?

Если вы хотите получить максимальное количество процессов виртуальной памяти в вашей системе, вы можете использовать #svmon -P. Вывод команды topas показывает нам объем памяти как вычислительный процент, который является виртуальной памятью.

Как проверить память на сервере?

Очень часто (раз в час) вылетает строки в сислог:

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150211] [Hardware Error]: Corrected error, no action required.

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150228] [Hardware Error]: CPU:6 (10:8:0) MC4_STATUS[Over|CE|MiscV|-|AddrV|CECC]: 0xdc4a400053080813

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150238] [Hardware Error]: Error Addr: 0x0000001729eb00e0

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150243] [Hardware Error]: MC4 Error (node 1): DRAM ECC error detected on the NB.

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150274] [Hardware Error]: cache level: L3/GEN, mem/io: MEM, mem-tx: RD, part-proc: SRC (no timeout)

в связи с чем вопрос, я так понимаю проблема в памяти? Как можно ее проверить, если она ECC?


  • Вопрос задан

    более трёх лет назад

  • 311 просмотров

Если есть возможность, то прогоните через memtester. Тут, правда, бабка надвое сказала — память может корректировать битые данные и до memtest ошибка не долетит.

Вообще, ЕЦЦ на то и ЕЦЦ, чтобы администратор не заморачивался ошибками памяти, вот вам даже пишут:

Corrected error, no action required.

Так что лично мой вердикт: не обращайте внимания. Если начнут вдруг крашиться программы и паниковать ядро, вот тогда обращайте.

Пригласить эксперта


  • Показать ещё
    Загружается…

12 июн. 2023, в 20:59

500 руб./в час

12 июн. 2023, в 20:47

10000 руб./в час

12 июн. 2023, в 19:14

25000 руб./за проект

Минуточку внимания

Оглавление

  • Вступление
  • Коррекция ошибок
  • Финансовая сторона
  • Тестовый стенд
  • Методика тестирования
  • Результаты тестирования
    • Тест памяти
    • 3DMark
    • 7Zip
    • Cinebench
    • CrystalMark
    • Fritz
    • LinX
    • wPrime
    • AIDA64 Extreme
  • Заключение

Вступление

На сегодняшний день на просторах Рунета можно встретить открытые темы на форумах с вопросами – стоит ли брать рабочую станцию с ECC-памятью или можно обойтись обычной? В данных ветках можно прочесть множество противоречивых утверждений, и часть из них говорит о том, что коррекция ошибок сильно замедляет память, а следовательно и ЦП. Но мало кто это проверял на деле на современных процессорах.

Сегодня мы разберемся в этом вопросе и сравним производительность серверного процессора с обоими типами памяти. Но для начала небольшой экскурс.

Коррекция ошибок

Для чего необходима коррекция? И почему в работе памяти возникают ошибки? Перед ответом на эти вопросы следует разделить ошибки на два типа:

  • Аппаратные ошибки;
  • Случайные ошибки.

Причиной появления аппаратных ошибок является дефектная микросхема DRAM, а случайные ошибки возникают под воздействием излучения, альфа-частиц, элементарных частиц и прочего. Соответственно, первые в принципе неисправимы – если чип дефектный, то поможет только его замена; а вот вторые могут быть исправлены.

Почему же так необходима коррекция ошибок в рабочих станциях и серверах? Однобитовая ошибка в 64-битном слове меняет содержимое ячейки памяти, а в конечном итоге на жесткий диск может быть записано другое число, другие данные, при этом компьютер не зафиксирует эту подмену. А изменение бита в оперативной памяти может вызвать сбой программы, что для рабочей станции и сервера недопустимо.

рекомендации

3060 дешевле 30тр в Ситилинке

3070 Gigabyte Gaming за 50 тр с началом

<b>13900K</b> в Регарде по СТАРОМУ курсу 62

3070 Gainward Phantom дешевле 50 тр

10 видов <b>4070 Ti</b> в Ситилинке — все до 100 тр

13700K дешевле 40 тр в Регарде

MSI 3050 за 25 тр в Ситилинке

13600K дешевле 30 тр в Регарде

4080 почти за 100тр — дешевле чем по курсу 60

12900K за 40тр с началом в Ситилинке

RTX 4090 за 140 тр в Регарде

Компьютеры от 10 тр в Ситилинке

3060 Ti Gigabyte дешевле 40 тр в Регарде

3070 дешевле 50 тр в Ситилинке

-7% на 4080 Gigabyte Gaming

Для обнаружения изменения битов памяти можно использовать метод подсчета контрольной суммы, но он позволяет лишь обнаруживать ошибки без их исправления.

В свое время было предложено много различных способов решения данной проблемы, но на сегодняшний день наибольшее распространение получил метод коррекции ошибок или ECC (Error-Correcting Code). Данный метод позволяет автоматически исправлять однобитовые ошибки в 64-битном слове – SEC (Single Error Correction) и детектировать двухбитовые – DED (Double Error Detection).

Физическая реализация ECC заключается в размещении дополнительной микросхемы памяти на модуле ОЗУ – соответственно, при одностороннем дизайне модуля памяти вместо восьми чипов располагается девять, а при двустороннем вместо шестнадцати – восемнадцать. Таким образом, ширина модуля становится не 64 бита, а 72 бита.

Метод коррекции ошибок работает следующим образом: при записи 64 бит данных в ячейку памяти происходит подсчет контрольной суммы, составляющей 8 бит. Когда процессор обращается к этим данным и производит считывание, проводится повторный подсчет контрольной суммы и сравнение с исходной. Если суммы не совпадают – произошла ошибка. Если она однобитовая, то неправильный бит исправляется автоматически, если двухбитовая – детектируется и сообщается ОС.

Финансовая сторона

Прежде чем приступить к тестированию, необходимо затронуть финансовый вопрос.

Стоимость обычного модуля памяти DDR3-1600 с напряжением 1.35 В и объемом 8 Гбайт составляет около 3600 рублей, а с коррекцией ошибок – 4800 рублей. На первый взгляд ECC-память выходит на 30-35% дороже, что, в целом, не позволяет их сравнивать в силу существенно большей стоимости последней. Но почему же тогда такой вопрос возникает при сборке рабочей станции? Все просто – необходимо смотреть на данный вопрос шире, а именно – смотреть на общую стоимость рабочей станции.

Ценник однопроцессорной станции на базе четырехъядерного восьмипоточного Xeon (настольные процессоры серий i5 и i7 не поддерживают ECC-память) с 32 Гбайтами памяти, материнской платы с чипсетом C222/С224/С226 (десктопные наборы логики Z87/Z97 и другие также не поддерживают память с коррекцией ошибок) будет превышать 70 000 рублей (при условии, что устанавливаются серверные SSD с повышенным ресурсом). А если включить в эту стоимость и дискретную видеокарту, и прочие сопутствующие компоненты, например, ИБП, то ценник из пятизначного превратится в шестиизначный, перевалив планку в 100 000 рублей.

Покупка 32 Гбайт памяти с коррекцией ошибок потребует дополнительных 4-6 тысяч рублей, что по отношению к общей стоимости рабочей станции не превышает 5%, то есть не является критичным. Также переход от десктопного к серверному железу предоставит и другие преимущества, например: интегрированные графические карты P4600 в процессорах Intel Xeon E3-1200 третьего поколения получили оптимизированные драйверы, которые должны повышать производительность в профессиональных приложениях, например, в CAD; поддержка технологии Intel VT-d, которая позволяет пробрасывать устройства в виртуальную среду, например, видеокарты; прочие серверные технологии – Intel AMT или IPMI, WatchDog и другие, которые также могут оказаться полезными.

Таким образом, хоть и сама ECC-память стоит заметно дороже обычной, в общей стоимости рабочей станции данная статья затрат является несущественной, и переплата не превышает 5%.

Тестовый стенд

Для данного обзора использовалась следующая конфигурация:

  • Материнская плата: Supermicro X10SAE (Intel C226, LGA 1150);
  • Процессор: Xeon E3-1245V3 (Turbo Boost – off, EIST – off, HT – on);
  • Оперативная память:
    • 2x Kingston DDR3-1600 ECC 8 Гбайт (KVR16LE11/8 CL11, 1.35 В);
    • 2x Kingston DDR3-1600 8 Гбайт (KVR16LN11/8 CL11, 1.35 В);
  • ОС: Windows 8.1 Pro 64-bit.

Методика тестирования

В рамках тестирования были произведены замеры производительности как при одноканальном режиме работы ИКП, так и при двухканальном. Суммарный объем ОЗУ составил 8 (один модуль) и 16 Гбайт (два модуля) соответственно.

Программное обеспечение:

  • 3DMark 2006 1.2;
  • 7Zip 9.20;
  • AIDA64 Extreme 5.20.3400;
  • Cinebench R15;
  • CrystalMark 2004R3;
  • Fritz 4.20;
  • LinX 0.6.5;
  • wPrime 2.10.

Результаты тестирования

Тест памяти

Перед тем, как приступить к тестированию, проведем замер пропускной способности памяти и латентности.

При изучении результатов можно заключить, что производительность ECC- и non-ECC- памяти находится на одном и том же уровне в рамках погрешности.

550x147 18 KB. Big one: 1017x273 11 KB

Если в предыдущем тесте от замера к замеру выигрывал то один, то другой тип памяти, то при замере латентности ECC-память постоянно показывает большие задержки. Но разница несущественна – всего лишь 1 нс.

Таким образом, замер ПС и латентности памяти не показал особых различий между ECC- и non-ECC-памятью. Посмотрим, повторится ли это в последующих тестах.

3DMark

Тестовый пакет 3DMark содержит подтесты как для процессора, так и для графической карты. Здесь и кроется самое интересное – давно известно, что встроенному видеоядру не хватает существующей ПСП в 25.6 Гбайт/с, поэтому именно в графических подтестах можно выявить негативное влияние коррекции ошибок, если оно вообще есть,…

550x880 50 KB. Big one: 1037x1661 64 KB

… но разницы нет – что ECC, что non-ECC. Ни процессор, ни интегрированное ядро никак не реагируют на замену обычной памяти на DDR с коррекцией ошибок – результаты одинаковы в рамках погрешности. Среднеарифметическая разница составила 0.02% в пользу ECC-памяти для одноканального режима и 1.6% для двухканального режима.

При этом нельзя сказать, что встроенная видеокарта P4600 не зависит от скорости ОЗУ – при одноканальном доступе общий результат почти на 30% ниже, чем при двухканальном. Другими словами, скорость ОЗУ критична для графического ядра, но сами по себе «ECC-версии» не влияют ни на скорость ОЗУ, ни на видеокарту.

7Zip

Архиваторы, как известно, чувствительны к памяти, поэтому, возможно, здесь получится зафиксировать влияние типа памяти на производительность.

550x293 23 KB. Big one: 1027x548 20 KB

Ситуация с архивацией неоднозначная: с одной стороны – в одноканальном режиме (как при распаковке, так и при сжатии) ECC-память уверенно оказывается медленнее на 2%; с другой – в двухканальном режиме при сжатии ECC-память уверенно быстрее, а при распаковке – медленнее, а среднее арифметическое – быстрее на 0.65%.

Скорее всего, причина в следующем – пропускной способности памяти при одноканальном доступе процессору явно недостаточно, и поэтому чуть большая латентность ECC-памяти сказывается на производительности; а при двухканальном доступе ПСП полностью покрывает нужды CPU и поэтому чуть большая латентность памяти с коррекцией ошибок не сказывается на производительности. В любом случае зафиксировать существенного влияния на скорость архивации не получилось.

Cinebench

Тестовый пакет Cinebench содержит подтест как процессора, так и видеокарты.

550x293 20 KB. Big one: 1026x547 20 KB

Но ни первый, ни вторая никак не отреагировали на ECC-память.

Зато налицо явная зависимость видеокарты от ПСП – при одноканальном доступе результат в OpenGL оказался на 25% ниже, чем при двухканальном. Вспоминая результаты 3DMark и смотря на нынешние, можно заключить, что производительность интегрированной видеокарты хоть и зависит от ПСП, но ECC-память не оказывает на нее негативного влияния.

Андрей Борзенко

Для обеспечения приемлемой производительности современным серверам требуются огромные объемы памяти. Одна из причин в том, что быстродействие используемых в серверах микропроцессоров Intel увеличилось по сравнению с началом 1990-х гг. в 20 раз, а быстродействие дисков за то же время возросло всего лишь в 5 раз. Известно также, что по мере дальнейшего увеличения быстродействия микропроцессоров элементы памяти становятся узким местом компьютерных систем. Если частоты микропроцессоров давно превысили частоты системной шины, то шина памяти до самого последнего времени работала синхронно с последней.

Однако использование быстродействующих и дорогих кристаллов памяти для серверов не всегда эффективно с точки зрения баланса стоимости и быстродействия. Для обеспечения удовлетворительной общей производительности систем обычно применяется недорогая память большого объема. Именно это позволяет сгладить разрыв между быстрыми микропроцессорами и медленными дисками. При такой высокой потребности в памяти на серверах заказчики нуждаются в оборудовании более дешевом, но обеспечивающем повышенную надежность.

Себестоимость памяти обычно снижают за счет максимального повышения разрядности микросхем. Плотная упаковка (т. е. повышение разрядности) микросхем памяти позволила резко снизить соотношение цена/емкость. Такие микросхемы передают и получают четыре или восемь разрядов данных в каждой операции доступа.

Напомним, что для микросхем памяти емкость традиционно измеряется в битах, а вот емкость модулей — в байтах (1 Мбайт = 8х1 Мбит). Обозначение 1 Мх4 означает, что данная микросхема может адресовать 1 Мбит ячеек, в каждой из которых может храниться 4 бита информации. Говорят также, что емкость такой микросхемы 4 Мбит. Как правило, емкость микросхем памяти растет с инкрементом четыре. Дело в том, что добавление одной адресной линии увеличивает количество строк (и столбцов) в матрице памяти вдвое, всего же ее размер возрастает вчетверо. Каждый кристалл памяти содержит ячейки, в которых может храниться от одного до шестнадцати разрядов данных. Например, 16-мегабитный кристалл можно сконфигурировать как 4 Mбит x 4, 2 Mбит x 8 или 1 Mбит x 16, но во всех случаях его общая емкость равна 16 Mбит. Число разрядов на ячейку показывает, сколько бит передается одновременно при обращении к ней.

От проверки четности до ECC

Ошибки памяти можно подразделить на аппаратные и случайные. Аппаратные ошибки обычно обусловлены дефектами кремниевого кристалла или монтажных соединений микросхем DRAM и со временем не исчезают. Случайные ошибки (или «мягкие») обычно вызываются заряженными частицами или излучением; они непостоянны и со временем пропадают. Ранее основной причиной случайных ошибок были альфа-частицы, но более строгий контроль качества материала, из которого делаются корпуса микросхем DRAM, позволил производителям практически ликвидировать эту причину сбоев. В настоящее время основной источник случайных ошибок в микросхемах DRAM — электрические возмущения, вызванные космическими лучами — потоками высокоэнергетических элементарных частиц, приходящими из космоса.

В начале 1990-х гг. в большинстве серверов, оборудованных микропроцессорами
Intel, применялся метод проверки четности памяти. Он позволяет обнаруживать
ошибки, но не исправлять их. Метод контроля по четности широко применялся еще
в первых моделях компьютеров для оценки достоверности хранимой в оперативной
памяти информации. Состоит он в следующем. При записи байта информации в запоминающее
устройство определяется дополнительный контрольный разряд, который вычисляется
обычно путем логического сложения всех информационных разрядов (как показано
в таблице). Обычно контрольный разряд равен единице, если число единиц в байте
было четным, и нулю, если число единиц в группе было нечетным.

Получение контрольного разряда

Байт информации Количество единичных разрядов Значение бита четности Количество единиц, включая бит четности
00000000 0 1 1
10110011 5 0 5
00100100 2 1 3
11111111 8 1 9

Таким образом, при чтении ранее записанного байта, вновь получив контрольный
разряд и сравнив его с уже имеющимся, можно оценить достоверность получаемой
информации. Если значения хранимого и полученного разрядов совпадают, то данные
считаются истинными; в противном случае генерируется сообщение об ошибке четности,
которое приводит к остановке компьютера. При возникновении ошибки в самом разряде
четности работа системы нарушается и все данные в памяти безвозвратно теряются.
Представьте себе, что в памяти сервера находится 32 или даже 64 Mбайт данных,
еще не сохраненных на диске. В случае ошибки четности вся эта немалая информация
пропадает безвозвратно. А ведь все серверы размещают данные в памяти до того,
как сохранить их на диске.

Данный метод контроля имел определенный смысл, пока микросхемы памяти были недостаточно надежными. К тому же, если на каждые восемь информационных разрядов приходится один бит четности, то стоимость модуля тем самым увеличивается более чем на 10%. Значительные технологические успехи в производстве микросхем динамической памяти привели к существенному росту их надежности. Так, у современных микросхем памяти среднее время наработки на отказ определяется годами, а то и десятками лет. Примерно с середины 90-х гг. изготовители модулей памяти стали постепенно отказываться от схемы контроля по четности. Например, популярный набор микросхем Intel Triton (430FX) вообще не поддерживал проверку на четность. Некоторые системные платы для компьютеров хотя и допускали использование SIMM-модулей с контролем четности, но саму проверку могли и не поддерживать. Однако для построения серверов, работающих с критически важной информацией, такой подход был, разумеется, неприемлем.

В предыдущие годы высокая частота ошибок четности памяти вынудила отрасль перейти на новый стандарт и обеспечить поддержку ECC (Error Checking and Correcting — обнаружение и исправление ошибок). Обычно эту особенность называют SEC/DED (Single Error Correction/Double Error Detection — коррекция единичных и обнаружение двойных ошибок). Механизм SEC/DED не позволяет обнаруживать ошибки более чем в двух разрядах. В этом случае целостность информации нарушается. В архитектуре такого типа ошибки в нескольких разрядах неустранимы и приводят к отказу системы, а сбои единичных разрядов исправляются автоматически, незаметно («прозрачно») для операционной системы и прикладных программ.

Теперь для наиболее ответственных приложений, где цена ошибки очень высока, используются уже не обычные модули с проверкой на четность, а модули с коррекцией ошибок ECC. При обычной проверке на четность невозможно обнаружить, например, возникновение двух ошибок одновременно. Действительно, если в байте информации 00100100 со значением бита четности 1 изменятся значения двух разрядов — 01100000, то бит четности все равно будет равен 1.

Идея, лежащая в основе метода ECC, довольно проста — каждый разряд памяти входит более чем в одну контрольную сумму. Это увеличивает число контрольных разрядов, но дает возможность восстанавливать значение сбойного бита по несовпадающим контрольным суммам. Итак, ECC использует один разряд четности на байт информации для нахождения одиночных ошибок, а для исправления требуется 7 бит для 32- и 8 бит для 64-разрядной памяти. При этом легко обнаруживаются двойные ошибки, как та, что описана выше. Следовательно, для ECC можно использовать обычные модули с контролем четности, если это допускает контроллер памяти. Основной недостаток при такой схеме использования ECC — снижение общей производительности системы, на которую возлагаются дополнительные вычисления.

Другой способ реализации ECC — размещение логики контроля не в контроллере памяти на системной плате, а на самом модуле. Это позволяет избежать снижения производительности, но стоимость таких модулей выше, чем обычных. Поскольку ошибки в большем числе разрядов случались чрезвычайно редко, метод ECC позволил существенно повысить надежность систем. Сегодня технология ECC стала стандартом и применяется практически во всех серверах.

Разрядность данных различна для разных микросхем DRAM. Используемые в настоящее время DIMM-модули (Dual In-line Memory Module) со 168 и 184 контактными выводами (рис. 1) оснащаются микросхемами DRAM с разрядностью данных х4 (4 разряда данных), x8 или x16. Для поддержки 72 разрядов (64 разряда данных и 8 разрядов для кодов исправления ошибок) требуются микросхемы DRAM с более высокой разрядностью, так как на модуле DIMM просто недостаточно места, чтобы решить эту задачу, установив DRAM-микросхемы с меньшей плотностью.

Fig.1 Рис. 1. Модуль памяти DIMM ECC.


Недостатки ECC

Безвозвратная потеря данных случается, когда на микросхеме в DIMM-модуле происходит ошибка в нескольких разрядах, — этот сбой механизм ECC устранить не в состоянии. Представьте себе, что за один цикл микросхема обменивается восемью разрядами данных. При возникновении ошибки, не подлежащей исправлению средствами механизма ECC, все восемь разрядов данных теряются, что, в свою очередь, вызывает аварийную остановку сервера. Потеря данных по причине ошибок памяти возможна как в 4-разрядных, так и в 8-разрядных микросхемах: ведь механизм ECC защищает от сбоев только единичных разрядов. По мере уплотнения DRAM-устройств доля многоразрядных ошибок увеличивается. Кроме того, объемы памяти на современных серверах все время растут (устанавливаются большие количества модулей или модули с большим объемом памяти), и вероятность неустранимых ошибок DRAM-памяти — как случайных, так и постоянных, — увеличивается. Таким образом, память стандарта SEC/DED, которая еще недавно обеспечивала вполне удовлетворительные характеристики, теперь не удовлетворяет требованиям высокой надежности, доступности и удобства в эксплуатации (RAS — Reliability, Availability and Serviceability), предъявляемым к современным серверам. Это, в частности, касается серверов масштаба предприятия, стандартные объемы памяти которых ныне превышают несколько гигабайт. Кроме того, следует отметить, что требования к объемам памяти существенно возросли после выпуска 64-разрядных компьютерных систем семейства Itanium.

На современных высокопроизводительных файловых серверах с микропроцессорами Intel такие ошибки в микросхемах памяти могут вызвать разрушение системы и безвозвратную потерю нескольких гигабайт критических данных. В большинстве файл-серверных приложений восстановление данных после такого аварийного отказа практически невозможно. Сбои в памяти также способны привести к существенным простоям приложений серверов баз данных, в которых информация защищается от потери путем записи всех транзакций на диск. Дело в том, что механизму восстановления обычно требуется масса времени на воссоздание базы данных на основании записей журнала транзакций, которые не успели попасть в базу данных. Иногда на это уходит несколько часов работы сервера, на протяжении которых он не способен обслуживать текущие бизнес-операции.

Новый механизм исправления ошибок

Одной из составных частей инициативы X-Architecture корпорации IBM (http://www.ibm.com/ru)
стала технология исправления ошибок Chipkill. Она обеспечивает защиту серверов
от отказов отдельных микросхем и многоразрядных ошибок в модулях памяти. Эта
технология, перенесенная IBM с больших систем, существенно сокращает среднее
время простоя серверов и обеспечивает более надежную платформу для клиент-серверных
вычислений на базе микропроцессоров Intel. Она призвана повысить надежность
систем, доступность и удобство в эксплуатации — ключевые характеристики серверов
масштаба предприятия, обслуживающих критически важные приложения. Архитектура
Chipkill позволяет системе безболезненно воспринимать ошибки, которые в обычных
условиях приводят к неустранимым сбоям, тем самым обеспечивая сохранность данных
и высокую доступность системы.

В системах высокой доступности, таких как серверы масштаба предприятия IBM S/390, проблема многоразрядных ошибок памяти DRAM отсутствует благодаря особой архитектуре оперативной памяти. Подсистема памяти сконструирована так, что отказ отдельной микросхемы, независимо от ее разрядности, не затронет более одного разряда в каком-либо из нескольких слов ECC. Например, в 4-разрядной микросхеме DRAM отдельные биты из всей четверки попадают в разные слова ECC, т. е. в разные адресные пространства памяти. Поэтому даже в случае полного отказа микросхемы количество ошибочных разрядов в словах ECC не превысит единицу, а такую ошибку механизм ECC устраняет автоматически. Данная архитектура обеспечивает отказоустойчивость всей подсистемы памяти.

Продуманная конструкция мэйнфреймов защищает их от сбоев микросхем памяти. В каждом модуле памяти разрядность микросхем равна числу разрядов, защищенных механизмом ECC. Нынешние серверы на базе микропроцессоров Intel такого механизма не поддерживают — ведь рынок требует дешевой памяти, вынуждая проектировщиков создавать очень плотные микросхемы памяти, поддерживающие отраслевой стандарт (иными словами, исключительно ECC).

Chipkill — это механизм, позволяющий памяти противостоять многоразрядным ошибкам на отдельных микросхемах DRAM, в том числе сбою всех разрядов данных. В механизме Chipkill есть два основных метода исправления ошибок, причем они могут применяться совместно. Эти методы базируются на определенном наборе микросхем и особой аппаратной архитектуре системы — их поддержку невозможно обеспечить простым обновлением ПО.

В первом методе каждый бит данных модуля памяти размещается в отдельном «слове ECC». (Слово ECC — это набор разрядов данных и контрольных разрядов, в котором обнаружение и исправление ошибок обеспечивается алгоритмом ECC.) Допустим, что разрядность системы памяти составляет 32 байт (или 256 разрядов). Биты ECC добавляются так, чтобы общая ширина блока (и контрольные, и биты данных) составляла 288 разрядов. Четыре слова ECC, каждое из которых состоит из 64 разрядов данных и 8 контрольных разрядов ECC, поддерживают механизм SEC/DED. Эти четыре слова ECC распределяются по DRAM-модулям. Например, если DIMM содержит модули х4 DRAM, четыре бита каждого устройства распределяются по разным словам ECC (рис. 2). Сбой всех четырех битов — это всего лишь четыре единичные ошибки в четырех словах ECC, и они устраняются автоматически. В этом примере механизм Chipkill поддерживается только на DIMM-модулях, состоящих из микросхем х4 DRAM.

Fig.2 Рис. 2. Один из механизмов Chipkill.


Второй метод заключается в предоставлении механизму ECC большего числа разрядов для хранения контрольных кодов, чтобы обеспечить исправление не одного, а нескольких разрядов. При этом используются соответствующие математические алгоритмы устранения многоразрядных ошибок при определенном количестве контрольных битов ECC и битов данных. Например, 144-разрядное слово ECC, состоящее из 128 разрядов данных и 16 битов ECC, позволяет исправлять ошибки, охватывающие до 4 разрядов данных. (Для исправления сбоя четырех бит необходимо, чтобы они были смежными, а не располагались случайно.) Соотношение разрядов ECC и разрядов данных такое же, как и в предыдущем примере (16/128 и 8/64), однако более длинное слово ECC позволяет применить более эффективный алгоритм обнаружения и исправления ошибок.

Совместное использование этих двух методов обеспечивает коррекцию по механизму Chipkill на DIMM-модулях с микросхемами х8 DRAM. Два 144-разрядных слова ECC распределяются так, чтобы на каждом DRAM в первом и втором словах ECC исправлялись по 4 разряда. Этот метод обеспечивает поддержку механизма Chipkill при использовании DIMM-модулей, состоящих как из микросхем х4 DRAM, так и из х8 DRAM.

На серверах Netfinity (на смену которым пришли машины eServer xSeries) инженеры IBM решили эту проблему, разместив избыточный массив недорогих микросхем DRAM (Redundant Array of Inexpensive DRAM, RAID) непосредственно на DIMM-модулях. При каждом доступе к памяти RAID-микросхема вычисляет контрольный код ECC для всего набора микросхем и сохраняет результат в резервной памяти на защищаемом DIMM-модуле. В случае отказа одной микросхемы DIMM-модуля сохраненная на RAID-массиве информация применяется для восстановления потерянных данных, обеспечивая бесперебойную работу всего сервера Netfinity. Такая RAID-технология напоминает RAID-механизмы, применяемые для защиты данных в дисковых массивах, и называется Chipkill DRAM.

Специалисты компании IBM разработали заказную специализированную микросхему для Chipkill, которая называется ECC ASIC (Application-Specific Integrated Circuit) и выполняет исправление ошибок без замедления доступа к высокопроизводительной EDO-памяти со временем доступа 50 нс. Таким образом, при установке DIMM-модулей IBM Chipkill на серверы Netfinity, оборудованные процессором Intel Xeon, модификация плат памяти не нужна, а новые модули не вызывают снижения производительности

Результаты исследований показали, что на серверах, оборудованных 32 Мбайт памяти с проверкой четности, частота сбоев памяти за 3 года составила 7 отказов на 100 серверов. На серверах, оборудованных 1 Гбайт памяти с поддержкой ECC, частота сбоев за 3 года равна 9 отказам на 100 серверов. А вот на серверах, оборудованных 4 Гбайт памяти с поддержкой Chipkill, за 3 года число сбоев не превысило 6 отказов на 10 тыс. серверов. Кроме того, оказалось, что частота отказов по причине ошибок памяти на серверах с 1 Гбайт ECC-памяти выше, чем на серверах с 32 Мбайт памяти с проверкой четности. Причина здесь в том, что при том огромном числе DRAM-микросхем емкостью 64 Мбит, которое нужно, чтобы составить 1 Гбайт памяти, вероятность отказа отдельных микросхем существенно выше, чем вероятность возникновения единичных ошибок четности в 32 Мбайт памяти с проверкой четности. Технология IBM Chipkill Memory позволила снизить число отказов серверов Netfinity по причине сбоев подсистемы памяти до невероятно низкого уровня.

Обнаружение и оповещение

Поскольку основная задача механизма Chipkill — исправление ошибок памяти, в нем применяются такие же способы обнаружения и оповещения, что и в ECC. Обнаружение и оповещение Chipkill никак не сказывается на производительности оборудования или ПО — издержки те же, что и для стандартных механизмов ECC. Вкратце остановимся на том, как может выполняться обнаружение постоянных и случайных ошибок и оповещение о них в серверных архитектурах с применением обоих механизмов — ECC и Chipkill.

Обнаружение и исправление ошибок памяти выполняется в системном наборе микросхем. Код исправления ошибок (ECC) генерируется при записи и проверяется при чтении во всех системных операциях с памятью «прозрачно» для прикладных программ. Обнаруженная ошибка автоматически исправляется до передачи данных получателю. При этом событие ошибки регистрируется оборудованием, а системная BIOS уведомляется об исправлении ошибки и о месте, где она произошла. Набор микросхем также ведет учет исправленных ошибок, что позволяет BIOS выявлять DIMM-модули, в которых ошибки возникают и исправляются постоянно. Получив уведомление, система BIOS опрашивает регистры набора микросхем, чтобы определить, где произошла ошибка памяти (порядок такого опроса сильно зависит от конструкции конкретной системы, поэтому он и выполняется на уровне BIOS). Обнаружив модуль DIMM, вызвавший ошибку, BIOS регистрирует эту информацию в системном журнале, который является, например, частью встроенной системы управления сервером (Embedded Server Management). DIMM-модули легко заменить в процессе эксплуатации, для них требуется лишь предсказательное оповещение об ошибках и замене, поэтому нет необходимости локализовать ошибки с точностью до отдельной микросхемы на плате DIMM-модуля. Получая за сравнительно короткое время повторяющиеся сообщения об исправленных ошибках от одного и того же DIMM-модуля, BIOS отключает соответствующий механизм оповещения и регистрирует этот факт в журнале системы управления сервером. Это избавляет систему от дополнительной нагрузки, обусловленной обработкой всех ошибок памяти, поскольку постоянная ошибка DRAM иногда генерирует миллионы сообщений об исправлениях в минуту.

Программное обеспечение управления системой, поставляемое в составе многих серверов, анализирует системный журнал при каждом внесении записи системой BIOS. Ошибки единичных разрядов инициируют уведомления одного из трех возможных уровней: warning («предупреждение»), critical («критическая»), nonrecoverable («неустранимая»). По-настоящему случайная ошибка вряд ли инициирует уведомление в стеке программы управления системой. Однако в случае постоянных неполадок в работе DIMM-модуля инициируется уведомление программе управления системой, после чего та назначает службе технической поддержки задание на замену неисправного DIMM-модуля. Постоянная ошибка, вызвавшая отключение механизма регистрации исправлений, в любом случае инициирует уведомление. Постоянные ошибки в одном разряде или ошибки, устраняемые средствами Chipkill, не вызывают отказа системы; тем не менее они увеличивают вероятность того, что очередная случайная ошибка приведет к критическому, неустранимому сбою. Поэтому администраторы системы должны внимательно следить за уведомлениями о дефектных DIMM-модулях и своевременно назначать службе технической поддержки задания на их замену.

С Марса на Землю

Интересно, что, по некоторым данным, изначально технология Chipkill разрабатывалась IBM для марсианского вездехода Rover (рис. 3), где сбои памяти были, мягко говоря, нежелательны. Агентство NASA применило-таки эту технологию в исследовательском зонде Pathfinder. Надо отдать должное специалистам NASA, которые осознали важность такого параметра, как надежность памяти. Им, видимо, совсем не хотелось потратить миллиарды долларов на отправку Pathfinder на Марс и только потом обнаружить, что все мероприятие терпит крах по причине отказа одной микросхемы памяти.

Fig.3 Рис. 3. Модуль памяти для марсианского вездехода.


Технология Chipkill поддерживается в новом универсальном наборе микросхем IBM Summit, который подходит как для 64-разрядных микропроцессоров семейства Itanium, так и для 32-разрядных Xeon. Каждый чипсет будет поддерживать до четырех процессоров, позволяя им разделять такие ресурсы, как шины ввода-вывода и шины памяти. Четыре набора могут связываться воедино, что даст серверам на базе Summit возможность поддерживать до 16 полностью автономных микропроцессоров. Например, в четырехпроцессорном сервере можно будет выделить три кристалла под Windows NT, а один — под Linux, а если все процессоры работают в одной среде, можно будет проводить их «горячую» замену.

В заключение следует отметить, что, по мнению ряда экспертов, те же рыночные силы, которые ранее вынудили перейти от проверки четности к технологии ECC на Intel-серверах с 32 Мбайт памяти, в ближайшее время заставят в обязательном порядке устанавливать память Chipkill на новых серверах Intel-архитектуры, оборудованных многими гигабайтами памяти и 64-разрядными микропроцессорами семейства Itanium. В исторической перспективе это и неудивительно, ведь именно такое магистральное направление намечалось технологиями IBM для больших систем. Если допустить, что мэйнфреймы были предшественниками распределенной, ориентированной на сеть модели клиент-серверных вычислений, то представляется очевидным, что присущая мэйнфреймам надежность и отказоустойчивость скоро потребуется и в серверах, оборудованных микропроцессорами Intel.

Новый адрес страницы: Технология Chipkill для оперативной памяти

Память

Информация о материале
Категория: Память
Опубликовано: 09.08.2016, 08:24
Автор: ServersTech.ru


В Сети часто можно увидеть на тематических форумах вопросы, касающиеся памяти с коррекцией ошибок, а именно – ее влияние на производительность системы. Сегодняшнее тестирование ответит на этот вопрос.

Перед прочтением данного материала рекомендуем ознакомится с материалами по микроархитектуре Core и платформе LGA1151.

Теория

Перед тестированием расскажем об ошибках памяти.
Ошибки, возникающие в памяти, можно разделить на два типа – аппаратные и случайные. Причиной появления первых являются дефектные микросхемы DRAM. Вторые же возникают по причине воздействия электромагнитных помех, излучения, альфа- и элементарных частиц и т.д. Соответственно, исправить аппаратные ошибки можно только путем замены микросхем DRAM, а случайные – с помощью специальных технологий, например, ECC (Error-Correcting Code). Коррекция ошибок ECC в своем арсенале имеет два метода: SEC (Single Error Correction) и DED (Double Error Detection). Первый исправляет однобитовые ошибки в 64-битном слове, а второй детектирует двухбитовые ошибки.
Аппаратная реализация ECC заключается в размещении дополнительных чипов памяти, которые необходимы для записи 8-битных контрольных сумм. Таким образом, модуль памяти с коррекцией ошибок при одностороннем дизайне будет иметь 9 чипов памяти вместо 8 (как у стандартного модуля), а при двустороннем — 18 вместо 16. Вместе с этим увеличивается и ширина модуля с 64 до 72 бит.
При считывании данных из памяти происходит повторный подсчет контрольной суммы, которая сравнивается с исходной. Если ошибка в одном бите — она исправляется, если в двух — детектируется.

Практика

В теории всё хорошо – память с коррекцией ошибок повышает надежность системы, что очень важно при построении сервера или рабочей станции. А на практике существует еще и финансовая сторона данного вопроса. Если серверу память с коррекцией ошибок обязательна, то рабочая станция вполне может обойтись без ECC (многие готовые рабочие станции разных производителей оснащаются обычной ОЗУ). Насколько же дороже память с коррекцией ошибок?
Типичный модуль DDR4-2133 с объемом 8 ГБ стоит порядка 39 долларов, а модуль с ECC – 48 долларов (на момент написания материала). Разница в стоимости составляет около 23%, что весьма значительно на первый взгляд. Но если посмотреть на общую стоимость рабочей станции, то эта разница не превысит и 5% от нее. Таким образом, приобретение памяти с ECC лишь незначительно увеличивает стоимость рабочей станции. Остается лишь вопрос – а как влияет память с ECC на производительность процессора.
Для того, чтобы ответить на этот вопрос редакция ServersTech.ru взяла для тестирования модули памяти Samsung DDR4-2133 ECC и Kingston DDR4-2133 с одинаковыми таймингами 15-15-15-36 и объемом 8 ГБ.

samsung mem 1

samsung mem 2

На модулях памяти Samsung M391A1G43DB0-CPB с коррекцией ошибок распаяно по 9 чипов с каждой стороны.

kingston mem 1

kingston mem 2

В то время как на обычных модулях памяти Kingston KVR21N15D8/8 распаяно по 8 чипов с каждой стороны.

Тестовый стенд: Intel Xeon E3-1275v5, Supermicro X11SAE-F, Samsung DDR4-2133 ECC 8GB, Kingston DDR4-2133 non-ECC 8GB

Детализация

— Процессор: Xeon E3-1275v5 (HT on; TB off);
— Материнская плата: Supermicro X11SAE-F;
— Оперативная память: 2x Samsung DDR4-2133 ECC 8GB (M391A1G43DB0-CPB), 2x Kingston DDR4-2133 non-ECC 8GB (KVR21N15D8/8);
— ОС: Windows Server 2012R2.

Методика тестирования

— 3DMark06 1.21;
— 7zip 15.14;
— AIDA64 5.60;
— Cinebench R15;
— Fritz 4.2;
— Geekbench 3.4.1;
— LuxMark v3.1;
— MaxxMEMI 1.99;
— PassMark v8;
— RealBench v2.43;
— SiSoftware Sandra 2016;
— SVPmark v3.0.3b;
— TrueCrypt 7.1a;
— WinRAR 5.30;
— wPrime 2.10;
— x264 v5.0.1;
— x265 v0.1.4;
— Kraken;
— Octane;
— Octane 2.0;
— Peacekeeper;
— SunSpider;
— WebXPRT.

AIDA64

ecc aida 1

В тесте памяти результаты на удивление одинаковые (в пределах погрешности теста).

ecc aida 2

Для целочисленной арифметики не имеет значения используемый тип памяти – коррекция ошибок не оказывает существенного влияния на конечный результат.

ecc aida 3

Арифметика с плавающей точкой также оказалась невосприимчивой к типу памяти.

ecc aida 7

Даже наиболее требовательная к скорости памяти интегрированная графика не показала значительной разницы между ECC и non-ECC памятью.

SiSoftware Sandra

ecc sandra 1

Данный тестовый пакет также не заметил смену типа памяти, показав практически одинаковые результаты для обоих участников.

ecc sandra 2

Абстрагированный от «железа» фрейморк также не заметил разницы между тестируемыми.

ecc sandra 3

Требовательная к скорости памяти интегрированная графическая карта не видит разницу между ECC и non-ECC.

ecc sandra 4

На скорость рендеринга тип памяти также не влияет.

ecc sandra 6

В тесте транзакционной памяти в области низкой вероятности изменений ECC-память всё же проигрывает обычной, показывая небольшой провал.

MaxxMEMI

ecc maxxmemi 1

Даже в непосредственном тесте памяти результаты оказались одинаковыми – как по пропускной способности, так и по латентности.

ecc maxxmemi 2

Cinebench R15

ecc cb 1

В процессорном подтесте результаты обоих типов памяти оказались максимально схожими.

ecc cb 2

Да и на производительности интегрированного графического ядра смена типа памяти не сказалась.

Fritz

ecc fritz

Данный бенчмарк также не показал существенной разницы между разными типами памяти.

LuxMark

ecc luxmark

Данный бенчмарк позволяет производить расчеты как на процессоре, так и на видеокарте, но ни на то, ни на другое существенного влияния использование памяти с коррекцией ошибок не оказывает.

RealBench

ecc realbench

Пожалуй, лишь в подтесте Image Editing присутствует более-менее существенная разница – 2% в пользу обычной памяти.

SVPmark

ecc svpmark

Данный бенчмарк также не заметил смену типа памяти.

Geekbench

ecc geekbench 1

В общем зачете ЕСС-память сумела вырваться вперед, но учитывая определенную погрешность теста, можно смело заключить, что между ECC и non-ECC разницы нет.

ecc geekbench 2

Многопоточный режим картину не меняет – разницы в производительности нет.

PassMark

ecc passmark

Существенной разницы в производительности между различными типами памяти нет (следует отметить, что результат в 2D зависит целиком от работоспособности драйвера, который на момент тестирования не хотел стабильно работать).

3DMark06

ecc 3dmark

Смотря на результаты, можно заключить, что коррекция ошибок не сказывается на производительности графического ядра, которое в большей мере, чем процессор, зависит от скорости памяти.

wPrime

ecc wprime 1

Даже весьма требовательный к скорости памяти wPrime не заметил разницу между обычной и памятью с коррекцией ошибок.

ecc wprime 2

Многопоточный режим кардинально не меняет картину – результаты максимально схожи.

Encoder

ecc sandra 7

На скорость работы с видео смена типа памяти также не оказывает никакого влияния.

TrueCrypt

ecc truecrypt

Скорость шифрования также не зависит от типа памяти.

7zip

ecc 7z 1

В однопоточном режиме 7zip «заметил» разницу между разными типами памяти, отдав предпочтение обычной ОЗУ, показавшей на 16% большую скорость сжатия.

ecc 7z 2

В многопоточном режиме 7zip не почувствовал особой разницы между ECC и non-ECC – разница в результатах в пределах +/- 1%.

WinRAR

ecc winrar

В отличие от 7zip, WinRAR остается безразличным к типу памяти.

Browser benchmark

Все бенчмарки проводились в Firefox 45.

ecc browser

Браузерные тесты также оказались безразличны к типу памяти.

Заключение

Подводя итоги, можно сказать, что коррекция ошибок никак не сказывается на производительности как процессора, так и интегрированной графической карты — по крайней мере это применимо к процессорам Интел. Но рассматривая данный вопрос, необходимо учитывать трехуровневый кэш, его высокую скорость и достаточно большой объем — всё это снижает зависимость от скорости ОЗУ, уравнивая ECC-память с обычной.
Таким образом, приобретение ECC-памяти вместо обычной не скажется на производительности процессора, а разница в их стоимости не превысит и 5% от общей стоимости сервера или рабочей станции.

mem

Добрый день.
Имеется сервер etegro ETRS230G4 c двумя процессорами Xeon(R) CPU E5-2670 и 8×8 Гб DDR3 FB-DIMM памяти.

Память установена в слоты :
DIMM A0
DIMM A1
DIMM B0
DIMM B1
DIMM G0
DIMM G1
DIMM H0
DIMM H1

Тестировали память с помощью memtest86+ 5.01 , ошибок не было.
После месяца эксплуатации появились записи в BMC и в лога системы ( centos 6.7 x64 )

>CPU 1: Machine Check Exception: 0 Bank 9: 8c00004f000800c1
>TSC 0 ADDR 3c3a9a000 MISC 9085c001c001e8c PROCESSOR 0:206d7 TIME 1466067483 SOCKET 0 APIC 2
>EDAC MC0: CE row 1, channel 0, label «CPU_SrcID#0_Channel#0_DIMM#1»: 3 Unknown error(s): memory scrubbing on FATAL area OVERFLOW: cpu=0 Err=0008:00c1 (ch=1), addr = 0x3c3a9b000 => socket=0, Channel=0(mask=1), rank=5
>EDAC MC0: CE row 1, channel 0, label «CPU_SrcID#0_Channel#0_DIMM#1»: 3 Unknown error(s): memory scrubbing on FATAL area OVERFLOW: cpu=2 Err=0008:00c1 (ch=1), addr = 0x3c3a9b000 => socket=0, Channel=0(mask=1), rank=5
>EDAC MC0: CE row 1, channel 0, label «CPU_SrcID#0_Channel#0_DIMM#1»: 1 Unknown error(s): memory scrubbing on FATAL area : cpu=2 Err=0008:00c1 (ch=1), addr = 0x3c3a9b000 => socket=0, Channel=0(mask=1), rank=5
>EDAC MC0: CE row 1, channel 0, label «CPU_SrcID#0_Channel#0_DIMM#1»: 1 Unknown error(s): memory scrubbing on FATAL area : cpu=2 Err=0008:00c1 (ch=1), addr = 0x3c3a9b000 => socket=0, Channel=0(mask=1), rank=5

Судя по логам ошибки продолжались около 3х часов.

Оставили на ночь memtest86+ 5.01 ошибок опять нету.

Как правилось организовать стресс тест памяти ? Я как понимаю memtest86+ 5.01 не определяет ошибок ECC ?

Содержание

  1. Тест ОЗУ (RAM): проверка оперативной памяти на ошибки
  2. Проверка ОЗУ (RAM) на ошибки
  3. Средство диагностики памяти Windows
  4. Тестирование оперативной памяти в Memtest 86+
  5. Memtest 86+
  6. Про версии программы Memtest 86+ (V5.01):
  7. Создание загрузочной флешки с Memtest86+
  8. Загрузка с флешки и запуск теста в Memtest 86+
  9. Что делать, если были найдены ошибки
  10. Проверка памяти с помощью Windows Memory Diagnostic
  11. Что такое Memory Diagnostic Tool и как ей пользоваться?
  12. Используем средство проверки памяти Windows для тестирования RAM
  13. Как запустить средство проверки памяти в Windows 10 и предыдущих версиях системы
  14. Использование средства проверки памяти Windows и просмотр результатов
  15. Что делать, если были обнаружены проблемы оборудования в средстве диагностики памяти
  16. Видео инструкция

Тест ОЗУ (RAM): проверка оперативной памяти на ошибки

Доброго времени суток.

Довольно часто при нестабильном поведении компьютера/ноутбука (например, стали появляться ошибки, зависания, вылетает синий экран, есть искажения изображения и пр.) , требуется провести проверку оперативной памяти ОЗУ (RAM).

В ходе этого тестирования можно выяснить, все ли в порядке с памятью, нет ли ошибок, не требуется ли замена плашки (кстати, протестировать ОЗУ может быть не лишним и при покупке новой планки) .

Вообще, привести диагностику памяти можно разными путями:

  1. использовать средства диагностики Windows (если у вас ОС Windows 7, 8.1, 10);
  2. либо использовать сторонний софт (на мой взгляд одна из лучших утилит для такого теста — Memtest 86+) .

В этой статье рассмотрю оба эти варианта (вообще, конечно, второй вариант более предпочтителен!).

Проверка ОЗУ (RAM) на ошибки

Средство диагностики памяти Windows

Вообще, лично на мой взгляд, встроенный софт в Windows, как правило, уступает софту стороннего разработчика. Поэтому, все же, если у вас есть свободная флешка (CD/DVD диск), я рекомендую воспользоваться тестом в программе Memtest 86+ (см. во второй части статьи) .

И тем не менее, как запустить проверку планок ОЗУ в Windows (актуально для Windows 7, 8, 10) :

  1. нажать сочетание кнопок Win+R ;
  2. в появившемся окне «Выполнить» ввести команду mdsched и нажать Enter (как на скрине ниже) .

mdsched — команда для проверки ОЗУ (Win+R)

Далее должно появиться окно, в котором вам предложат на выбор два варианта проверки:

  1. выполнить перезагрузку и проверку прямо сейчас (т.е. приступить к проверке незамедлительно) ;
  2. выполнить проверку при следующем включении ПК (именно это и рекомендую выбрать, чтобы без спешки сохранить все документы, закрыть программы и спокойно отправить ПК на перезагрузку).

Средство проверки памяти Windows

Если с диагностикой все «OK» — увидите сообщение, что тест памяти был успешно запланирован.

Тест памяти запланирован

После перезагрузки компьютера/ноутбука увидите окно, как на фото ниже. Будет выполнено 2 прохода, в нижней части окна показывается состояние операции. Если с вашей памятью все хорошо — то состояние будет в статусе «Неполадки пока не обнаружены».

Средство диагностики памяти Windows

Если будут найдены неполадки

Рекомендую прогнать еще раз утилитой Memtest 86+. Если ошибки подтвердятся и в этой утилите — то см. конец этой статьи, там привел несколько советов.

Тестирование оперативной памяти в Memtest 86+

Memtest 86+

Memtest 86+ — одна из лучших утилит, предназначенных для тестирования оперативной памяти. Утилита может запускаться с помощью собственного загрузчика, поэтому для нее операционная система, в принципе, не нужна.

Программа поддерживает современные многоядерные процессоры, большинство чипсетов материнских плат. Memtest 86+ доступна для скачивания на официальном сайте (ссылка выше), в виде нескольких версий. О них пару слов ниже.

Про версии программы Memtest 86+ (V5.01):

  1. Download — Pre-Compiled Bootable ISO (.gz) — программа распространяется в образе ISO. Такой образ можно записать хоть на флешку, хоть на обычный CD/DVD диск (правда, могут понадобиться доп. утилиты — например, UltraISO) . В общем, универсальный вариант;
  2. Download — Pre-Compiled Bootable ISO (.zip) — тоже самое, только формат архива другой;
  3. Download — Pre-Compiled Bootable Binary (.gz) — файл в формате bin (это тоже образ диска, похож на ISO);
  4. Download — Pre-Compiled Bootable Binary (.zip) — тоже самое;
  5. Download — Auto-installer for USB Key (Win 9x/2k/xp/7) *NEW!* — самый востребованный вариант (на мой взгляд). Позволяет автоматически создать загрузочную флешку с Memtest 86+ за несколько шагов. Программа работает во всех версиях Windows: XP, 7, 8, 10;
  6. Download — Pre-Compiled package for Floppy (DOS — Win) — создание загрузочной дискеты (на мой взгляд, сегодня практически не актуально).

Я выбрал 5-й вариант (Download — Auto-installer for USB Key (Win 9x/2k/xp/7) *NEW!*), именно при помощи нее и покажу как создать флешку.

Создание загрузочной флешки с Memtest86+

Скачиваете архив, разархивируете его и запускаете файл программы (выбор версии — приведен выше) . Далее нужно вставить флешку в USB-порт и:

  1. в первом окне программа попросит указать букву диска флешки (важно! Все данные на ней, перед записью Memtest 86+, будут удалены) ;
  2. далее нужно поставить галочку напротив «We will format G:as Fat32» и нажать кнопку «Create» ;
  3. дождаться сообщения «Installation Done, Your Drive should be ready to boot» (значит что носитель записан) ;
  4. кстати, если зайти в «Этот компьютер» — вы увидите, что название вашей флешки стало «MULTIBOOT» .

Создание загрузочной флешки в Memtest 86+

Загрузка с флешки и запуск теста в Memtest 86+

Чтобы загрузиться с созданной шагом ранее флешки, необходимо соответствующим образом настроить BIOS (либо воспользоваться кнопкой для вызова Boot Menu) . Тема эта достаточно обширна, поэтому чуть ниже приведу ссылки на свои статьи.

Я воспользовался вызовом Boot Menu, указал с чего загружаться (USB-флешки) и нажал Enter (скрин ниже).

Загрузка с USB-флешки

Далее, если ваша флешка правильно записана, утилита Memtest 86+ автоматически запуститься и начнет тестировать оперативную память. От вас ничего не требуется нажимать. Красной стрелкой на фото ниже показан ход тестирования (сколько процентов проверено).

Тестирование в Memtest 86+ // запускается автоматически

Примечание! На всякий случай приведу клавиши управления (хотя они в большинстве случаев не нужны).

Esc – закрыть программу и перезагрузить ПК;
C – задание параметров в ручном режиме (для опытных пользователей);
F1 — Enhanced Fail Safe Mode (расширенная Fail Safe Mode).
F2 — Experimental SMT support up to 32 cores (экспериментальная SMT поддержка до 32 ядер).
При запуске производится анализ компонентов компьютера, затем начинается тестирование оперативной памяти.
Если тест не запускается в авто-режиме — запустите его при помои кнопок F1, либо F2.

Вообще, рекомендую оставить вот так тестировать ПК на несколько часов, чтобы утилита прогнала память несколько раз. Если с памятью все в порядке — вы должны увидеть внизу окна сообщение «Pass complete, no errors, press Esc to exit» (как на фото ниже).

Memtest 86+ записывает в каждый блок памяти информацию, а затем считывает её и проверяет на ошибки. Программа тестирует оперативную память циклически, т.е. у неё по умолчанию есть 11 тестов (включая нулевой), которые она гоняет по кругу неограниченное число раз (пока вы не остановите ее, нажав клавишу Esc) .

Все хорошо с памятью // прошла тест

Если же в процессе тестирования будут найдены ошибки — вы увидите красные строки (это в любом случае не хорошо (как минимум) ).

С памятью есть проблемы.

Что делать, если были найдены ошибки

Довольно популярный вопрос, наряду с вопросами по тестированию памяти.

Для начала необходимо открыть системный блок и почистить его от пыли. Вынуть планки памяти из слотов и продуть сами слоты (удобно это делать с помощью пылесоса с реверсным режимом, либо баллончика сжатого воздуха — такие продаются в компьютерных магазинах) .

Далее проверьте сами планки: нет ли на них сколов, царапин, чистые ли они. Если есть признаки механического повреждения, то наверняка потребуется замена памяти на новую.

Так же обратите внимание на контакты . Дело в том, что через некоторое время они могут окислиться, и при вставке в слот не полностью (не всегда) давать контакт. В результате, как только контакт «потерялся» — у вас завис компьютер. Рекомендую их почистить в любом случае, для этого подойдет обычная резинка/стёрка (школьная) . Оставшиеся катышки — можно либо сдуть, либо смахнуть мягкой кисточкой.

Чистка контактов памяти резинкой и кисточкой

Примечание. Процедуру нужно проводить крайне аккуратно, на чистой, сухой, ровной поверхности. Резинка лучше та, у которой две стороны: одна синяя, другая розовая. Тереть рекомендуется синей. В некоторых случаях, желтые контакты меняют цвет на более светлый.

После чистки памяти, вставьте ее вновь в слот и включите ПК (кстати, попробуйте вставить память в другие слоты, или поменять планки местами, если у вас все слоты заняты).

Далее проведите тестирование еще раз. В некоторых случаях, такая простая процедура, позволяет избавиться от ошибок, связанных с памятью, компьютер перестает зависать, перезагружаться и выдавать синий экран (тем самым, экономя ваши средства).

Если будут вновь найдены ошибки — можно попробовать сдать память в ремонт (но лично я не рекомендую). Если нет гарантийного обслуживания — лучше замените на новую (дело в том, что цена ремонта ОЗУ — во многих случаях, стоит практически столько же, сколько новая планка).

На этом у меня пока всё. Дополнения приветствуются.

Удачи и хороших тестов!

Статья откорректирована: 25.02.2019

Проверка памяти с помощью Windows Memory Diagnostic

В прошлой статье я говорил о том, что может служить причиной появления различных ошибок в системе и экранов смерти. Так, мы разобрали, что для выявления этих ошибок можно воспользоваться программами Memtest86, Memtest86+ и программа от Microsoft – Windows Memory Diagnostic. Сегодня я опишу, как пользоваться Memory Diagnostic.

Итак, одним из уязвимых мест в ПК является оперативная память. Но, как показывается практика, иногда планки памяти выходят из строя или же повреждаются, из-за этого могут возникать ошибки. Чтобы убедится в том, что виновата все-таки оперативная память, воспользуемся специальной утилитой.

Утилита Memory Diagnostic Tool – это программа, которая выполняет тесты оперативной памяти под высокой нагрузкой. Она является компонентов версий Windows и способна выявить различные ошибки чипа памяти.

Теперь перейдем к делу. Эта утилита находится на системном диске, поэтому, мы сможем ее запустить из диалогового окна «Выполнить». Для этого нажимаем Win+R и вводим фразу mdsched.exe.

Если вы пользуетесь Windows 8.1, то вы можете в поиске ввести «w m d» и тогда, в результатах поиска вы увидите утилиту.

Нажали? Перед вами должно появится окно «Средство проверки памяти Windows», где видно два варианта проверки. Первый позволяет сразу же перезагрузить компьютер и начнет диагностику. Второй вариант будет работать при следующем включении компьютера.

Как только выбрали первый вариант, то на экране вы увидите, как идет процесс диагностики памяти.

Во время проверки нажмите на клавишу F1, таким образом, откроется выбор типов диагностики: Basic, Standard, Extended (Простой, стандартный, расширенный). Любой из этих пунктов влияет на то, сколько вы будете ждать, пока проверка будет завершена. Метод Extended, конечно, будет эффективнее, но и ждать придется не мало.

Как только диагностика памяти завершится, компьютер перезагрузится. Результаты вы можете посмотреть в «Просмотр событий». Чтобы туда попасть можно в строке поиске ввести эту фразу. Переходим в «Журналы Windows», потом «Система», в правой части окна ищем «Диагностика памяти» или «Memory Diagnostic».

Данный анализ должен показать присутствие ошибок в оперативной памяти, если же их не обнаружилось, то стоит искать причину неисправности системы в другом, возможно, что виноват какой-то другой компонент компьютера.

Используем средство проверки памяти Windows для тестирования RAM

Если сбои системы, синие экраны BSoD или иные проблемы при работе Windows 10, 8.1 или Windows 7 наводят вас на мысли о том, что имеются какие-либо проблемы с оперативной памятью компьютера, может иметь смысл выполнить её проверку, а начать можно со встроенного средства диагностики проверки памяти Windows.

В этой инструкции подробно о способах запустить средство проверки памяти средствами Windows, причём даже в тех случаях, когда вход в систему невозможен, а также о возможных вариантах действий в случае, если в результате теста средство диагностики памяти сообщает о том, что были обнаружены проблемы оборудования. На схожую тему: Устранение неполадок Windows 10.

Как запустить средство проверки памяти в Windows 10 и предыдущих версиях системы

В случае, если операционная система запускается, вход в неё и работа возможны, вы можете использовать один из следующих вариантов запуска средства проверки памяти:

  1. Найти нужный пункт в разделе «Средства администрирования Windows» меню «Пуск».
  2. Нажать клавиши Win+R на клавиатуре, ввести mdsched.exe и нажать Enter.
  3. Открыть панель управления, выбрать пункт «Администрирование» и запустить «Средство проверки памяти Windows».
  4. Использовать поиск в панели задач Windows 10, начав вводить «Средство проверки памяти». Или встроенные средства поиска в предыдущих версиях ОС.
  5. Вручную запустить файл C:WindowsSystem32MdSched.exe

Если же ситуация осложняется тем, что Windows не запускается, вход в неё невозможен, либо сразу после него происходят сбои, можно использовать следующие способы запуска средства диагностики оперативной памяти:

  1. Загрузить компьютер или ноутбук с загрузочной флешки с Windows 10 или другой версией Windows, можно и с загрузочного диска. На экране программы установки нажать клавиши Shift+F10 (Shift+Fn+F10 на некоторых ноутбуках), ввести mdsexe в открывшейся командной строке и нажать Enter. После выбора в утилите проверки пункта «Выполнить перезагрузку и проверку», загружайте компьютер не с флешки, а с обычного загрузочного HDD или SSD.
  2. Средство проверки памяти можно запустить из среды восстановления Windows 10 — нажав кнопку «Дополнительные параметры» на синем экране с ошибкой или, находясь на экране блокировки Windows 10 (с выбором имени пользователя) нажать по изображенной справа внизу кнопке «Питания», а затем, удерживая Shift, нажать «Перезагрузка». В среде восстановления выбираем «Поиск и устранение неисправностей» — «Дополнительные параметры» — «Командная строка». А в ней, как и в предыдущем случае используем команду mdsched.exe.
  3. Если у вас есть подготовленный диск восстановления Windows, запуск можно осуществить, загрузившись с него.

Использование средства проверки памяти Windows и просмотр результатов

После запуска средства проверки памяти вам будет предложено перезагрузить компьютер, после согласия, процесс будет выглядеть следующим образом:

  1. Начнётся проверка оперативной памяти, которая может занять продолжительное время. Может показаться, что средство диагностики зависло: на всякий случай подождите в такой ситуации 5-10 минут. Если же действительно произошло зависание, не исключено что есть проблемы с оборудованием, вероятно — с оперативной памятью, но не обязательно.
  2. Если в ходе проверки нажать клавишу F1 (или Fn+F1, если F1 не срабатывает), вы попадёте в настройки средства диагностики памяти Windows. Здесь можно выбрать набор тестов (по умолчанию — обычный), использование кэша, и число проходов. Переключение между разделами настроек выполняется клавишей Tab, изменение параметров — стрелками и вводом цифр (для числа проходов), применение параметров — клавишей F10. После изменения настроек тест перезапускается.
  3. В ходе проверки вы будете видеть информацию вида «Неполадки пока не обнаружены» или «Были обнаружены проблемы оборудования».

После завершения проверки компьютер будет автоматически перезагружен. Дальнейшие шаги — просмотр результатов.

  • После перезагрузки в случае Windows 10 вы можете увидеть уведомление в области уведомлений, сообщающее о результате проверки памяти. Но оно отображается не всегда.
  • Можно зайти в просмотр событий, для этого нажимаем Win+R, вводим eventvwr.msc и нажимаем Enter. Там открываем раздел «Журналы Windows» — «Система», находим пункты, где в столбце «Источник» указано MemoryDiagnostics-Results и просматриваем результаты.

Учитывайте, что ошибки, «вылеты», синие экраны и зависания не всегда связаны с проблемами оперативной памяти: если средство диагностики показывает, что всё в порядке, есть и иные возможные причины: отключенный файл подкачки, проблемы с HDD или SSD (или с их подключением, например — неисправный кабель), сторонние антивирусы или, наоборот, вредоносные программы, неправильная работа драйверов оборудования.

Что делать, если были обнаружены проблемы оборудования в средстве диагностики памяти

К сожалению, средство диагностики не сообщает о том, какие именно проблемы были обнаружены в ходе проверки, а лишь рекомендует обратиться к производителю оборудования. Что можно сделать:

  1. Отключить любые опции ускорения памяти (изменение частоты, таймингов и другие) при наличии соответствующих опций в БИОС или ПО производителя материнской платы или ноутбука.
  2. Попробовать проверить планки памяти по одной, в других слотах на материнской плате для того, чтобы выяснить, появляются ли проблемы только с одним конкретным модулем памяти или в одном конкретном разъеме.
  3. Использовать другие утилиты для проверки оперативной памяти при необходимости.
  4. Прочитать документацию к материнской плате ПК — возможно, это какая-то несовместимость с памятью с конкретными характеристиками (если вы недавно добавили новые модули памяти или только что самостоятельно собрали компьютер).
  5. Иногда может помочь обновление БИОС.

Видео инструкция

Если вы разобрались, чем была вызвана именно ваша проблема, буду благодарен комментарию к статье: возможно, для кого-то он окажется полезным.

Возможно, вам также будет интересно:

  • Как проверить систему на ошибки драйверов
  • Как проверить сервер на ошибки в майнкрафт
  • Как проверить систему на ошибки драйвера
  • Как проверить сервер на ошибки windows
  • Как проверить систему на ошибки windows 10 и исправить

  • Понравилась статья? Поделить с друзьями:
    0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии