The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Выпуск архиватора RAR 7.0, opennews (??), 28-Фев-24, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


209. "Выпуск архиватора RAR 7.0"  +/
Сообщение от birdie (ok), 29-Фев-24, 11:28 
У вас ECC память и вы всегда проверяете целостность данных при копировании/чтении/записи, не?

Это делает дай бог 0.0001% людей на земле.

Я открою вам тайну: у меня DDR4 64GB оперативки, и как минимум 1 flipped bit каждые 24 часа.

Нет, это не проблема с памятью - это космические частицы, которые выбивают данные.

И не дай бог этот bit flipped у вас в начале solid данных - тогда весь архив можно выбрасывать.

Ответить | Правка | Наверх | Cообщить модератору

210. "Выпуск архиватора RAR 7.0"  +/
Сообщение от Аноним (178), 29-Фев-24, 12:06 
Нет, это просто бракованная память. Поэтому в ddr5 запилили коррекцию ошибок.
Ответить | Правка | Наверх | Cообщить модератору

215. "Выпуск архиватора RAR 7.0"  –1 +/
Сообщение от Аноним (-), 29-Фев-24, 12:33 
> Я открою вам тайну: у меня DDR4 64GB оперативки, и как минимум
> 1 flipped bit каждые 24 часа.

Повод выкинуть нахрен эту глюкоту пока файлуха не грохнулась или что там еще.

> Нет, это не проблема с памятью - это космические частицы, которые выбивают данные.

Каждые 24 часа? Не, это - не космические частицы. Хотя кого-то возможно и угораздило жить в поясе Ван Аллена, но вот это - маловероятно. Обычное сыпучее железо как оно есть. Хотя конечно если пару стержней из реактора спереть, то и нормальное так будет. Но это какой уровень радиации должен быть чтоб оно мизерные кристаллики так подбивало? И сколько тогда влетает в что-то размером с человеческую тушку?!

> И не дай бог этот bit flipped у вас в начале solid
> данных - тогда весь архив можно выбрасывать.

Ну что, глупый потребитель, получил себе дофига крутого железа занедорого? А оно и оказалось в результате хлипким, глюкавым и одноразовым. Да еще поди кто-нибудь индейцу, вот, отбраковку слил.

Ответить | Правка | К родителю #209 | Наверх | Cообщить модератору

221. "Выпуск архиватора RAR 7.0"  +/
Сообщение от Аноним (221), 29-Фев-24, 12:49 
Об этом писали Google, cloudflare и туча других компаний.

Тупые анонимы с opennet заманали.

Ошибка воспроизводиться на всех машинах с большой памятью, к которым у меня был доступ.

Ноуты, сервера, рабочие станции.

> How often do cosmic rays cause bit flips in computer processors and memory? Originally Answered: How often do cosmic rays cause but flips in computer processors and memory? According to some, error rates may be as high as one error per 4GB per day. This is the reason ECC memory is used in servers and workstations.

https://stackoverflow.com/questions/2580933/cosmic-rays-what...

https://www.johndcook.com/blog/2019/05/20/cosmic-rays-flippi.../

https://blog.mozilla.org/data/2022/04/13/this-week-in-glean-.../

https://static.googleusercontent.com/media/research.google.c...

От общения на российских форумах хочется биться об стену и вырывать волосы.

Настолько ахинею несут, что аж жуть.

Конечные де Биллы на моем сайте.

Ответить | Правка | Наверх | Cообщить модератору

288. "Выпуск архиватора RAR 7.0"  +/
Сообщение от PnD (??), 29-Фев-24, 18:22 
Гм. Ну разве что профиль нагрузки приближается к rawhummer'у…

≈ 2.5 сотен lowend-серверов в датацентрах на широтах примерно от Москвы до за-экватора. Не в горах. И не в (гранитных) скалах.
≈100 ТБ ОЗУ на всех, на сегодня. С ECC, понятно.
По каждому "Hardware Error" в логе заводится инцидент. И не скажу что сильно чаще раза в месяц.
За 8 лет было 1 КЗ в плашке памяти (немедленный останов), несколько раз "складывалось" с некорректируемыми ошибками.
Основная причина ошибок в моей статистике — окисление контактов. Если не доводить до второго перегиба кривой отказов.

Ответить | Правка | Наверх | Cообщить модератору

291. "Выпуск архиватора RAR 7.0"  +/
Сообщение от n00by (ok), 29-Фев-24, 18:34 
Окисление контактов повышает их сопротивление, что снижает ток регенерации. Слишком утрировано, но понятно, почему возникает ошибка.

Каким образом из некоей вероятности получают "... _как_ _минимум_ 1 flipped bit каждые 24 часа" - совершенно не понятно. Допустим, частица пролетела через кристалл. А эта ячейка не используется - вероятность такого события отлична от нуля. По-моему, кто-то путает полную вероятность с непонятно чем.

Ответить | Правка | Наверх | Cообщить модератору

419. "Выпуск архиватора RAR 7.0"  +/
Сообщение от Аноним (-), 04-Мрт-24, 10:08 
> Окисление контактов повышает их сопротивление, что снижает ток регенерации.
> Слишком утрировано, но понятно, почему возникает ошибка.

Поэтому в не совсем мусорных мамках и модулях они - золоченые. А золото, как известно, довольно инертный металл. Но если вы конечно абы что на али купили...

Ответить | Правка | Наверх | Cообщить модератору

422. "Выпуск архиватора RAR 7.0"  +/
Сообщение от n00by (ok), 04-Мрт-24, 15:08 
>> Окисление контактов повышает их сопротивление, что снижает ток регенерации.
>> Слишком утрировано, но понятно, почему возникает ошибка.
> Поэтому в не совсем мусорных мамках и модулях они - золоченые. А
> золото, как известно, довольно инертный металл. Но если вы конечно абы
> что на али купили...

Незолочёных я не видел. Но есть нюанс: зазор, разность потенциалов плюс влага в воздухе. Больше на эту тему я ничего писать не намерен - когда у нас была лаба, где рассчитывали время окисления в зависимости от условий, у меня нашлись какие-то другие дела, а потому пришлось этот вопрос замять с обещанием больше в такое не лезть.

Ответить | Правка | Наверх | Cообщить модератору

289. "Выпуск архиватора RAR 7.0"  +/
Сообщение от n00by (ok), 29-Фев-24, 18:24 
А каким образом воспроизводится ошибка? Любопытно описание эксперимента, что бы повторить опыт.
Ответить | Правка | К родителю #221 | Наверх | Cообщить модератору

301. "Выпуск архиватора RAR 7.0"  +/
Сообщение от Аноним (301), 29-Фев-24, 22:01 
Да просто запустите Memtest86 или Memtest86+ на сутки.

Проблема есть, но биты вышибаются часто те, которые не принадлежат коду программ или они отвечают за часто одноразовый дисковый кэш, поэтому люди не замечают. Данные в оперативки постоянно инвалидируются, а попасть на hot code не так легко, ибо его относительно мало.

Взять то же ядро - допустим у вас 64GB RAM, а ядро занимает дай бог 32MB. Т.е. bit flip в коде ядра может появиться с очень маленькой вероятностью - в 2048 раз реже, чем просто bit flip по всей длине оперативки. Можно возразить, что де бинарник Chrome > 200MB (236 239 024 байт текущая стабильная версия), но там активен далеко не весь код, а дай бог ~10% от него.

Кроме этого, большинство пользователей выключают компы в конце дня, что сводит накопление таких ошибок на нет. Но они есть, и, слава богу, DDR5 теперь обязательно с ECC - только внутри, но это достаточно, чтобы исключить хотя бы ошибки хранения и чтения данных с оперативки. Они по-прежнему могут испортиться в процессе передачи и, наверное, записи в неё.

Ответить | Правка | Наверх | Cообщить модератору

332. "Выпуск архиватора RAR 7.0"  +/
Сообщение от Аноним (27), 01-Мрт-24, 05:50 
> Да просто запустите Memtest86 или Memtest86+ на сутки.

Если у меня за сутки теста выскакивает хотя бы одна ошибка, такая память идёт в возврат (или в мусорку).

Ответить | Правка | Наверх | Cообщить модератору

342. "Выпуск архиватора RAR 7.0"  +/
Сообщение от Аноним (-), 01-Мрт-24, 07:35 
> Да просто запустите Memtest86 или Memtest86+ на сутки.

В этом случае такой хлам надо заменить. Если без ECC - ASAP к тому же, пока ФС и проч не развалилась нахрен и битрот не побил данные.

> Проблема есть, но биты вышибаются часто те, которые не принадлежат коду программ
> или они отвечают за часто одноразовый дисковый кэш,

Хороший способ убить себе ФС и файло так то. Файлухи с чексумами такое УГ еще и хайлайтят, так что у меня парочка мусорных процов и модулей оперативым образовались. Юзать такое гумно, тем более для сеья - может только истинный опеннетский эксперт.

> замечают. Данные в оперативки постоянно инвалидируются, а попасть на hot code
> не так легко, ибо его относительно мало.

Вообще-то все это счастье, включая и вон то - прекрасно детектится допустим ФС с чексумами. Или вот ошибками распаковки архивов. Или сбоем верификации хешей торентов. Порой надо прогрев еще, ибо margins при нагреве уменьшаются.

> Взять то же ядро - допустим у вас 64GB RAM, а ядро
> занимает дай бог 32MB. Т.е. bit flip в коде ядра может
> появиться с очень маленькой вероятностью

Ядро жрет гигабайты под дисковый буфер. И будет очень сильно не круто, когда вам его флипнутый запишут на диск. В лучшем случае в фс отвалится чексумма, если это там было, и вы узнаете что железо у вас мусор. В хучшем вы будете уверены что все ЗБС - но однажды например ФС резко и внезапно крякнет. Так бывает. Я парочке таких неудачников NTFS выковыривал. Все работало до тех пор пока он вообще не перестал маунтиться, унося винду в бсод при попытке это сделать.

> бинарник Chrome > 200MB (236 239 024 байт текущая стабильная версия),
> но там активен далеко не весь код, а дай бог ~10% от него.

Нормальную оперативу с ECC можно еще и scrub'ить чтобы ЗНАТЬ сколько и чего. Но экспертам опеннета про это не рассказывают видимо. И даже вон те доки по ссылке они явно не читали, только загуглили.

> теперь обязательно с ECC - только внутри, но это достаточно, чтобы
> исключить хотя бы ошибки хранения и чтения данных с оперативки.

Ну как бы ошибки передачи это не отменяет - и кроме того - а хост информируется об этом факте? End to end ECC - лучше, ниипет.

Ответить | Правка | К родителю #301 | Наверх | Cообщить модератору

355. "Выпуск архиватора RAR 7.0"  +/
Сообщение от n00by (ok), 01-Мрт-24, 09:11 
> Да просто запустите Memtest86 или Memtest86+ на сутки.

Делал такое, когда баловался разгоном и игрался с таймингами (не для практических целей, а для оценки "запаса прочности" современных моделей). Решается очень просто - повышением напряжения.

Если кто не в курсе, всякая фури-мури супер DDR4 для геймеров с радиаторами и питанием 1.35 Вольта - это разгон на заводе. И какая отбраковка Самсунга идёт в основу - Дядя Ляо умалчивает.

Ответить | Правка | К родителю #301 | Наверх | Cообщить модератору

310. "Выпуск архиватора RAR 7.0"  +/
Сообщение от Аноним (-), 29-Фев-24, 23:55 
> Об этом писали Google, cloudflare и туча других компаний.

Я понимаю что некто читать научился, а думать нет - это серьезный трабл, но все же.

1) у них в отличие от анонимусов с опеннета оператива с ECC, и эвон какой парк машин, так что ТАМ они и правда иногда могут увидеть это! Иногда!
2) failure rate вида бита в день на 64 гига в нормальном виде с безглючной оперативой совершенно точно нет, это откровенный хлам у того нелоха.
3) у меня на твое горе тоже оперативка с ecc, и фс с чексумами (она ЭТО просекает даже без ECC зачастую, я еще и проверял), поэтому можешь рассказать мне со знанием дела - а как оно :)

> Тупые анонимы с opennet заманали.

Да вот сцуки, верят своим глазам а не теоретикам видевшим видите ли какие-то глюкала.

> Ошибка воспроизводиться на всех машинах с большой памятью, к которым у меня был доступ.

Да неужели? Вот прямо с той частотой? Может, там еще и ECC был? Или это как обычно любители китайских зеонов и модулей памяти? Там вообще спасибо если запускается как-то.

> Ноуты, сервера, рабочие станции.

Спасибо кэп!

> stackoverflow.com/questions/

Ну да, спасибо, гуглить научился! А думать - не очень.

> static.googleusercontent.com/media/

Кэп, а ты читал что там вообще написано? На тему failure rate и всего такого?

> От общения на российских форумах хочется биться об стену и вырывать волосы.
> Настолько ахинею несут, что аж жуть.

Вот я тоже удивляюсь: какой-то клоун человеку с дофига RAM с ECC рассказывают как оно работает, это просто приколов пачка :). И таки да, модули где ежедневно бит флипается - дефективные, клюйте!

> Конечные де Биллы на моем сайте.

Анонимус захватил опеннет?!

Ответить | Правка | К родителю #221 | Наверх | Cообщить модератору

380. "Выпуск архиватора RAR 7.0"  +/
Сообщение от Аноним (-), 01-Мрт-24, 17:32 
купил б.у. ксеон у китайцев и хвастается хламом
давно бы уже понял какая планка сбоит и заменил
Ответить | Правка | К родителю #209 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру