The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

В ядро Linux 6.2 войдут улучшения RAID5/6 в Btrfs

18.12.2022 19:42

Для включения в ядро Linux 6.2 предложены улучшения Btrfs, касающиеся исправления проблемы "write hole" в реализации RAID 5/6. Суть проблемы сводится к тому, что если крах случился во время записи, изначально невозможно понять какой блок на каком из устройств RAID записался корректно, а в каком запись не была завершена. В случае попытки восстановления RAID в подобной ситуации может произойти разрушение блоков, соответствующих недозаписанным блокам, поскольку состояние блоков RAID рассинхронизировано. Эта проблема возникает в любых массивах RAID1/5/6, где не принято специальных мер для борьбы с подобным эффектом.

В реализации RAID, наподобие RAID1 в btrfs, эта проблема решается использованием контрольных сумм в обеих копиях, при несовпадении данные просто восстанавливаются из второй копии. Этот подход также срабатывает если какое-то устройство начинает отдавать некорректные данные вместо полного отказа.

Однако в случае RAID5/6 файловая система не хранит контрольные суммы для блоков чётности: в нормальной ситуации корректность блоков проверяется тем фактом, что они все снабжены контрольной суммой, а блок чётности можно воссоздать из данных. Однако в случае частичной записи этот подход в определённых ситуациях может не сработать. В этом случае, при восстановлении массива не исключено, что блоки, попавшие под незавершённую запись, окажутся восстановлены некорректно.

В случае btrfs эта проблема наиболее актуальна, если производимая запись по размеру меньше страйпа. При этом файловая система должна выполнить операцию чтения-модификации-записи (read-modify-write, RMW). Если при этом попадутся блоки с незавершённой записью, в таком случае операция RMW может вызвать разрушения, которые не будут обнаружены, невзирая на контрольные суммы. Разработчики внесли изменения, при которых операция RMW проверяет контрольную сумму блоков до того как производить данную операцию, а при необходимости восстановления данных выполняет и проверку контрольных сумм после записи. К сожалению, в ситуации с записью неполного страйпа (RMW) это ведёт к дополнительным накладным расходам на вычисление контрольных сумм, однако значительно повышает надёжность. Для RAID6 такая логика пока не готова, однако для такого отказа в RAID6 необходимо чтобы запись не удалась на сразу 2 устройствах, что менее вероятно.

Дополнительно можно отметить рекомендации по использованию RAID5/6 от разработчиков, суть которых сводится к тому, что в Btrfs профиль хранения метаданных и данных может отличаться. При этом можно использовать профиль RAID1 (зеркало) или даже RAID1C3 (3 копии) для метаданных, а для данных RAID5 или RAID6. При этом обеспечивается надёжная защита метаданных и отсутствие "write hole" с одной стороны и более эффективное использование места, характерное для RAID5/6, с другой. Это позволяет избегать разрушений в метаданных, а повреждения данных могут быть исправлены.

Также можно отметить, что для SSD в Btrfs в ядре 6.2 будет активировано по умолчанию асинхронное выполнение операции "discard" (пометка освобождённых блоков, которые уже можно не хранить физически). Достоинством этого режима является высокая производительность из-за эффективной группировки операций "discard" в очереди и далее обработки очереди фоновым обработчиком, из-за чего нормальные операции ФС не замедляются, как в случае с синхронным "discard" по мере освобождения блоков, а SSD может принимать более удачные решения. С другой стороны, более не потребуется использовать утилиты типа fstrim, поскольку все доступные блоки будут очищаться в ФС без необходимости дополнительного сканирования и без замедления операций.

 
  1. Главная ссылка к новости (https://www.phoronix.com/news/...)
  2. OpenNews: Для Btrfs представлена асинхронная реализация DISCARD
  3. OpenNews: Новая ФС Bcachefs, сочетающая функциональность btrfs/zfs с производительностью ext4/xfs
  4. OpenNews: Проблема с повреждением разделов Ext4 оказалась в md-raid0
  5. OpenNews: Релиз OpenZFS 2.1 с поддержкой dRAID
  6. OpenNews: Доступен mdadm 4.2, инструментарий для управления программным RAID в Linux
Автор новости: Аноним
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/58352-btrfs
Ключевые слова: btrfs, raid, linux
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (172) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, zog (??), 20:34, 18/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  []     [к модератору]
  • +8 +/
    Скажите, а Btrfs уже готова для продакшена и для десктопа?
     

     ....большая нить свёрнута, показать (77)

  • 1.2, Аноним (2), 20:34, 18/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  [] []     [к модератору]
  • +2 +/
    А на самом деле:
    - fix destructive RMW for raid5 data (raid6 still needs work)

    Т.е. великим трудом поправлен один частный случай да и то для raid5.

    Дополнительно можно отметить рекомендации по использованию RAID5/6 от разработчиков, суть которых сводится к тому, что использовать btrfs не рекомендуется там, где данные имеют ненулевую ценность.

    Поправил, не благодарите.

     
     
  • 2.17, Аноним (15), 21:18, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +3 +/
    Да скорость внедрения фич уровня раст.
     
  • 2.77, Андрей (??), 03:56, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    А чего это благо что хоум на отдельном разделе? Я не использую хоум вообще для хранения чего либо, там у меня только конфиги и всё которые скопированы дополнительно в другое место, поэтому хоум никогда не делаю отдельно, а для помойки использую том примонтированый в медиа
     
  • 2.82, EULA (?), 05:30, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • –1 +/
    Знаю как красиво убить ZFS.
    Надо во время записи на диск вызвать ошибку загрузки любого модуля ядра. Например, BT или WIFI.
     
     
  • 3.122, Аноним (131), 14:21, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +1 +/
    Подобным zfs не убить.
     

  • 1.3, Kuromi (ok), 20:41, 18/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  []     [к модератору]
  • –1 +/
    "Также можно отметить, что для SSD в Btrfs в ядре 6.2 будет активировано по умолчанию асинхронное выполнение операции "discard" (пометка освобождённых блоков, которые уже можно не хранить физически). Достоинством этого режима является высокая производительность из-за эффективной группировки операций "discard" в очереди и далее обработки очереди фоновым обработчиком, из-за чего нормальные операции ФС не замедляются, как в случае с синхронным "discard" по мере освобождения блоков, а SSD может принимать более удачные решения."

    Целиком срисовано с F2FS, там именно так оно и работает.

     
  • 1.5, Аноним (5), 20:45, 18/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  []     [к модератору]
  • +2 +/
    Мне кажется я скорее ZFS в ядре дождусь, чем BTRFS станет продакшн реди
     
     
  • 2.9, Аноним (9), 20:54, 18/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • –1 +/
    Я использую btrfs на системном ссд с данными, всё норм. Мне нужны сжатие текстовых данных и дедупликация, что в ext4 не удобно так это необходимость регулярно прогонять hardlink и отсутствие сжатия. Зачем тебе btrfs, mdadm не хватит?
     
     
  • 3.11, Аноним (11), 20:58, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +1 +/
    хватит конечно! вы бы еще бекапы не компашки предложили
     
  • 3.75, V1 (ok), 03:26, 19/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +1 +/
    Используешь btrfs, а не удобна ext4?
     
     
  • 4.86, Аноним (9), 06:47, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    И?
     
  • 3.81, EULA (?), 05:27, 19/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +/
    mdadm снапшоты не умеет.
    mdadm сжатие не умеет.
     
     
  • 4.88, Аноним (9), 07:00, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • –1 +/
    Сжатие умеет tar. Снапшоты тоже. Именно так бэкапятся изменения за неделю и в конце недели полноценный бэкап. Рейд это не бэкап, ему не нужны снапшоты или сжатие.
     
     
  • 5.97, i_use_btrfs (ok), 08:52, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    > Сжатие умеет tar. Снапшоты тоже.

    Отлично конечно но в файловой системе недоступно и скорость доступа совсем другая.

     
  • 5.109, EULA (?), 10:23, 19/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • –1 +/
    Это когда tar стал уметь сжатие То, что утилита tar может вызывать внешние утил... большой текст свёрнут, показать
     
     
  • 6.132, Аноним (9), 15:23, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    GNU tar имеет встроенную поддержку для компрессоров и может напрямую их вызывать... большой текст свёрнут, показать
     
     
  • 7.146, Анончик (?), 00:22, 20/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +/
    >Я использовал индексированные gz и есть даже для тарболов сжатых zstd.

    можно по подробно

     
     
  • 8.147, Аноним (9), 02:19, 20/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Такое пойдёт Что-то вроде того и было https github com devsnd tarindexer blob... текст свёрнут, показать
     
  • 7.174, EULA (?), 09:38, 22/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +/
    1 fusermount Корень не смонтировать 2 RO, как и SquashFS 1 Загрузка ОС из ... большой текст свёрнут, показать
     
     
  • 8.183, Аноним (-), 20:09, 24/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +1 +/
    3 Времена операций сильно более другие Одно дело вернуть систему в вид как был... текст свёрнут, показать
     
     
  • 9.194, EULA (?), 14:04, 16/01/2023 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    gt оверквотинг удален Точно ... текст свёрнут, показать
     
  • 5.165, Аноним (-), 14:39, 21/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +/
    > Сжатие умеет tar.

    Это все отлично конечно, но по времени операций и удобству рядом не стояло.

    > Снапшоты тоже. Именно так бэкапятся изменения за неделю и в конце недели полноценный бэкап.

    Сделать снапшот терабайтной ФС в сабже моментально. А таром так можно? То-то и оно :). Снапшот не бэкап но откатить систему после неудачного обновления или смены настроек удобно.

     
  • 2.10, Аноним (11), 20:55, 18/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +2 +/
    zfs модулем отлично работает
     
  • 2.14, Ананимист (?), 21:15, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +1 +/
    > BTRFS не продакш реди
    > Oracle, SUSE, openSUSE : ну да, ну да, пошли мы нафiг
     
  • 2.50, Анонус (?), 22:30, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    А чего не bcachefs? По слухам оно почти готово.
     
  • 2.102, Аноним (98), 09:26, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    В бубунце модуль ЗФС поставляется в комплекте с ведром. Это вполне себе хороший компромисс.
     

  • 1.6, Alladin (?), 20:54, 18/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  [] []     [к модератору]
  • +1 +/
    discard не работает на многих ssd самсунга, зря активировали.
     
     
  • 2.12, Аноним (9), 21:00, 18/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • –7 +/
    Проблема дешёвых ссд. в следующий раз не будешь вестись на рекламу и проплаченные отзывы и возьмёшь качественные adata (поспеши пока островной китай на плаву).
     
     
  • 3.58, Аноним (15), 22:53, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +3 +/
    Адата и есть дешевый ссд.
     
     
  • 4.60, Аноним (9), 23:17, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Да, сарказм был силён. Но, при этом он собирается на нормальном контроллере и поддерживает discard.
     
     
  • 5.89, leap42 (ok), 07:01, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    > ...Но, при этом он собирается на нормальном контроллере...

    Ну как нормальным. У меня штук 7-8 ssd было, проблемный был один - Adata XPG. После поверхностного гугления ошибок из dmesg понял, что проблема с контроллером.

     
     
  • 6.133, Аноним (9), 15:26, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    У них фишка в том, что они собираются на рандомном контроллере, в лучших китайских традициях.
     
     
  • 7.186, Аноним (-), 20:20, 24/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    > У них фишка в том, что они собираются на рандомном контроллере, в
    > лучших китайских традициях.

    И еще и из рандомного флеша, который удалось как можно дешевле где-то ухватить. Мало ли, скидывал нормальный производитель брак, допустим, и выбор был между совсем под пресс, или вон тем дешевым, без претензий, с кучей бэдов это отдать? В первом случае еще за утилизацию платить надо, во втором - даже профит какой-то. Ничего личного, это бизнес.

     
     
  • 8.188, Аноним (9), 20:37, 24/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Тут такое дело, продукция нормальных производителей у меня живёт стабильно мен... текст свёрнут, показать
     
     
  • 9.191, Аноним (-), 22:25, 26/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Стабильно А как это проверялось, если при каждой покупке оно из разных чипов... текст свёрнут, показать
     
  • 2.124, Аноним (131), 14:30, 19/12/2022 [^] [^^] [^^^] [ответить]  [] []     [к модератору]
  • +/
    Работает, но не поддерживает корректно queued trim. Этим существенно замедляя операции во время собственно trim'а. fstrim даже лучше discard - после выполнения по расписанию trim'а, не вызывает падение производительности.
     
     
  • 3.185, Аноним (-), 20:16, 24/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    В вон том случае оно асинхронно относительно операций ФС случается и это уже не ... большой текст свёрнут, показать
     
  • 2.184, Аноним (-), 20:13, 24/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +/
    > discard не работает на многих ssd самсунга, зря активировали.

    Ядро само отключает для проблемных накопителей, там список вредин и плохих версий фирмварей ведется. Для таких ядро будет просто игнорить дискард, не повод из-за кривых железок обламывать всех остальных. Сделали так что пролетать будут только владельцы (некоторых) самсунгов.

     

  • 1.7, Аноним (7), 20:54, 18/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  [] []     [к модератору]
  • –2 +/
    Спасибо, но я лучше reiser5 подожду.
     
     
  • 2.20, Аноним (15), 21:19, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +3 +/
    Его не будет. Ты как те психи, который ждали автобус на остановке где автобусы не останавливаются.
     
     
  • 3.29, Аноним (7), 21:44, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • –2 +/
    Я тебе не верю.
     
     
  • 4.41, Аноним (15), 22:03, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +1 +/
    Поверь в Анонима как в самого себя. Главная заповедь опеннета.
     
     
  • 5.103, Аноним (98), 09:28, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Это рекурсивная вера.
     

  • 1.18, ma3x one (?), 21:18, 18/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  [] []     [к модератору]
  • +/
    > Скажите, а Btrfs уже готова для продакшена и для десктопа?

    openSUSE Leap 15.x:

    Коневой раздел - Btrfs
    Домашний раздел - Xfs

     
     
  • 2.21, Аноним (15), 21:19, 18/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • –3 +/
    Суся это экспериментальный дистр. Никто суши даже платные на боевой сервер ставить не будет.
     
     
  • 3.23, Ананимист (?), 21:21, 18/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • –2 +/
    Рекомендую иногда выбираться в Европу, а не сидеть на диване где-то в Ростове.
    Очень много стереотипов развеются.
     
     
  • 4.28, Аноним (7), 21:43, 18/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • –1 +/
    > Очень много стереотипов развеются.

    Давно уже.

     
     
  • 5.45, Ананимист (?), 22:08, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • –1 +/
    Не, или starздишь, или мало гуляешь.
    Нужно больше.

    openSUSE и в госпиталях юзают (у них на сайте есть инфа, не падай ток в обморок).
    И в учебных заведениях (можешь погуглить, только держи себя в руках).

    Давай, как погуляешь, дай знать.

     
  • 4.44, Аноним (15), 22:07, 18/12/2022 [^] [^^] [^^^] [ответить]  [] []     [к модератору]
  • –2 +/
    Чтобы убедить что суши никто не использует? Ты бы сам сначала для начала выбрался из своего манямирка.  
     
     
  • 5.46, Ананимист (?), 22:09, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    https://www.opennet.ru/openforum/vsluhforumID3/129298.html#45
    + залети в метрику к ним и узри, сколько активных качалок с их серваков за ноябрь.
    Упадёшь с дивана, уверяю.
     
     
  • 6.54, Аноним (15), 22:45, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • –3 +/
    Опять ссылку на свой манямирок дал? Ты мозгов вообще обучен пользоваться? Тебе явно к психиатору прими таблетки.
     
  • 4.56, Аноним (56), 22:49, 18/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +4 +/
    А Ростов, что, не в Европе?
     
  • 4.72, YetAnotherOnanym (ok), 02:06, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    > Рекомендую иногда выбираться в Европу

    Пффф... тоже мне, эталон.

     
     
  • 5.74, Прохожий (??), 03:24, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Ну конечно, куда какой-то Европе до Г-нодонска или Задрыщинска из российской глубинки.
     
     
  • 6.111, YetAnotherOnanym (ok), 11:10, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • –2 +/
    > Ну конечно, куда какой-то Европе до Г-нодонска или Задрыщинска из российской глубинки.

    Дооо, уязвил сарказмом, ага. Куда ж нам, сиволапым, до Шайзенштадта и Фартборо - это ж столицы мирового IT, на них равняются в Беркли, Тайбэе, Москве, Токио и вообще во всём мире.

     
  • 3.32, pavlinux (ok), 21:50, 18/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +/
    > Никто суши даже платные на боевой сервер ставить не будет.

    В ИТ отделе лондонской бирже сидят д0л6oящеры, не слушали омнонимов с опеннета?

    https://www.cnews.ru/news/line/londonskaya_birzha_zavershila_perehod

     
     
  • 4.43, Аноним (15), 22:06, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • –1 +/
    Новости 33 миллиона лет ты так жестко рофлишь над самим собой?  И то в те времена то что менеджеры получили больше откатов конкретно в этой фирме говорит ровно ни о чём.  

    После этого никто, подчеркиваю никто из тех кто дружит с головой ни в какие серьёзные вещи суши не пихал.  

     
     
  • 5.48, pavlinux (ok), 22:13, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    > жестко рофлишь

    Йопт, малолетнее дебилушко. иди гугле HPE GreenLake, Kubernetes

    И свои высеры про "откаты" и "никто" ссылками подтверждай. А то выглядишь де6илом

     
     
  • 6.53, Аноним (15), 22:44, 18/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Йопт, старый маразматушка. Нет там никакого суши забудь. Суши есть у мелких отщипенцев типа тебя, с ограниченными умственными способностями. Твои нелепые попытки гуглить это просто смех. Ты смешном по жизни.
     
  • 2.39, penetrator (?), 22:02, 18/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • –1 +/
    зачем такой изврат? сюся нормально полностью крутится на бтрфс
     
  • 2.69, Аноним (68), 00:59, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Там (в зюзе) уже сто лет дефолты такие, они были еще когда бтрфс сыпалась во много раз чаще чем сейчас, так что это нулевой аргумент
     

  • 1.31, pavlinux (ok), 21:48, 18/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  []     [к модератору]
  • –1 +/
    BTRFS это отладочная версия с халявным кодом, для тестирования алгоритмов ZFS.

     
  • 1.62, Kirikekeks (ok), 23:31, 18/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  []     [к модератору]
  • +/
    Упрощаете товащи!
    Здесь про рэйд5 новость. Использовать саму btrfs можно, кому нужно. А вот райд5 btrfs - кому нужно? Я бы послушал. Вот lvm к примеру срачей отмены ни у кого не вызывает, а хоть кто-то, ну то нибудь пользуется lvm raid5?
     
     
  • 2.169, edo (ok), 18:56, 21/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Ну я активно использую raid 5 в фс (zfs). Ибо оно имеет свои плюсы (как и минусы, разумеется).
     

  • 1.64, Аноним (64), 00:17, 19/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  [] []     [к модератору]
  • +3 +/
    Вообщем понятно, с такими детскими проблемами на btrfs в ближайшие 10 лет смотреть не стоит
     
     
  • 2.92, Конь (?), 07:52, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +2 +/
    10 лет назад было тоже самое. Подождем ещё 2 раза по 10 может взлетит
     
  • 2.104, Аноним (104), 09:43, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +1 +/
    Ага, по этой логике и sqlite использовать не стоит, нигде и никогда. У неё как были проблемы с множественной записью так и остались.
     

  • 1.71, YetAnotherOnanym (ok), 01:58, 19/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  []     [к модератору]
  • +1 +/
    > блок чётности можно воссоздать из данных

    Хммм... в самом деле... Зачем его вообще хранить, действительно?

     
  • 1.85, Аноним (85), 06:25, 19/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  []     [к модератору]
  • +/
    Btrfs слишком глючно и ненадёжно. Лучше ext4 на сегодня нет, разве что zfs.
     
     
  • 2.110, Аноним (110), 10:34, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    xfs. zfs - такой же комбайн, как и btrfs.
     
  • 2.128, Аноним (131), 14:42, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Однозначно zfs, если вам нужна btrfs. Минусов два - не в ядре и необходимость в тюнинге.
     
     
  • 3.137, пох. (?), 17:32, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +1 +/
    минусов гораздо больше. Начиная от отсутствия средств восстановления, продолжая невозможностью менять конфигурации сложившиеся исторически, и заканчивая все тем же смешным неумением без перезагрузки увеличить существующий раздел (только у л@п4тых, но беда в том что другой zfs для вас у меня уже нет)

    Про абсолютно неэффективную работу с памятью уже и не стоит...

     

  • 1.112, Аноним (112), 12:27, 19/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  [] []     [к модератору]
  • +/
    Какой смысл использовать RAID5/6, когда диски стали большими и дешевыми? Время восстановления после сбойного диска будет куда больше чем у RAID1/10, а по стоимости выйгрыш минимальный.
     
     
  • 2.121, Аноним (7), 14:14, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Это справедливо лишь по отношению к потребительским накопителям (если говорить об ssd), модели серверного/промышленного класса нифига не стали дешевле.
     
  • 2.136, пох. (?), 17:29, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Именно в том что они стали слишком большими (и слишком дешевыми).

    Время восстановления после сбоя любимого тобой raid10 тождественно равно нулю.
    Потому что он не восстановится с непомерно высокой вероятностью.

    Выкрасить и выбросить можно сразу.

    А 3way mirror все еще немного дороговат.

     
  • 2.157, Аноним (96), 22:48, 20/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Это смотря сколько у тебя дисков.
    Предлагаешь загнать 15 8Tб дисков с данными под тройную чётность, купив 45?
    Не, я лучше куплю ещё два и обойдусь RAID6.
     
     
  • 3.158, Аноним (96), 22:49, 20/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Тьфу блин под тройную чётность. Под тройную дупликацию, конечно же.
     
  • 3.161, пох. (?), 00:21, 21/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    А ты - смелый!

    (/me немного подозрительно косится на свою конструкцию 9+2)

     

  • 1.138, Аноним (138), 18:52, 19/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  [] []     [к модератору]
  • +4 +/
    Ребята, не стоит использовать RAID 5/6. Никогда. Вы молодые, шутливые, вам все легко. Это не то. Это не RAID1 и даже не JBOD. Сюда лучше не лезть. Серьезно, любой из вас будет жалеть. Лучше закройте тему и забудьте, что тут писалось. Я вполне понимаю, что данным сообщением вызову дополнительный интерес, но хочу сразу предостеречь пытливых – стоп. Остальных просто не найдут.
     
     
  • 2.139, пох. (?), 19:57, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • –1 +/
    программировать, а не использовать. Использовать-то можно, если данные не нужны.

    Поправил, не благодари.

    А в остальном все верно. Со времен Левенталя не осталось достаточно грамотных людей, способных в эту математику (и одновременно в код, но это неточно).

    ВСЕ современные попытки почему-то (мы знаем почему) оборачиваются г-ном.

     
     
  • 3.141, Аноним (68), 20:59, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • –1 +/
    > в эту математику

    В xor то? Таблетки прими

     
     
  • 4.142, пох. (?), 21:36, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    угу, в xor. Вот в твоем лин00ps'е - с первого раза - нишмагли, в mdraid.
    И его реализация raid6 просто превращала данные в мусор.

    Нет, не потому что перепутали байтики в xor. Она вообще не работала. А почему - в твоей, лапоть, церковноприходской школе, тебя не учат не то что понимать, а хотя бы осознать глубину своей безграмотности.

    Лет пять назад ситуация повторилась в lizardfs. Там интереснее - там, видимо, именно перепутали, но за пять лет НИКТО не смог исправить. Ну не хватает им тебя, эксперта, чтоб показать, что там не так в ихнем xor.

    А тех кто мог бы - Организация видимо убила и съела. Или как Левенталя... уж лучше б - съела.

     
  • 4.143, Аноним (96), 22:13, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    В какой xor?
    RAID6 - RS
     
     
  • 5.144, пох. (?), 22:21, 19/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Не, ну реализуется-то оно в основном и правда на xor и сдвигах, как любое умножение двоичных  полиномов.
    Только местному эксперту (к счастью для него) никогде не разобраться, почему иногда при этом получаются обратно данные, а иногда - фигня какая-то.

    А с теми кто могли - всякое странное происходило. Так что да, не советую в этом копаться. Просто не найдут. Или найдут разработчиком в оракле.


     
     
  • 6.152, Аноним (-), 09:31, 20/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • –1 +/
    О да, лекцию по полям галуа давай заодно, если сам что-то смыслишь.
     

  • 1.156, аНОНИМ (?), 22:37, 20/12/2022 [ответить] [﹢﹢﹢] [ · · · ]  []     [к модератору]
  • +/
    я как-то тестировал openzfs raidz1 (ихнее название для raid5) btrfs raid5. Создавал fs, писал данные, размонтировал. Потом один из 3 разделов перезаписывал /dev/urandomом. Монтировал обратно. После этого zfs ругалась, тормозила, но все данные возвращала (а resilver фиксил ситуацию к тому что было до). btrfs же вообще ничего не читала, ну может случайно 1 короткий файл из 10. Это цена отсутствия чексуммы на блок чётности.

    Из аналогичного упражнения для mirror/raid1 обе фс выбирались без потерь.
     
     
  • 2.159, Аноним (96), 22:50, 20/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    mirror/raid1/raidz1/raid5
    Всё - выкрасить и выбросить.

    Либо 3-way mirror, либо raid6.

     
     
  • 3.162, пох. (?), 00:26, 21/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    при отсутствии контроля четности второе ничем не лучше. Ну есть у тебя теперь второй блок контрольных данных. А какой поврежден - по прежнему неизвестно. Может этот самый второй. Может первый. А может сами данные. raid делали для защиты от отказов носителя, не от silent corruption или отказа управления.

     
     
  • 4.163, аНОНИМ (?), 11:52, 21/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +/
    Чисто формально, в случае порчи *одного* любого блока из страйпа raid6 данные можно восстановить. Но это существенно большие вычисления чем в случае, если известно, какие блоки пропали. И mdraid так не умеет.
     
     
  • 5.170, edo (ok), 19:05, 21/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    > Но это существенно большие вычисления

    Не только, это ещё и больше i/o, поэтому сомневаюсь, что оно где-то используется при штатной работе для контроля целостности данных

     
  • 5.171, пох. (?), 21:45, 21/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    > Чисто формально, в случае порчи *одного* любого блока из страйпа raid6 данные можно
    > восстановить.

    э... как? Если мы не знаем, какой именно это блок? Если у страйпа хотя бы был бы общий контрольный, не ec, код - то да, можно собирать его всеми способами выкидывая все блоки поочереди, пока контролька не совпадет. Ну или ты предлагаешь мажоритарным методом - каких больше, тот и прав? Так и xor можно. Правда, необязательно это будет правильный ответ ;-)

    > mdraid так не умеет.

    мне кажется, так никто из EC-based не умеет.

     
  • 4.164, аНОНИМ (?), 11:53, 21/12/2022 [^] [^^] [^^^] [ответить]  []     [к модератору]
  • +/
    Ну и да, в случае зеркал с >2 копиями тоже такто можно задетектить порченный блок и восстановить. И опять mdraid не умеет.
     
     
  • 5.172, пох. (?), 21:51, 21/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Ну то же самое - либо контрольный код, и просто прочитать тот где совпало, либо те где больше одинаковых, те и правы.
    Но опять же сомневаюсь что хоть что-то так работает.

    В synology mdraid вроде умеет в какой-то self-healing, "но это неточно" и исходников нет.

     
     
  • 6.187, Аноним (-), 20:28, 24/12/2022 [^] [^^] [^^^] [ответить]      [к модератору]
  • +/
    Btrfs прекрасно чинит себя с второй копии, csum error, corrected и дальше поехал... большой текст свёрнут, показать
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2025 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру