URL: https://ssl.opennet.ru/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 108855
[ Назад ]

Исходное сообщение
"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено opennews , 17-Авг-16 09:29

Состоялся (https://groups.google.com/forum/#!topic/sophia-database/asQx...) релиз встраиваемой СУБД Sophia 2.2 (http://sophia.systems/), оформленной в виде разделяемой библиотеки. СУБД рассчитана на обеспечение очень большой скорости записи и чтения при работе с данными небольшого и среднего размера. Данные сохраняются на диске с использованием лог-подобного хранилища, работающего в режиме постоянного пополнения (append-only). В отличие от других лог-подобных хранилищ, метод хранения в Sophia не ограничивается высокой скоростью записи, но также оптимизирован для обеспечения высокой скорости произвольного чтения данных и выборки диапазонов значений. Код Sophia написан на языке Си и поставляется (https://github.com/pmwkaa/sophia) под лицензией BSD.
Ключевыми изменениями в Sophia 2.2 являются новые схема хранения и архитектура хранения. Новая схема хранения базируется на построчном размещении, при котором каждая строка включает ряд полей произвольного типа. Подобный подход позволяет снизить накладные расходы при размещении данных в хранилище, например, числа и метадданые могут хранится в более компактном представлении непосредственно в строках (rows). Кроме того, новая схема позволят организовать работу со вторичными индексами. Что касается новой архитектуры хранения, то её основной особенностью является обеспечение постоянной производительности операций чтения, записи и сканирования диапазонов, не зависящей от размера хранилища (O(1)).

Основные особенности СУБД Sophia:
-  Быстрая запись (Append-Only) и оптимизация на чтение;
-  Соответствие требованиям ACID (атомарность, согласованность, изолированность, надежность);
-  MVCC-движок для обеспечения одновременного конкурентного доступа к БД (Multi-Version Concurrency Control);
-  Транзакции, которые могут охватывать несколько операций;
-  Консистентные курсоры;
-  Снапшоты;
-  Возможность хранения нескольких БД в одном файле;
-  Поддержка сериализированных представлений;
-  Многопоточный движок и возможность использования в многопоточных приложениях;
-  Поддержка создания горячих бэкапов, создаваемых на лету без приостановки работы;
-  Простой API, лёгкая интеграция с приложениями, отсутствие сторонних зависимостей. Для работы требуется только два файла на языке Си.
-  Поддерживаемые технологии хранения:

-  Дисковое хранение - для хранения используется жесткий диск или Flash-память. Запись кешируется в памяти для последующего сброса на диск.
-  Анти-кеширование - оперативная память становится основным хранилищем. Холодные данные читаются с диска или Flash-памяти.

-  Постоянное кеширование - Второе хранилище используется в паре как LRU-кеш в оперативной или Flash-памяти для горячих данных. Холодные и горячие данные дублируются в основном хранилище.

-  Постоянное хранение в памяти - данные хранятся в оперативной памяти и постоянно сохраняются на диске. Поддерживается сжатие данных в памяти.
URL: https://groups.google.com/forum/#!topic/sophia-database/asQx...
Новость: https://www.opennet.ru/opennews/art.shtml?num=44977

Содержание

Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 09:29 , 17-Авг-16
- Выпуск встраиваемой СУБД Sophia 2.2,ae, 09:42 , 17-Авг-16
- Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 09:57 , 19-Авг-16
Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 09:42 , 17-Авг-16
- Выпуск встраиваемой СУБД Sophia 2.2,Игорь, 09:53 , 17-Авг-16
  - Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 10:18 , 17-Авг-16
    - Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 11:04 , 17-Авг-16
      - Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 12:23 , 17-Авг-16
      - Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 12:28 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 12:38 , 17-Авг-16
        Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 18:55 , 17-Авг-16
        Выпуск встраиваемой СУБД Sophia 2.2,Сбиряк, 19:00 , 19-Авг-16
      - Выпуск встраиваемой СУБД Sophia 2.2,Мяут, 13:19 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,kai3341, 13:57 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 19:27 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,Аноним84701, 18:07 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 19:29 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,Аноним84701, 20:30 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,angra, 12:16 , 18-Авг-16
  - Выпуск встраиваемой СУБД Sophia 2.2,Sabakwaka, 15:03 , 17-Авг-16
  - Выпуск встраиваемой СУБД Sophia 2.2,adolfus, 19:55 , 17-Авг-16
Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 10:28 , 17-Авг-16
- Выпуск встраиваемой СУБД Sophia 2.2,funny_falcon, 11:58 , 17-Авг-16
  - Выпуск встраиваемой СУБД Sophia 2.2,Mail, 16:09 , 17-Авг-16
    - Выпуск встраиваемой СУБД Sophia 2.2,funny_falcon, 16:19 , 17-Авг-16
  - Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 19:35 , 17-Авг-16
    - Выпуск встраиваемой СУБД Sophia 2.2,funny_falcon, 19:49 , 17-Авг-16
      - Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 20:22 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,funny_falcon, 20:41 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 23:09 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,funny.falcon, 23:38 , 17-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 01:15 , 18-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,funny.falcon, 07:22 , 18-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,vatocefal, 13:39 , 18-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 22:23 , 18-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 10:50 , 19-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 11:26 , 19-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 15:40 , 20-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,rob pike, 15:51 , 21-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,Led, 22:23 , 21-Авг-16
        Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 23:41 , 21-Авг-16
        
        Выпуск встраиваемой СУБД Sophia 2.2,vatocefal, 15:56 , 19-Авг-16
    - Выпуск встраиваемой СУБД Sophia 2.2,funny_falcon, 19:51 , 17-Авг-16
Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 10:55 , 17-Авг-16
Выпуск встраиваемой СУБД Sophia 2.2,adolfus, 19:42 , 17-Авг-16
- Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 10:02 , 19-Авг-16
Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 04:18 , 18-Авг-16
Выпуск встраиваемой СУБД Sophia 2.2,Шарпей, 12:57 , 18-Авг-16
- Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 10:03 , 19-Авг-16
  - Выпуск встраиваемой СУБД Sophia 2.2,Шарпей, 23:38 , 19-Авг-16
    - Выпуск встраиваемой СУБД Sophia 2.2,Аноним, 15:42 , 20-Авг-16

Сообщения в этом обсуждении

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 17-Авг-16 09:29

Это аналог SQLite?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено ae , 17-Авг-16 09:42

нет, это key-value бд.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 19-Авг-16 09:57

это скорее дальний родич беркли дб, чем склайт. без блэкджека и проблем лицензионных но зато с минимизированным оверхэдом на эксплуатацию и упрощенной интеграцией на прикладном уровне.
те для тех кому эрацев вроде d-ets маловато )

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 17-Авг-16 09:42

Слава Вселенной, что оно не на каком-то Rust или Go.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Игорь , 17-Авг-16 09:53

Позвольте поинтересоваться, а чем обусловлена такая реакция к Rust? Просто интересно мнение людей, что не устраивает, например синтаксис, система лайфтаймов, владения и заимствования, либо же система типов? Вопрос не ради холивара! Просто интересно мнение инженеров.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 17-Авг-16 10:18

Такая реакция на Rust обсусловлена в первую очередь сектой расто-манов, которые заполонили уже все интернеты своими хэлло ворлдами.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 17-Авг-16 11:04

Rust-оманов значительно меньше чем Go-внюков. Вторые реально всю вселенную хотят на своем любимом язычке переписать.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 17-Авг-16 12:23

И правильно. Знаете почему? Мне очень интересно: почему бы и нет?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 17-Авг-16 12:28

Потому что существует 1. ДОСТУПНАЯ, 2. понятная, 3. официальная, 4. постоянно обновляющаяся документация. Да-да. Надеюсь те, у кого есть уважение к своему времени, перейдут на RUST & GO...

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 17-Авг-16 12:38

Ага, вообще, уважение к себе в целом и полностью. Поддерживаю.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 17-Авг-16 18:55

От главы Lifetime в Rust Docs хочется глаза вырвать, настолько она замечательная

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Сбиряк , 19-Авг-16 19:00

С каких это пор читать man-ы наши небесные стало грешно?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Мяут , 17-Авг-16 13:19

На Go уже написан Docker (считай, новый продукт). На Rust _переписывают_ GNU coreutils: https://github.com/uutils/coreutils И кто тут переписывает вселенную?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено kai3341 , 17-Авг-16 13:57

И в чём проблема? Нормальный тестовый проект для развивающегося языка.
Вообще не понимаю хейтеров. Как будто их заставляют переписывать на Rust, например, тот же coreutils =)

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 17-Авг-16 19:27

Их не заставляют переписывать.
Их заставляют продираться сквозь информационный шум, создаваемый поклонниками Go и Rust на каждом углу. Каковой в подавляющем большинстве случаев не несет с собой даже толики полезного сигнала. Если бы в этом шуме встречались хотя бы какие-то проекты где действительно применение каких-то интересных возможностей этих языков давало что-то полезное - в плане ли скорости разработки, надежности ли, безопасности ли, еще чего-то - что позволило бы реализовать какие-то полезные вещи, которые сложно, долго, неудобно было бы реализовать с использованием других языков.
Посмотрите рядом топик про недо-monit на Go. Всё то же самое можно было бы сделать, например, на Perl - причем гораздо быстрее, спасибо CPAN - и точно так же запаковать одной из утилит в один файл без зависимостей. В сэкономленное время можно было бы добавить какой-то интересный функционал или хотя бы посмотреть что и как сделано в monit и подумать зачем оно так сделано - и даже написать об этом что-то интересное и может быть реализовать у себя какие-то подходы, которые еще лучше. Но это скучно, поэтому будем писать на Go и Rust велосипеды с одним квадратным колесом и заполонять ими все интернеты.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним84701 , 17-Авг-16 18:07

> На Go уже написан Docker (считай, новый продукт). На Rust _переписывают_ GNU coreutils: https://github.com/uutils/coreutils И кто тут переписывает вселенную?
Хуже, на расте даже ОСь накатали!
https://www.redox-os.org/
И работает она даже на реальных железках:
https://www.redox-os.org/screens/
Причем, в ходе разработки авторы раста прислушивались к разработчику насчет желательных фич языка, вылезающих граблей и т.д. Даже вкатили https://github.com/rust-lang/rust/pull/32410
А что там с Go, который вроде бы тоже c претензией на "системное программирование"? )

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 17-Авг-16 19:29

У Go действительно были такие претензии?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним84701 , 17-Авг-16 20:30

https://golang.org/doc/faq
> Go was born out of frustration with existing languages and environments for systems programming.
https://github.com/golang/go/wiki/GoForCPPProgrammers
> Go is a systems programming language intended to be a general-purpose systems language, like C++.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено angra , 18-Авг-16 12:16

Одно слово - docker

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Sabakwaka , 17-Авг-16 15:03

>> Просто интересно мнение инженеров
Чтобы узнать мнение инженеров, нужно спрашивать инженеров?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено adolfus , 17-Авг-16 19:55

Под всем этим гайном, типа лайфтаймов, этого вашего владения и заимствования, лежит системная архитектура (СА), с которой даже на C не всегда получается эффективно повзаимодействовать, несмотря на то, что и СА и C -- суть абсолютно процедурные сущности. В связи с этим встает вопрос -- а нахрена выдумывать непроцедурные костыли и велосипеды, если в "отрасли" есть сотни и тысячи выверенных паттернов, которые можно эффективно реализовать на любом процедурном языке, в том чисел и C?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 17-Авг-16 10:28

O(1) оно только
  - в идеальной сферической в вакууме машине Фон Неймана с единой ценой доступа к любой ячейке памяти
  - если оторвать MVCC (иначе раскатистое эхо от длинной очереди откатывающихся транзакций можно слушать при некоторых условиях довольно долго)
  - без http://sophia.systems/v2.1/admin/compaction.html

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено funny_falcon , 17-Авг-16 11:58

Я сейчас не про твою критику Софии спрошу. Она частями разумна.
(поправлю только, что O(1) - имелось в виду обращений к диску, а не вычислительных затрат).
Я спрошу: неужели ты себя настолько не ощущаешь личностью, что не смог подобрать псевдоним, не ассоциированный с реальным человеком?
PS. если ты действительно Rob Pike, то приношу прощения.
PPS. да, мой псевдоним тоже мало хорошего говорит обо мне :-)

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Mail , 17-Авг-16 16:09

"O(1) - имелось в виду обращений к диску, а не вычислительных затрат"
так и запишем - в новости ложь.
PS
Я спрошу: неужели ты себя настолько не ощущаешь личностью, что не смог подобрать псевдоним, не ассоциированный с реальным человеком?
PPS. если ты действительно Funny Falcon, то приношу прощения.
PPPS. да, мой псевдоним тоже мало хорошего говорит обо мне :-)

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено funny_falcon , 17-Авг-16 16:19

> PPS. если ты действительно Funny Falcon, то приношу прощения.
Я действительно funny_falcon. Я не слышал ни о ком в it-сообществе, кто тоже бы использовал этот ник-нейм. Хотя, мне кажется попадался фотограф из Америки.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 17-Авг-16 19:35

> Я сейчас не про твою критику Софии спрошу. Она частями разумна.
В каких же частях она *не* разумна? Это интереснее всего.
> (поправлю только, что O(1) - имелось в виду обращений к диску, а
> не вычислительных затрат).
Это уже ближе к реальности. А что же с compaction? Он как учитывается в этой формуле? "Имелось в виду что 1 - это не совсем 1, а внутри него есть еще некоторое C"?
> Я спрошу: неужели ты себя настолько не ощущаешь личностью, что не смог
> подобрать псевдоним, не ассоциированный с реальным человеком?
Ощущать себя - это не настолько важное "дело всей жизни" как ныне принято считать.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено funny_falcon , 17-Авг-16 19:49

>> Я сейчас не про твою критику Софии спрошу. Она частями разумна.
> В каких же частях она *не* разумна? Это интереснее всего.
>> (поправлю только, что O(1) - имелось в виду обращений к диску, а
>> не вычислительных затрат).
> Это уже ближе к реальности. А что же с compaction? Он как
> учитывается в этой формуле? "Имелось в виду что 1 - это
> не совсем 1, а внутри него есть еще некоторое C"?
Log(2^48) = 48 (если по основанию 2)
А диск медленнее памяти в 1000 раз (среднестатистический ssd, диск ещё медленнее в 1000 раз).
Потому, если база, не влезающая в память, имеет O(1) обращений к диску и O(log N) поиск в памяти, то это в пределах нашей реальности можно округлить до сложности O(1).
compaction не блокирует ни запись, ни чтение в sophia.
Кроме того, в отличии от потомков leveldb, здесь compaction происходит гораздо меньшими кусочками данных, и потому не производит катастрофических пауз в десятки секунд.
Хотя, безусловно, оно будет нагружать диск.
>> Я спрошу: неужели ты себя настолько не ощущаешь личностью, что не смог
>> подобрать псевдоним, не ассоциированный с реальным человеком?
> Ощущать себя - это не настолько важное "дело всей жизни" как ныне принято считать.
Как бы, если не ощущаешь себя, то вообще не живёшь.
"Ощущать себя" - не является достаточным условием, но является необходимым.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 17-Авг-16 20:22

Если бы compaction здесь был *еще хуже* чем в LevelDB, то и смысла обсуждать бы не было. Проблемы LevelDB, впрочем, этим не ограничиваются, but I digress.
При округлении логарифмов советую посмотреть в сторону NVMe, их, знаете ли, уже в ноутбуки и планшеты ставят. А также не забыть указывать, о какой именно странице памяти речь - впрочем, об этом я говорил в самом первом пункте.
> можно округлить до сложности O(1)
Вы не задумывались, почему в учебниках по алгоритмам так не делают? Так очень много чего было бы "округлить".
> не производит катастрофических пауз
На тех паттернах нагрузки, которые "имелись в виду"? На следующей итерации нашей беседы мы сможем выяснить какие же это паттерны? Что же с другими, которые в виду "не имелись"?
> безусловно, оно будет нагружать диск
Не зависит ли эта нигде не учтенная compaction-нагрузка на диск от операций с БД? А если зависит, то где же эта зависимость в красивой формуле "О(1)"?
> если не ощущаешь себя, то вообще не живёшь
Изложите, пожалуйста, подробней вашу философскую концепцию жизни.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено funny_falcon , 17-Авг-16 20:41

> При округлении логарифмов советую посмотреть в сторону NVMe, их, знаете ли, уже
> в ноутбуки и планшеты ставят. А также не забыть указывать, о
> какой именно странице памяти речь - впрочем, об этом я говорил
> в самом первом пункте.
http://www.3dnews.ru/917044 - 440000IOP/s на чтение. Быстрее сходу не гуглится.
Подозреваю, что это для pipeline-d (или multithreaded, если вам так понятнее) запросов.
Т.е. латенси там будет явно больше 2000ns. Судя по другим бенчам, типичным будет 10000ns.
Память - 60-100ns. Ок, не в 1000 раз, а в 100.
Но и sophia в памяти держит не все ключи, а малую часть. Так что, можно договориться про
коэффициенты 100 (чтение с диска) и 32 (работа в памяти).
>> можно округлить до сложности O(1)
> Вы не задумывались, почему в учебниках по алгоритмам так не делают? Так
> очень много чего было бы "округлить".
Делают. В последних параграфах, где даются советы по практической реализации.
Типичный совет:
"обращайте внимание на размер ваших данных, и константы, прячущиеся за O. Зачастую, O(N^2) бывает быстрее, чем O(log N), а O(1) - медленнее"
>> не производит катастрофических пауз
> На тех паттернах нагрузки, которые "имелись в виду"? На следующей итерации нашей
> беседы мы сможем выяснить какие же это паттерны? Что же с
> другими, которые в виду "не имелись"?
Ты уже казуистикой занимаешься.
>> безусловно, оно будет нагружать диск
> Не зависит ли эта нигде не учтенная compaction-нагрузка на диск от операций
> с БД? А если зависит, то где же эта зависимость в
> красивой формуле "О(1)"?
Нет, не зависит. Но тебе плевать на это.
>> если не ощущаешь себя, то вообще не живёшь
> Изложите, пожалуйста, подробней вашу философскую концепцию жизни.
Зачем? Тебе же всё равно.
Ты - не ты, и тебе на себя наплевать, раз чужое имя носишь, и во всеуслышание говоришь, что это не главное.
Если тебе на себя наплевать, то почему мне должно казаться, что тебе на меня не наплевать, и на мою "философскую концепцию жизни"?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 17-Авг-16 23:09

80 000 ns это обычный NVMe SSD.
10 000 ns это 3D XPoint.
1 000 ns это NVDIMM.
100 ns это RAM.
Про NVMe over Fabrics пока не будем.
Если в ваших учебниках не дается анализ худшего случая это не очень хорошие учебники.
Если вы считаете что количество compaction в LSM-структурах данных не зависит от данных, вы считаете неверно.
Если вы считаете что compaction в современных LSM-структурах данных не является ключевым фактором, влияющим на их производительность, вы считаете неверно.
То что не только первоначальная эйфория, связанная с LSM, но и вторая волна - подход "достаточно снизить compaction frequency и свести большинство этой деятельности к hot data key-ranges" - уже остались в прошлом, вы не заметили.
Вам нравится что вам не наплевать что Аноним в интернетах о вас думает?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено funny.falcon , 17-Авг-16 23:38

> 80 000 ns это обычный NVMe SSD.
> 10 000 ns это 3D XPoint.
> 1 000 ns это NVDIMM.
> 100 ns это RAM.
> Про NVMe over Fabrics пока не будем.
:-) убедили. Если у вас столько денег, что вы сотнигигабайтные хранилища на NVDIMM строите, то вы правы.
> Если в ваших учебниках не дается анализ худшего случая это не очень
> хорошие учебники.
Учебники советуют рассматривать реальные случаи, когда дело доходит до реализации. Если худший случай реален, то его нужно рассматривать.
> Если вы считаете что количество compaction в LSM-структурах данных не зависит от
> данных, вы считаете неверно.
Согласен, даже в Софии частота compaction зависит от объема и рандомности записи.
> Если вы считаете что compaction в современных LSM-структурах данных не является ключевым
> фактором, влияющим на их производительность, вы считаете неверно.
Согласен, когда диск нагружен, чтение и запись страдают. Они остаются O(1) от количества данных (для софии), но константа подрастает.
Можно сказать, что появляется завсисимость от интенсивности и характера запросов/нагрузки. Но от количества данных остается прежним.
> То что не только первоначальная эйфория, связанная с LSM, но и вторая
> волна - подход "достаточно снизить compaction frequency и свести большинство этой
> деятельности к hot data key-ranges" - уже остались в прошлом, вы
> не заметили.
Вот здесь софия придерживается иной стратегии: чаще, но меньшими фрагментами.
Это как разные GC: одни чистят много за раз, с большой задержкой, но максимально быстро.
Другие меньшими кусочками и с минимальными задержками.
Понятно, что чем больше мусора производится, тем медленнее вся система.
Но в целом, получается лучше, чем альтернативы.
В общем, правда, что серебрянной пули нет.
Есть сюрекен, арбалетная стрела, метательный топор и бумеранг. Каждый для своей цели, стрелка и обстоятельств применения.
> Вам нравится что вам не наплевать что Аноним в интернетах о вас
> думает?
Мне нравится, что мне не наплевать на себя.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 18-Авг-16 01:15

NVDIMM пока позиционируется не столько для самого хранилища, сколько для индексов.
Учебники, хорошие, советуют рассматривать худшие и лучшие случаи для того чтобы определить является ли ваш случай подходящим для того или иного алгоритма.
> Согласен, даже в Софии частота compaction зависит от объема и рандомности записи.
Невероятный прогресс, всего за полдесятка итераций.
> Согласен, когда диск нагружен, чтение и запись страдают
Потрясающе, кто бы мог подумать.
> константа подрастает
Через сколько итераций мы выясним что на некоторых паттернах эта константа начинает закрывать собой Эйфелеву башню?
> Можно сказать, что появляется завсисимость от интенсивности и характера запросов/нагрузки
Но можно, разумеется, и не говорить. А продолжать рассказывать про О(1). Ведь в случае с огромным количеством данных и одним запросом в месяц это действительно будет так.
> Понятно, что чем больше мусора производится, тем медленнее вся система.
Нет, непонятно.
Всё зависит от того как именно он производится, какую структуру имеет, и как именно собирается. Легко найти случаи когда система, производящая больше мусора будет быстрее чем производящая меньше.
> Но в целом, получается лучше, чем альтернативы.
Нет, не получается. А выражение "в целом" требует расшифровки, подробной и внятной.
> В общем, правда, что серебрянной пули нет.
Замечательно что потребовалось так мало времени чтобы это выяснить.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено funny.falcon , 18-Авг-16 07:22

> NVDIMM пока позиционируется не столько для самого хранилища, сколько для индексов.
Уууу. Понятно. Т.е. все таки, когда нашли где читать, потом опять идти в медленный сторадж. София так и делает, только индекс держит в еще более дешевой DIMM.
> Учебники, хорошие, советуют рассматривать худшие и лучшие случаи для того чтобы определить
> является ли ваш случай подходящим для того или иного алгоритма.
Разве я сказал иное? Лучшие и худшие реальные случаи. Если массив чисел никогда не бывает больше десяти элементов, то insertion sort быстрее quick sort, и linear scan быстрее binary search.
>> Согласен, даже в Софии частота compaction зависит от объема и рандомности записи.
> Невероятный прогресс, всего за полдесятка итераций.
Но не от объема данных. А ведь именно это подразумевается в O(1). Знаток книжек по алгоритмам должен пользоваться терминологией правильно.
>> Согласен, когда диск нагружен, чтение и запись страдают
> Потрясающе, кто бы мог подумать.
Епта. Я еще на первой итерации это упомянул. Но ты слишком напыщен, чтобы поеимать, что тебе отвечают.
>> константа подрастает
> Через сколько итераций мы выясним что на некоторых паттернах эта константа начинает
> закрывать собой Эйфелеву башню?
Ты опять путаещь зависимость от объема данных, и от интенсивности запросов. Плохо для знатока терминологии.
>> Можно сказать, что появляется завсисимость от интенсивности и характера запросов/нагрузки
> Но можно, разумеется, и не говорить. А продолжать рассказывать про О(1). Ведь
> в случае с огромным количеством данных и одним запросом в месяц
> это действительно будет так.
Но комментс.
>> Понятно, что чем больше мусора производится, тем медленнее вся система.
> Нет, непонятно.
> Всё зависит от того как именно он производится, какую структуру имеет, и
> как именно собирается. Легко найти случаи когда система, производящая больше мусора
> будет быстрее чем производящая меньше.
Конечно, если производящая меньше изначально не эффективна. Это тоже самое, что и наш с тобою разговор про сложность алгоритмов, и лучший/худший случай.
>> Но в целом, получается лучше, чем альтернативы.
> Нет, не получается. А выражение "в целом" требует расшифровки, подробной и внятной.
С тобою даже пельмени в целом не получатся.
>> В общем, правда, что серебрянной пули нет.
> Замечательно что потребовалось так мало времени чтобы это выяснить.
Ну ни фига ж себе. Как будто я где-то утверждал, что она есть.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено vatocefal , 18-Авг-16 13:39

>То что не только первоначальная эйфория, связанная с LSM, но и вторая волна - подход "достаточно снизить compaction frequency и свести большинство этой деятельности к hot data key-ranges" - уже остались в прошлом, вы не заметили.
Где посмотреть, что сейчас придумали вместо?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 18-Авг-16 22:23

Не "вместо", в дополнение к прошлым ухищрениям. Поиски что бы такого с LSM сделать чтоб оно всё-таки не так тормозило продолжаются. Про "вместо" никому неинтересно, в моде только LSM.
http://dl.acm.org

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 19-Авг-16 10:50

в б-ве юзеркейзов проще юзать вещи вроде LMDB в проектах, где изящно обошли проблемы "мысля вне коробки", во многом. пусть там и более скромная(изначально)функциональность.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 19-Авг-16 11:26

В LMDB своих причуд хватает - на уровне технического исполнения, так что лучше форк https://github.com/ReOpen/libmdbx

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 20-Авг-16 15:40

ну, безупречных вещей нет и LMDB использована сугубо "для примера". но это в б-ве случаев - Хорошая штука и она реально РАБОТАЕТ.
это больше от Подхода к созданию проектов зависит и Идеологии, Опыта.
кому-то беркли, кому-то LMDB, кому-то redis а кому-то вообще mnesia или касандра и прочие гиппопотамы.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено rob pike , 21-Авг-16 15:51

Работает, когда не не работает[1]. LevelDB тоже работает при определенных обстоятельствах[2]. При большом везении работает даже Cassandra[3], Redis[4] и MongoDB[5]. Про Mnesia спросите эрлангистов, лучше непублично, они расскажут почему ей никто не пользуется. BerkeleyDB пытались заставить работать уже столько поколений, что цензурно о ней сложно говорить.
[1] https://github.com/ReOpen/ReOpenLDAP/issues/1
[2] https://twitter.com/alexeyraga/status/729087004806242304
[3] https://aphyr.com/posts/294-jepsen-cassandra
[4] https://aphyr.com/posts/283-jepsen-redis
[5] https://engineering.meteor.com/mongodb-queries-dont-always-r...
И перестаньте писать идеологию и опыт с большой буквы.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Led , 21-Авг-16 22:23

> При большом везении работает даже Cassandra[3], Redis[4] и MongoDB[5]. Про Mnesia
> спросите эрлангистов, лучше непублично, они расскажут почему ей никто не пользуется.
> BerkeleyDB пытались заставить работать уже столько поколений, что цензурно о ней
> сложно говорить.
Да, всё вышеперечисленное - работает. Ты просто рукожопый гуманитарий на ставке у опеннета.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 21-Авг-16 23:41

зря вы так. куча проектов на все этом есть.
те что на редис - я даже подпиливал порой за деньгу, когда-то.
а про мнезию - это в эмбеддовке, специфический рынок и специфические кадры этим заняты, что никто не в курсе - нормально. страшнее только авиаторы и военка в этом плане и непрозрачнее.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено vatocefal , 19-Авг-16 15:56

А что из существующих реализаций самое продвинутое? Чтобы код можно было посмотреть.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено funny_falcon , 17-Авг-16 19:51

Поправляюсь:
"Ощущать себя" - не является достаточным условием, но является необходимым.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 17-Авг-16 10:55

Как оно в сравнении с rocksdb?
Вторичные индексы это хорошо, когда они действительно заработают

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено adolfus , 17-Авг-16 19:42

Чем оно отличается от BerkeleyDB?

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 19-Авг-16 10:02

> Чем оно отличается от BerkeleyDB?
можно крутить хранение данных Явно в отличие от, двигая между подходами принудительно.
нету проблем лицензионных(оркаль и ко).
медленее.
а так - набор фич таки-разный, Если вчитываться.
и таки-да, беркли чуть пошустрее, но учитывая разницу в динамике развития я бы не сильно расчитывал что это надолго.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 18-Авг-16 04:18

Автору благодарности

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Шарпей , 18-Авг-16 12:57

А для C# у них обёртка есть? Вижу только для джавы и хипстерских руби-питонов.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 19-Авг-16 10:03

> А для C# у них обёртка есть? Вижу только для джавы и
> хипстерских руби-питонов.
C# еще более хипстерский, внезапно.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Шарпей , 19-Авг-16 23:38

C# не может быть более хипстерским, потому что у него есть компилятор, в том числе и в нэйтив код. А питоновские скриптики - это баловство для школьников, которое по некоторому недоразумению слишком часто стало применяться в крупных проектах.

"Выпуск встраиваемой СУБД Sophia 2.2"
Отправлено Аноним , 20-Авг-16 15:42

> C# не может быть более хипстерским, потому что у него есть компилятор,
> в том числе и в нэйтив код. А питоновские скриптики -
> это баловство для школьников, которое по некоторому недоразумению слишком часто стало
> применяться в крупных проектах.
"компилятор как показатель" не работает. тк он есть у всего почти. и у бидона есть компиляторы и у жабы и у эрланга. даже для хаскеля с пэхэпэ делали, но недоделали.