Question 1

Как устроен B-tree и почему поиск в нём логарифмический?

Accepted Answer

B-tree - сбалансированное дерево из страниц. Корень и внутренние страницы
хранят разделители: ключ плюс ссылку на дочернюю страницу. Листья хранят
ключи в отсортированном порядке и ссылки на строки кучи (`ctid`). Поиск
идёт от корня вниз: на каждом уровне по разделителям выбираем нужную
ветку, за несколько шагов (высота дерева) приходим в лист. Высота растёт
логарифмом от числа строк, поэтому даже на миллиардах записей это
единицы обращений к страницам. Листья связаны ссылками влево-вправо, что
даёт быстрый диапазонный обход и `ORDER BY` без отдельной сортировки.

Question 2

Что делает условие непригодным для индекса? Объясни sargability.

Accepted Answer

Индекс по столбцу хранит значения самого столбца. Если в условии столбец
завёрнут в функцию или выражение - `WHERE lower(email) = 'a@b.c'`,
`WHERE created_at::date = '2024-01-01'`, `WHERE id + 0 = 5` - индекс по
сырому столбцу не подходит: в нём нет значений `lower(email)`. То же с
`LIKE '%abc'`: ведущий процент убивает возможность спуститься по дереву,
потому что неизвестно начало строки. Условие, которое индекс может
использовать напрямую, называют sargable. Лечится тремя способами:
переписать предикат, чтобы столбец был «голым»; построить индекс по
выражению (`CREATE INDEX ON t (lower(email))`); для шаблонов и подстрок
взять trigram-индекс (`pg_trgm`).

Question 3

Как выбрать порядок столбцов в составном индексе?

Accepted Answer

Составной индекс `(a, b, c)` - это отсортированный список по `a`, внутри
равных `a` по `b`, и так далее. Поэтому он работает для условий на левый
префикс: `a`, `a` и `b`, `a` и `b` и `c`. По одному только `b` или по
паре `b, c` без `a` он бесполезен. Правило: первым ставят столбец, по
которому всегда идёт равенство, последним - тот, по которому диапазон или
сортировка. Столбец из `WHERE a = ? AND b > ?` хорошо ложится на индекс
`(a, b)`, а `(b, a)` тут уже хуже. Порядок столбцов это не косметика, от
него напрямую зависит, возьмёт ли планировщик индекс.

Question 4

Что такое index-only scan и при чём тут карта видимости?

Accepted Answer

Обычный индексный скан находит в индексе `ctid` и идёт в кучу за самой
строкой - проверить видимость и забрать остальные столбцы. Если индекс
содержит все нужные запросу столбцы (покрывающий, в том числе через
`INCLUDE`), хождение в кучу можно было бы пропустить. Но индекс не хранит
информацию о видимости версий. Спасает карта видимости (VM): если
страница в ней помечена «все версии видны всем», строку из кучи можно не
читать. Поэтому index-only scan эффективен только на хорошо
провакуумленных таблицах с актуальной VM. Под нагрузкой из UPDATE без
своевременного vacuum index-only scan вырождается в обычный с массой
`Heap Fetches`.

Question 5

Когда нужен GIN-индекс и как он устроен?

Accepted Answer

GIN (generalized inverted index) - инвертированный индекс: он хранит не
«строка -> значение», а «элемент -> список строк, где он встречается».
Это то, что нужно для составных значений: полнотекстовый поиск (слово ->
документы), `jsonb` (ключ или путь -> строки), массивы (элемент ->
строки). Запрос `WHERE tags @> '{postgres}'` или `WHERE doc @@
to_tsquery('...')` GIN обслуживает напрямую. Цена - дорогая вставка и
обновление: один UPDATE документа задевает много элементов индекса.
Сглаживает это отложенный список ожидающих записей (`fastupdate`), но он
добавляет периодическую дочистку. GIN большой и медленный на запись, зато
незаменим на поиске по содержимому.

Question 6

Когда BRIN выгоднее B-tree?

Accepted Answer

BRIN (block range index) хранит не значения строк, а сводку по диапазонам
блоков: для каждого участка таблицы запоминает минимум и максимум
значения. Индекс получается крошечный - килобайты там, где B-tree занял
бы гигабайты. Работает он только при хорошей корреляции: если значения
физически растут вместе с порядком строк (типичный пример - столбец
времени в таблице, куда пишут по возрастанию), то по диапазону можно
сразу отбросить блоки, чьи min/max не подходят. На плохо
коррелированных данных BRIN бесполезен: подходящие строки разбросаны по
всем блокам, отбрасывать нечего. Это индекс для больших append-only
таблиц с естественным порядком.

Question 7

GiST, SP-GiST, GIN - для каких задач каждый?

Accepted Answer

GiST (generalized search tree) - каркас для деревьев по «неточным»
предикатам: геометрия и `PostGIS` (пересечение, близость), диапазонные
типы, поиск ближайших соседей (`ORDER BY point <-> target`). SP-GiST -
его родственник для несбалансированных структур: квадродеревья,
префиксные деревья, данные с естественным разбиением пространства. GIN -
инвертированный индекс для составных значений: full-text, jsonb, массивы.
Грубое правило: ищешь по геометрии, диапазонам и ближайшим соседям -
GiST; по содержимому документа, массива или jsonb - GIN; экзотическая
пространственная структура с неравномерным разбиением - SP-GiST. У
каждого свой набор классов операторов под конкретные типы.

Question 8

Что такое класс операторов и зачем он индексу?

Accepted Answer

Индекс сам по себе не знает, как сравнивать значения конкретного типа -
это знание даёт класс операторов (operator class). Он связывает тип
данных и метод доступа с набором операторов и опорных функций: для
B-tree это «меньше, меньше-равно, равно, больше» и функция сравнения.
Поэтому у одного типа бывает несколько классов под разные задачи.
Канонический пример - `text`: класс по умолчанию сортирует по локали и
обслуживает `=` и `ORDER BY`, но не годится для префиксного `LIKE` в
не-C локали; для него есть `text_pattern_ops`, который сравнивает
побайтово и делает `LIKE 'abc%'` индексируемым. Указывают класс при
создании индекса: `CREATE INDEX ON t (col text_pattern_ops)`.

Question 9

Когда уместен hash-индекс и какие у него ограничения?

Accepted Answer

Hash-индекс хранит хеш значения и обслуживает только равенство (`=`):
ни диапазонов, ни сортировки, ни префиксного поиска. За это он компактнее
B-tree на длинных ключах и на чистом `=` может быть чуть быстрее. До
PostgreSQL 10 hash-индексы не писались в WAL и не переживали сбой -
поэтому их избегали; начиная с 10 они полноценные и реплицируются. На
практике их ниша узкая: B-tree тоже прекрасно делает равенство и заодно
умеет диапазоны и сортировку, поэтому по умолчанию берут B-tree, а hash -
только когда ключ длинный, нужно строго равенство и размер индекса важен.

B-tree, GiST, GIN, BRIN, sargability