# fsck и recovery - проверка и восстановление ФС

_Файловая система · LinuxLab Knowledge Base_

**TL;DR:** fsck, проверка ФС на размонтированной файловой системе.
e2fsck (ext), xfs_repair (XFS), btrfs check (btrfs).
Journal replay при mount решает 90% проблем после crash'а.


## Когда что-то ломается

Файловая система может оказаться в "грязном" состоянии после:

- **Power loss / kernel panic** во время записи
- **Bad sectors** на HDD/SSD - storage stack вернул ошибку
- **Контроллер дисков** соврал про fsync (write-back cache без BBU)
- **Corruption памяти** (ECC, или её отсутствие)
- **Bug** в ядре или ФС
- **Случайная запись на raw device** мимо ФС

Симптомы:

- `Read-only file system` после mount (errors=remount-ro)
- `Structure needs cleaning` при следующем mount
- `Input/output error` при чтении конкретных файлов
- Странности `ls` (мусорные имена, файлы пропадают)
- Машина залипла на boot'е "checking filesystems..."

Стратегия:

1. **Стоп**. Не писать на повреждённую ФС.
2. **Backup raw device** (`dd` или `ddrescue`) - до любых правок.
3. Если есть журнал - попытаться replay при mount.
4. Если не помогло - offline fsck/repair.
5. Если и это не помогло - extract данных utility-средствами.

## Journal replay - автоматическая магия

При mount [ext4](/kb/ext4.md)/[xfs](/kb/xfs.md)/[btrfs](/kb/btrfs.md) видят, что предыдущий umount
был грязным, и **проигрывают журнал** - применяют закоммиченные но
не записанные изменения. Это занимает секунды и решает большинство
crash-сценариев.

Что увидишь в `dmesg`:

```
EXT4-fs (sda1): recovery required on readonly filesystem
EXT4-fs (sda1): write access will be enabled during recovery
EXT4-fs (sda1): mounted filesystem with ordered data mode
XFS (sdb1): Mounting V5 Filesystem
XFS (sdb1): Starting recovery (logdev: internal)
XFS (sdb1): Ending recovery (logdev: internal)
```

Если journal recovery упал - **тогда** fsck.

## fsck - frontend

`fsck` - универсальный wrapper, который смотрит тип ФС и зовёт
правильный инструмент:

| ФС | Реальный binary |
|----|-----------------|
| ext2/3/4 | `e2fsck` |
| xfs | **в fsck это `no-op`** - использовать `xfs_repair` напрямую |
| btrfs | `btrfs check` напрямую |
| vfat | `dosfsck` |
| jfs | `jfs_fsck` |

```bash
# Из fstab автоматом при boot'е
fsck -A           # все из fstab (passno > 0)
fsck /            # конкретный mountpoint
fsck /dev/sda1    # конкретное устройство
```

**Опции:**

| Опция | Что |
|-------|-----|
| `-A` | все из fstab |
| `-y` | "yes на все" - не безопасно если не знаешь о повреждении |
| `-n` | dry-run, только показать |
| `-f` | force даже на чистой ФС |
| `-V` | verbose |
| `-C` | progress bar |

**Главное правило:** ФС должна быть **размонтирована**. Live-fsck
на смонтированной ФС с записями = corruption. Допустимо `-n` (RO)
на смонтированной для diagnostics.

## e2fsck - ext-семейство

```bash
umount /dev/sda1
e2fsck -f /dev/sda1                # force, всегда
e2fsck -fy /dev/sda1               # auto-yes (для скриптов и desperate)
e2fsck -fp /dev/sda1               # preen - чинить безопасное, ругаться на остальное
```

Особые случаи:

```bash
# Используем backup-suberblock если основной побит
e2fsck -b 32768 /dev/sda1                    # на ext4 с 4K blocks
mke2fs -n /dev/sda1                          # покажет где backup'ы (без записи!)
dumpe2fs -h /dev/sda1 | grep -i backup       # на здоровой ФС
```

Что выводит при corruption:

```
Pass 1: Checking inodes, blocks, and sizes
Inode 12345 has illegal block(s).  Clear<y>?
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information
```

Файлы, потерявшие имя но имеющие inode, попадают в `/lost+found/`
по номеру inode'а. Содержимое читаемо, имя нужно восстановить
по содержимому.

## xfs_repair - XFS

```bash
umount /dev/sdb1
xfs_repair /dev/sdb1                # обычный
xfs_repair -n /dev/sdb1             # dry-run
xfs_repair -L /dev/sdb1             # ZERO LOG - последний шанс!
```

`-L` обнуляет журнал, теряя то что не было закоммичено. Делать
**только** если обычный `xfs_repair` падает с "log is corrupt or
cannot be read".

XFS не имеет `lost+found` концепции в том же виде - **orphan inode'ы**
переподключаются автоматически или удаляются.

## btrfs check / btrfs rescue

```bash
umount /dev/sdc1
btrfs check /dev/sdc1                  # только diagnostics
btrfs check --repair /dev/sdc1         # ОПАСНО - может усугубить!
```

**`btrfs check --repair` помечен как experimental годами.** Используй
только если нечего терять. Сначала `btrfs rescue`:

```bash
btrfs rescue super-recover /dev/sdc1   # восстановить super blocks
btrfs rescue chunk-recover /dev/sdc1   # восстановить chunk tree
btrfs rescue zero-log /dev/sdc1        # как xfs_repair -L
```

Если ФС не монтируется, попробуй RO:

```bash
mount -o ro,recovery,nologreplay /dev/sdc1 /mnt
```

и спасай данные `cp -a` или `btrfs send`.

## fstab - passno

Шестое поле fstab говорит когда fsck-it на boot'е:

```
UUID=...  /     ext4  defaults  0 1
UUID=...  /var  ext4  defaults  0 2
UUID=...  /tmp  tmpfs defaults  0 0
```

- **0** - не проверять
- **1** - root, проверяется первым
- **2** - проверяется после root, параллельно с другими `2`

XFS и btrfs ставят passno=0, потому что fsck для них - no-op (используют
свои tools при необходимости).

## errors=remount-ro

Опция mount, ставится в fstab:

```
UUID=...  /  ext4  defaults,errors=remount-ro  0 1
```

Когда ядро видит ошибку ФС - вместо panic'а перемонтирует в RO.
Это **спасает данные**: дальше пишет некуда, можно посмотреть `dmesg`,
размонтировать (или загрузиться с rescue) и сделать fsck.

Альтернативы: `errors=continue` (не делать ничего, опасно),
`errors=panic` (kernel panic, для embedded).

## ddrescue для умирающего диска

Когда HDD сыплется и обычный `dd` падает на bad-секторах:

```bash
ddrescue /dev/sda backup.img backup.log
```

Создаёт image, пропуская проблемные секторы (не зависает на них),
ведёт лог. Повторный запуск дочитывает только проблемные. Перед
любым `xfs_repair --L` или `btrfs check --repair` сначала
`ddrescue` копию.

## Восстановление файла

Если файл удалён, но inode не перезаписан:

- **ext4**: `extundelete /dev/sda1 --restore-file path/to/file`
  или `e2undel`. Размонтируй ФС перед запуском.
- **xfs**: `xfs_undelete` (community tool, не всегда работает).
- **btrfs**: можно достать из снапшота если он был. `btrfs restore`
  из broken-FS.
- **Любая**: photorec из testdisk-пакета - сигнатурный поиск
  по типам файлов.

Чем дольше ФС работает после удаления - тем меньше шансов.
Размонтировать сразу.

## Best practices

- **Бэкапы** делают fsck не нужным
- **errors=remount-ro** в fstab всегда
- **smartctl -a** мониторит S.M.A.R.T. - предсказывает крах
- **scrub** на btrfs/zfs раз в неделю
- **fsck -fp** при загрузке у 1-го passno - ловит мелочь
- **ddrescue** перед repair при подозрении на железо
- **Документировать UUID** разделов и backup-суперблоков

## Когда что-то пошло не так

- **`fsck.xfs ничего не делает`** - это норма, fsck.xfs - заглушка.
  Используй `xfs_repair`.
- **fsck завис** - `xfs_repair` на огромной ФС может занять часы.
  Не трогать.
- **`Bad superblock`** - ext4 backup-superblock через
  `e2fsck -b $BACKUP /dev/sda1`.
- **`UUID conflict`** - после `dd` копия ФС имеет тот же UUID.
  `tune2fs -U random /dev/sdb1`.
- **lost+found пустой после fsck** - нечего было восстанавливать
  как orphan, либо ФС была здорова.
- **system не загружается из-за fsck-fail** - boot из rescue (`init=/bin/sh`,
  USB-live), `e2fsck -fy /dev/sdaN` руками.


## Команды

```bash
sudo umount /dev/sdb1 && sudo e2fsck -fy /dev/sdb1
```
Размонтировать и проверить ext-ФС с force и auto-yes

```bash
sudo xfs_repair -n /dev/sdb1
```
Dry-run проверки XFS - покажет проблемы без правки

```bash
sudo dumpe2fs -h /dev/sda1 | grep -i 'last mount\|last check\|state'
```
Состояние ФС и время последней проверки - как часто чекается

```bash
sudo mount -o ro,noload /dev/sda1 /mnt/rescue
```
Read-only mount без journal replay - спасти данные с битой ФС

```bash
sudo ddrescue /dev/sda /backup/sda.img /backup/sda.log
```
Имидж умирающего диска - перед любыми попытками repair

```bash
sudo btrfs rescue zero-log /dev/sdc1
```
Btrfs: обнулить journal если log битый - последний шанс перед --repair

```bash
sudo mke2fs -n /dev/sdb1
```
Показать backup-superblocks без перезаписи - пригодится при corruption


## См. также

- [ext4 - рабочая лошадь Linux-ФС](/kb/ext4.md)
- [XFS - extents и параллельный I/O](/kb/xfs.md)
- [btrfs - copy-on-write, subvolumes и снапшоты](/kb/btrfs.md)
- [mount и /etc/fstab - подключение ФС](/kb/mount-and-fstab.md)
- [Block devices - диски в Linux](/kb/block-devices.md)