DockerMiddleTechnical

Зачем контейнер должен писать логи в stdout/stderr, а не в файл?

stdout/stderr перехватываются Docker log driver автоматически, доступны через docker logs и любой сборщик (Loki, Fluentd, CloudWatch) без изменения кода; файловые логи теряются при удалении контейнера и невидимы для оркестраторов.

Зачем писать логи в stdout/stderr, а не в файл?

Это принцип 12-Factor App (фактор XI — Logs). Контейнер не знает, где он запущен, кто его читает и как долго проживёт. stdout/stderr — это единственный универсальный канал вывода.

Причина 1 — Docker log drivers собирают stdout/stderr автоматически

Всё, что процесс пишет в stdout/stderr, Docker перехватывает и передаёт настроенному log driver:

# Просмотр логов любого контейнера
docker logs --tail 100 -f my-container

# Конфигурация log driver в daemon.json
# /etc/docker/daemon.json
{
  "log-driver": "json-file",
  "log-opts": {
    "max-size": "100m",
    "max-file": "3"
  }
}

Доступные драйверы: json-file (по умолчанию), journald, syslog, fluentd, awslogs, gcplogs, splunk, loki. Переключение между ними не требует изменения кода приложения.

Причина 2 — Эфемерная файловая система контейнера

Если приложение пишет логи в /var/log/app.log внутри контейнера:

  • При удалении контейнера все логи теряются.
  • При рестарте (crash) логи до краша могут быть недоступны.
  • Диск контейнера (overlay2) ограничен и не предназначен для длительного хранения.

Причина 3 — Централизованный сбор логов

# docker-compose.yml с Loki
services:
  app:
    image: my-app:latest
    logging:
      driver: loki
      options:
        loki-url: "http://loki:3100/loki/api/v1/push"
        loki-batch-size: "400"

Fluentd/Fluent Bit, Filebeat, Vector — все они нативно умеют читать stdout Docker-контейнеров через Docker socket или log files в /var/lib/docker/containers/. Если логи в файле внутри контейнера — нужен дополнительный sidecar или volume.

Причина 4 — Kubernetes и оркестраторы ожидают stdout

# Kubernetes читает логи контейнера из stdout
kubectl logs my-pod -c my-container

# Если логи в файле — kubectl logs ничего не покажет
# Нужен дополнительный sidecar: log-agent читает файл и пишет в stdout

Как настроить приложение на вывод в stdout

# Python (logging)
import logging
import sys

logging.basicConfig(
    stream=sys.stdout,
    level=logging.INFO,
    format="%(asctime)s %(levelname)s %(name)s %(message)s"
)
// Node.js — console.log/error уже пишет в stdout/stderr
// Для production используй pino:
import pino from "pino";
const logger = pino({ level: "info" });  // пишет JSON в stdout
# Nginx: перенаправляем access/error log в stdout/stderr
# /etc/nginx/nginx.conf
http {
  access_log /dev/stdout combined;
  error_log /dev/stderr warn;
}

Ротация логов

При log driver json-file логи хранятся в /var/lib/docker/containers/[id]/[id]-json.log. Без ограничений диск переполнится:

docker run --log-opt max-size=50m --log-opt max-file=5 my-app:latest

Подводные камни

  • Буферизация stdout: Python по умолчанию буферизует вывод в stdout — при краше последние логи могут не появиться. Используй PYTHONUNBUFFERED=1 или python -u.
  • json-file без max-size заполняет диск хоста при интенсивном логировании — всегда настраивай ротацию в daemon.json или через --log-opt.
  • docker logs работает только с json-file и journald драйверами. При переключении на fluentd или awslogs команда docker logs перестаёт работать.
  • Смешивание stdout и stderr в одном потоке теряет семантику уровня логирования — INFO в stdout, ERROR/WARN в stderr; это позволяет алертить только по stderr.
  • При очень высоком throughput логов json-file становится узким местом (JSON-сериализация, fsync). В этом случае используй journald или прямой вывод в Fluentd через unix socket.
  • Sidecar-контейнер для чтения файловых логов увеличивает сложность и создаёт риск потери логов при рестарте sidecar.

Common mistakes

  • Писать application logs только в файл внутри контейнера.
  • Не настраивать rotation для json-file logging driver на single-host Docker.
  • Смешивать secrets или PII в stdout без фильтрации и retention policy.

What the interviewer is testing

  • Объясняет stdout/stderr как runtime logging contract.
  • Понимает docker logs и logging drivers.
  • Учитывает rotation, centralized logging and privacy.

Sources

Related topics