RubyMiddleCoding

Что такое inject/reduce в Ruby и как они работают?

inject/reduce свёртывают коллекцию в одно значение: блок принимает аккумулятор и текущий элемент, возвращает новый аккумулятор. Поддерживают начальное значение, символьный shorthand (:+, :*) и являются полными синонимами.

inject и reduce в Ruby

inject и reduce — полные синонимы в Ruby (оба определены в модуле Enumerable). Они свёртывают коллекцию в одно значение, последовательно применяя бинарную операцию к аккумулятору и текущему элементу.

Базовый синтаксис

# Форма с начальным значением и блоком
[1, 2, 3, 4].inject(0) { |sum, x| sum + x }  # => 10

# Форма без начального значения (первый элемент = начальный аккумулятор)
[1, 2, 3, 4].inject { |sum, x| sum + x }  # => 10

# Форма с символом (shorthand через Symbol#to_proc)
[1, 2, 3, 4].inject(:+)   # => 10
[1, 2, 3, 4].inject(10, :+)  # => 20 (начало с 10)

# reduce — то же самое
[1, 2, 3, 4].reduce(:*)   # => 24 (факториал)

Как работает внутри

На каждой итерации блок получает два аргумента: memo (аккумулятор) и element (текущий элемент). Возвращаемое значение блока становится новым memo.

# Трассировка выполнения
[1, 2, 3, 4].inject(0) do |memo, el|
  puts "memo=#{memo}, el=#{el}"
  memo + el
end
# memo=0, el=1
# memo=1, el=2
# memo=3, el=3
# memo=6, el=4
# => 10

Практические примеры

# Построить хеш из массива
words = ["apple", "banana", "cherry"]
words.inject({}) do |hash, word|
  hash[word] = word.length
  hash  # важно вернуть hash!
end
# => { "apple" => 5, "banana" => 6, "cherry" => 6 }

# Найти максимум без Enumerable#max
[3, 1, 4, 1, 5, 9].inject { |max, x| x > max ? x : max }
# => 9

# Вложенная структура — flatten вручную
[[1, 2], [3, 4], [5]].inject([]) { |acc, arr| acc + arr }
# => [1, 2, 3, 4, 5]

# Подсчёт частоты слов
%w[cat dog cat bird dog cat].inject(Hash.new(0)) do |counts, word|
  counts[word] += 1
  counts
end
# => { "cat" => 3, "dog" => 2, "bird" => 1 }

inject vs each_with_object

each_with_object — альтернатива для случаев, когда аккумулятор — изменяемый объект (хеш, массив). Разница: в each_with_object блок получает элемент первым, объект вторым, и объект передаётся по ссылке без необходимости его возвращать.

# inject — нужно возвращать hash
words.inject({}) { |h, w| h[w] = w.length; h }

# each_with_object — удобнее для мутируемых объектов
words.each_with_object({}) { |w, h| h[w] = w.length }

Подводные камни

  • Если блок не возвращает аккумулятор явно, результат следующей итерации будет nil — классическая ошибка при работе с хешами.
  • Без начального значения на пустой коллекции inject возвращает nil; с начальным значением — возвращает это значение. Важно при потенциально пустых массивах.
  • Символьная форма inject(:+) не работает, если в коллекции разнородные типы (например, строки и числа) — вызовет NoMethodError.
  • inject создаёт много промежуточных объектов при конкатенации строк — для строк лучше join или << мутация в each_with_object.
  • На очень больших коллекциях (миллионы элементов) inject медленнее нативных методов типа sum, min, max.
  • Путаница порядка аргументов: в inject|memo, element|, в each_with_object|element, memo|.

Common mistakes

  • Сводить inject reduce к названию метода без lifecycle и failure path.
  • Игнорировать модель runtime: объектная динамическая модель Ruby, где почти всё является объектом, а методы ищутся через ancestor chain.
  • Не отделять validation, authorization, transaction boundary и business logic.

What the interviewer is testing

  • Объясняет inject reduce через конкретную точку lifecycle в Ruby.
  • Приводит корректный минимальный пример без вымышленных методов или callbacks.
  • Называет edge cases: пустые значения, ошибки, транзакции, безопасность или concurrency.

Sources

Related topics