LangChainMiddleTechnical

Как поддерживать legacy-код на LLMChain в LangChain и когда стоит мигрировать его на LCEL или LangGraph?

LLMChain — deprecated-класс; для простых pipeline достаточно заменить его на LCEL-цепочку через оператор |, для разветвлённой логики с состоянием — мигрировать на LangGraph.

Что такое LLMChain и почему он считается legacy

LLMChain — это базовый класс из ранних версий LangChain, который объединяет языковую модель (llm), шаблон промпта (PromptTemplate) и опциональный парсер вывода. Принцип работы прост: цепочка принимает словарь входных переменных, форматирует промпт и вызывает LLM. Начиная с LangChain 0.1.0+ класс помечен как @deprecated, а в 0.3.x большинство вызовов уже выдают предупреждения о скором удалении.

Как поддерживать существующий код на LLMChain

Пока кодовая база не мигрирована, можно продолжать использовать LLMChain без Breaking Changes, зафиксировав версию пакета:

pip install "langchain==0.1.20" "langchain-openai==0.1.8"

В самом коде типовой паттерн выглядит так:

from langchain.chains import LLMChain
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)
prompt = PromptTemplate(
    input_variables=["topic"],
    template="Explain {topic} in simple terms."
)
chain = LLMChain(llm=llm, prompt=prompt)

result = chain.invoke({"topic": "quantum entanglement"})
print(result["text"])

Если нужно подавить предупреждения на время поддержки без миграции, установите переменную окружения:

export LANGCHAIN_SUPPRESS_DEPRECATION_WARNINGS=true

Когда мигрировать на LCEL

LCEL (LangChain Expression Language) — декларативный способ описания цепочек через оператор |. Миграция с LLMChain на LCEL — минимальная операция, которую стоит сделать при первом же касании файла:

from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)
prompt = ChatPromptTemplate.from_template("Explain {topic} in simple terms.")
parser = StrOutputParser()

# Эквивалент LLMChain, но без устаревшего класса
chain = prompt | llm | parser

result = chain.invoke({"topic": "quantum entanglement"})
print(result)  # строка, а не словарь

LCEL даёт встроенную поддержку стриминга (chain.stream()), батчинга (chain.batch()), асинхронного запуска (await chain.ainvoke()) и автоматическую интеграцию с LangSmith без дополнительной настройки.

Когда мигрировать на LangGraph

LangGraph нужен, когда логика выходит за рамки линейного pipeline:

  • Требуется разветвление (условные переходы между шагами).
  • Нужны циклы: агент повторяет запрос к инструменту до получения нужного ответа.
  • Важна персистентность состояния между сессиями (MemorySaver, SqliteSaver).
  • Несколько агентов взаимодействуют параллельно или последовательно.
from langgraph.graph import StateGraph, END
from typing import TypedDict

class State(TypedDict):
    topic: str
    explanation: str

def explain_node(state: State) -> State:
    chain = prompt | llm | parser
    state["explanation"] = chain.invoke({"topic": state["topic"]})
    return state

graph = StateGraph(State)
graph.add_node("explain", explain_node)
graph.set_entry_point("explain")
graph.add_edge("explain", END)

app = graph.compile()
result = app.invoke({"topic": "quantum entanglement", "explanation": ""})
print(result["explanation"])

Стратегия пошаговой миграции

  • Аудит: найдите все вхождения LLMChain, from langchain.chains import через grep или rigrep.
  • Заменяйте цепочки файл за файлом, не трогая интерфейс модуля снаружи.
  • Проверяйте тип возвращаемого значения: LLMChain.invoke возвращает dict, LCEL — скалярное значение или объект, в зависимости от парсера.
  • Сначала переводите изолированные утилиты, потом основные пайплайны.

Подводные камни

  • Тип возвращаемого значения изменился: LLMChain.invoke всегда возвращает {"text": "...", ...}, а LCEL с StrOutputParser возвращает строку напрямую — все обращения к result["text"] сломаются.
  • input_variables больше не проверяются автоматически: в LCEL ошибка несоответствия переменных промпта обнаруживается только в runtime.
  • output_key в LLMChain: если вы меняли output_key="answer", после миграции его нет — парсер сам определяет формат вывода.
  • Callbacks изменились: старые callback_manager и callbacks=[...] в конструкторе LLMChain работают иначе — в LCEL передавайте config={"callbacks": [...]} в invoke().
  • verbose=True даёт другой вывод: в LCEL логирование идёт через LangSmith-трейсинг, а не через stdout напрямую.
  • Версионные конфликты: langchain-community и langchain-core имеют независимые версии — при обновлении одного пакета другой может сломаться из-за несовместимого API.
  • memory в LLMChain: если цепочка использует ConversationBufferMemory, при переходе на LCEL память нужно передавать вручную через MessagesPlaceholder — автоматической интеграции нет.

Common mistakes

  • Отвечать определением без production-сценария.
  • Не называть runtime boundary, security boundary или failure mode.
  • Игнорировать версию API, observability и тестовую проверку.

What the interviewer is testing

  • Объясняет механизм своими словами и без выдуманных API.
  • Называет реальные риски, диагностику и критерий корректности.
  • Связывает ответ с текущей документацией и миграционными ограничениями.

Sources

Related topics