Начните с RAG
Здесь retrieval — правильный первый шаг. Постройте надёжный слой retrieval, измерьте grounding и возвращайтесь к fine-tuning, только если останется конкретный пробел в поведении.
Выбирайте это, когда
- Вы добавляете знания, которых у модели нет
- Информация меняется или ответы должны ссылаться на источники
- У вас пока нет большого чистого обучающего набора
Компромиссы
- Длинные промпты — выше стоимость и задержка на вызов
- Качество retrieval становится отдельной вещью, которую надо проектировать и измерять
- Сам по себе не изменит глубоко въевшийся стиль или формат