Возрастное ограничение 12+

Eliciting Reasoning in Language Models with Cognitive Tools

23.06.2025 05:59 Наука

Описание

Выявление рассуждений в языковых моделях с помощью когнитивных инструментов


В статье представлены когнитивные инструменты как новый метод выявления рассуждений в больших языковых моделях. Вдохновленные когнитивной психологией и когнитивными архитектурами, эти инструменты инкапсулируют специфические, модульные операции рассуждения. Реализованные в рамках фреймворка агентного вызова инструментов, БЯМ решает, когда вызывать внутренние когнитивные инструменты. Ключевые когнитивные инструменты включают понимание вопроса, припоминание связанной информации, проверку ответов на ошибки и откат от ошибочных путей рассуждений. Каждый инструмент выполняется как изолированный промпт, передавая структурированный вывод обратно основному процессу БЯМ. Эксперименты проводились на сложных бенчмарках математических рассуждений, таких как AIME, MATH500 и AMC. Результаты показывают, что оснащение базовых БЯМ этими когнитивными инструментами приводит к значительному повышению производительности по сравнению с базовыми моделями и когнитивным промптингом. Наблюдалось конкретное повышение производительности на различных моделях с открытым и закрытым весом, таких как Qwen, Llama и GPT-4.1. Примечательно, что GPT-4.1, дополненная когнитивными инструментами, достигла производительности на AIME, сопоставимой с моделью o1-preview, обученной методом обучения с подкреплением, без дополнительного обучения. Эта работа предполагает, что модульные структуры могут эффективно раскрывать скрытые возможности рассуждения в базовых моделях, предоставляя интерпретируемую альтернативу или дополнение к обучению с подкреплением для выявления рассуждений.


документ - https://arxiv.org/pdf/2506.12115v1
подписаться - https://t.me/arxivdotorg
создано с помощью NotebookLM

Автор

Paper debate
Paper debate