Возрастное ограничение 12+

Eliciting Reasoning in Language Models with Cognitive Tools

23.06.2025 05:59 Наука

Описание

Выявление рассуждений в языковых моделях с помощью когнитивных инструментов

В статье представлены когнитивные инструменты как новый метод выявления рассуждений в больших языковых моделях. Вдохновленные когнитивной психологией и когнитивными архитектурами, эти инструменты инкапсулируют специфические, модульные операции рассуждения. Реализованные в рамках фреймворка агентного вызова инструментов, БЯМ решает, когда вызывать внутренние когнитивные инструменты. Ключевые когнитивные инструменты включают понимание вопроса, припоминание связанной информации, проверку ответов на ошибки и откат от ошибочных путей рассуждений. Каждый инструмент выполняется как изолированный промпт, передавая структурированный вывод обратно основному процессу БЯМ. Эксперименты проводились на сложных бенчмарках математических рассуждений, таких как AIME, MATH500 и AMC. Результаты показывают, что оснащение базовых БЯМ этими когнитивными инструментами приводит к значительному повышению производительности по сравнению с базовыми моделями и когнитивным промптингом. Наблюдалось конкретное повышение производительности на различных моделях с открытым и закрытым весом, таких как Qwen, Llama и GPT-4.1. Примечательно, что GPT-4.1, дополненная когнитивными инструментами, достигла производительности на AIME, сопоставимой с моделью o1-preview, обученной методом обучения с подкреплением, без дополнительного обучения. Эта работа предполагает, что модульные структуры могут эффективно раскрывать скрытые возможности рассуждения в базовых моделях, предоставляя интерпретируемую альтернативу или дополнение к обучению с подкреплением для выявления рассуждений.

документ - https://arxiv.org/pdf/2506.12115v1
подписаться - https://t.me/arxivdotorg
создано с помощью NotebookLM

Автор

Paper debate

Похожие видео

ВАРИАНТЫ СТРОЕНИЯ СРЕДИННОГО НЕРВА #узи #нервов

1 0:48

Россия выбрала стратегию: «Третий Рим» — контроль Восточной Европы и Средней Азии (05.02.2025)

1 37:04

АСТЕРОИД YR4 Уничтожит человечество? Натан Эйсмонт ✅ Полный выпуск на канале "Глеб Соломин #космос

1 0:58

Интервью с проректором по науке ЛГУ им.В.Даля: Научная траектория для будущих студентов

1 4:50

"Падение Константинополя". Доцент МПГУ Е.С.Носова на радио Маяк в программе "Стиллавин Today"

1 13:05