Eliciting Reasoning in Language Models with Cognitive Tools
Описание
Выявление рассуждений в языковых моделях с помощью когнитивных инструментов
В статье представлены когнитивные инструменты как новый метод выявления рассуждений в больших языковых моделях. Вдохновленные когнитивной психологией и когнитивными архитектурами, эти инструменты инкапсулируют специфические, модульные операции рассуждения. Реализованные в рамках фреймворка агентного вызова инструментов, БЯМ решает, когда вызывать внутренние когнитивные инструменты. Ключевые когнитивные инструменты включают понимание вопроса, припоминание связанной информации, проверку ответов на ошибки и откат от ошибочных путей рассуждений. Каждый инструмент выполняется как изолированный промпт, передавая структурированный вывод обратно основному процессу БЯМ. Эксперименты проводились на сложных бенчмарках математических рассуждений, таких как AIME, MATH500 и AMC. Результаты показывают, что оснащение базовых БЯМ этими когнитивными инструментами приводит к значительному повышению производительности по сравнению с базовыми моделями и когнитивным промптингом. Наблюдалось конкретное повышение производительности на различных моделях с открытым и закрытым весом, таких как Qwen, Llama и GPT-4.1. Примечательно, что GPT-4.1, дополненная когнитивными инструментами, достигла производительности на AIME, сопоставимой с моделью o1-preview, обученной методом обучения с подкреплением, без дополнительного обучения. Эта работа предполагает, что модульные структуры могут эффективно раскрывать скрытые возможности рассуждения в базовых моделях, предоставляя интерпретируемую альтернативу или дополнение к обучению с подкреплением для выявления рассуждений.
документ - https://arxiv.org/pdf/2506.12115v1
подписаться - https://t.me/arxivdotorg
создано с помощью NotebookLM
Автор

Похожие видео

ВАРИАНТЫ СТРОЕНИЯ СРЕДИННОГО НЕРВА #узи #нервов

Россия выбрала стратегию: «Третий Рим» — контроль Восточной Европы и Средней Азии (05.02.2025)

НАУЧНЫЕ КОШМАРЫ: Безумные опыты XX века

Падение древнего Египта, куда делись последние фараоны

.... Африка - Что мы знаем про неё....

АСТЕРОИД YR4 Уничтожит человечество? Натан Эйсмонт ✅ Полный выпуск на канале "Глеб Соломин #космос

Интервью с проректором по науке ЛГУ им.В.Даля: Научная траектория для будущих студентов
