Китайська компанія Alibaba представила «орієнтовану на можливості міркувань» ШІ-модель QwQ-32B-Preview.
Експериментальна розробка представлена сфокусованою на штучному інтелекті командою Qwen. У рамках попереднього випуску нейромережа «демонструє перспективні аналітичні здібності» з деякими обмеженнями.
QwQ-32B-Preview має 32,5 млрд параметрів — показник відображає навички розв’язання проблем.
ШІ від Alibaba перевершує o1 від OpenAI в тестах AIME і MATH. Перший оцінює продуктивність моделі, другий складається з набору словесних завдань.
QwQ-32B-Preview здатна розв’язувати логічні головоломки та відповідати на складні математичні запитання. При цьому китайський техгігант зазначив, що модель має проблеми на кшталт змішування мов і несподіваного перемикання між ними, а також впадання в цикл кругового мислення, що призводить до довгих відповідей без остаточного результату.
QwQ-32B-Preview та інші орієнтовані на міркування моделі сконцентровані на ефективній перевірці фактів, завдяки чому точніше дають відповідь. Для цього їм потрібно більше часу на роздуми.
У жовтні стало відомо про роботу Google над «здатним міркувати як людина» ШІ.
Нагадаємо, у серпні Alibaba запустила групу великих мовних моделей з акцентом на математику під назвою Qwen2-Math, які «перевершують GPT-4o і Claude 3.5» у цій галузі.