Skip to main content

Исследователи Apple нашли новый мультимодальный метод быстрого обучения больших языковых моделей (LLM), который может обеспечить более гибкие и мощные системы машинного обучения и типа «ИИ».

В исследовательском документе, опубликованном компанией на исследовательском сайте arxiv.org ранее на этой неделе, показано, что Apple использовала то, что она называет «тщательным сочетанием» подписей к изображениям, чередующихся изображений-текста и только текстовых данных для обучения LLM. Сочетание визуальных и языковых данных позволило моделям решать такие задачи, как создание разумных подписей к изображениям или выведение значений на естественном языке.

В ходе исследования было установлено, что выбор кодировщика изображений и разрешения обрабатываемых им изображений оказывает большое влияние на производительность, больше, чем конструкция разъема «зрение-язык».

В одном случае с использованием модели MM1 с 30 миллиардами параметров было обнаружено, что у людей есть сильные способности к контекстному обучению. Открытие означает, что он может выполнять многоэтапные рассуждения над несколькими изображениями с небольшим количеством подсказок «цепочки мыслей».

По данным Venturebeat, Apple продолжает традицию быть «быстрым последователем», а не «первопроходцем», когда дело касается революционных технологий. Генеральный директор Тим Кук недавно признал, что компания тратит 1 миллиард долларов в год на внедрение искусственного интеллекта в существующие технологии.

Кук сказал, что компания поделится «подробностями нашей текущей работы в области ИИ позднее в этом году». Ожидается, что Apple сделает некоторые объявления о своих достижениях на WWDC в июне этого года.

Компания догоняет конкурентов в использовании технологий, связанных с искусственным интеллектом. Компания также разрабатывает методы, которые сохранят конфиденциальность пользователей и одновременно расширят существующие возможности машинного обучения.

Последняя забота о конфиденциальности и безопасности не была характерна для существующих сервисов типа «чат-бот» и усложняет задачу для Apple.

Интерес Apple к многомодельному обучению нейронных сетей привел к созданию современной производительности, позволяющей проводить многоэтапные рассуждения. Это говорит о том, что компания нашла путь к быстрому развитию способностей машинного обучения, а также к предоставлению им расширенных «интеллектуальных» возможностей.