Skip to main content

Apple придется многое наверстать, если она хочет конкурировать с Google и OpenAI.

Google и OpenAI объявили о значительных обновлениях своих моделей и функций искусственного интеллекта, что создает большую конкуренцию Apple в преддверии WWDC.

В понедельник OpenAI анонсировала свою инновационную модель искусственного интеллекта GPT-4o и совершенно новое приложение для Mac, а во вторник Google анонсировала основные улучшения своего программного обеспечения Gemini. Обе компании продемонстрировали множество замечательных особенностей, что в результате сделало рынок еще более конкурентоспособным.

Хотя Apple, похоже, сильно отстает в своих начинаниях в области искусственного интеллекта, партнерство с Google или OpenAI может оказаться простым способом предложить своим пользователям функции генеративного искусственного интеллекта. По крайней мере, слухи предполагают, что Apple готова пойти по этому пути.

Обновления OpenAI

OpenAI недавно представила GPT-4o, новую мультимодальную версию модели GPT AI компании, которая содержит расширенные возможности обработки различных типов входных данных.

В отличие от своих предшественников, GPT-4o сможет использовать одну нейронную сеть для обработки звука, изображений и текста, в результате предлагая значительные улучшения моделей. Во время анонса продукта также рекламировалось увеличение скорости и языковой обработки.

GPT-4o от OpenAI сможет понимать и передавать эмоции. Во время недавнего мероприятия компании члены команды продемонстрировали это, попросив модель проанализировать выражение лица и определить конкретные эмоции, которые выражал пользователь.

Экран компьютера, на котором отображается гистограмма, сравнивающая основные строительные проекты римских императоров, с курсором, указывающим на полосу с надписью «Константин».

ChatGPT от OpenAI теперь официально доступен на macOS

Благодаря улучшенной функции голосового режима, которая обеспечивает вывод звука в виде речи, GPT-4o может регулировать тон своего голоса, делая его более роботизированным или более естественным в зависимости от запроса пользователя.

Компания также запустила новое настольное приложение ChatGPT, доступное для macOS, и представила новый API для разработчиков. GPT-4o будет доступен пользователям в процессе постепенного развертывания.

Обновления Google Gemini

Google на своей конференции разработчиков систем ввода-вывода во вторник представила множество улучшений своей модели Gemini. Новый и улучшенный Google Gemini сможет понимать более сложный пользовательский ввод и изображения, принимая во внимание контекст, стоящий за ними.

Логотип Google Gemini с линиями, пропущенными под звездой.

Google Gemini — инструмент генеративного искусственного интеллекта

Программное обеспечение искусственного интеллекта будет обладать новыми контекстно-зависимыми возможностями, а это означает, что оно сможет видеть все на экране, будь то PDF-файл, видео или серия текстовых сообщений. Gemini сможет собирать информацию и генерировать выходные данные, но только на некоторых устройствах Android.

Например, благодаря новой опции «Круг для поиска» пользователи смогут выбирать отдельные объекты на изображении и мгновенно получать результаты поиска Google об этом объекте.

Еще одна функция, доступная исключительно на Android, предоставит пользователям возможность анализировать видео YouTube и PDF-файлы с помощью Gemini Advanced. С помощью платной услуги пользователи смогут задавать конкретные вопросы и получать ответы, взятые из содержания указанного видео или PDF-файла.

Обновленный Gemini от Google сможет подводить итоги длительных разговоров и изолировать ключевую информацию из документов, изображений и видео, и все это будет очень полезно для конечных пользователей. Apple реализует аналогичные функции в своих собственных продуктах.

Что мы знаем о стратегии Apple в области искусственного интеллекта на данный момент

Apple заметно отстает от конкурентов, когда дело касается предложений искусственного интеллекта, но все может измениться очень скоро с анонсом iOS 18 в начале июня.

Уже больше года Apple работает над собственной моделью большого языка (LLM), известной как Ajax. С помощью своего программного обеспечения для генеративного искусственного интеллекта компания стремится предложить новые функции, аналогичные тем, которые Google и OpenAI анонсировали в начале мая.

Ожидается, что в рамках недавнего продвижения искусственного интеллекта Apple представит несколько функций на базе искусственного интеллекта в своих новых операционных системах. Анализ документов и веб-страниц, обобщение текста, подписи к изображениям и генерация ответов — все это находится в разработке.

Компания стремится внедрить генеративную технологию искусственного интеллекта в существующий ассортимент основных системных приложений. В результате ожидается, что такие приложения, как «Заметки», Safari, «Сообщения», «Почта», Siri и Spotlight Search, так или иначе получат улучшения с поддержкой искусственного интеллекта.

Красочный значок Siri, значки Safari и «Сообщения», а также панель поиска Spotlight на темном фоне.

Ajax LLM от Apple улучшит Safari, Spotlight и Messages

Однако с точки зрения реальной функциональности существуют пределы того, чего Apple смогла достичь. Тестируемая модель искусственного интеллекта на устройстве способна лишь к элементарному анализу текста и генерации базовых ответов на устройстве.

Более продвинутые функции, по-видимому, потребуют облачной обработки, поэтому Apple, как сообщается, стремится заключить лицензионное соглашение с OpenAI. Это позволит Apple предлагать различные улучшения, связанные с искусственным интеллектом, которые не могут обеспечить ее собственные модели на устройствах.

Отдельный слух утверждает, что Apple хочет создать «AI App Store», через который пользователи могли бы приобретать приложения и продукты на тему ИИ от других компаний. Теоретически это даст пользователям возможность использовать платные версии продуктов, таких как Gemini Advanced.

Вскоре мы сможем лучше понять усилия Apple в области искусственного интеллекта, поскольку ожидается, что компания представит свои новые функции генеративного искусственного интеллекта на своей ежегодной Всемирной конференции разработчиков 10 июня.