Версия Siri следующего поколения будет оснащена генеративным чат-ботом с искусственным интеллектом, и аналитики ожидают, что она будет запущена вместе с iOS 18 и будет анонсирована на WWDC в этом году.
Хотя Apple критиковали за отставание Siri, в новом отчете говорится, что это связано с тем, что компания стремится быть гораздо более амбициозной, чем существующие системы генеративного искусственного интеллекта…
AppleGPT
Хотя компания не делала никаких заявлений о своей работе над генеративным искусственным интеллектом, в летнем отчете говорилось, что компания уже создала собственную систему модели большого языка (LLM), получившую название AppleGPT.
Инструмент в его нынешнем виде используется только внутри компании, но в отчете затем говорится, что «люди, знакомые с этой работой, полагают, что Apple намерена сделать важное объявление, связанное с ИИ, в следующем году».
Хотя этот отчет вызвал достаточно ажиотажа, чтобы вызвать резкий скачок акций AAPL, мы тогда предупредили, что клиентам не следует рассчитывать на использование нового мощного сервиса Siri в ближайшее время.
Цели Apple гораздо более амбициозны, чем ChatGPT
Хотя завтра Apple может запустить собственную программу LLM, компания стремится обойти такие системы, как ChatGPT, двумя способами:
Обработка на устройстве. Выход за рамки языковой обработки: включение аудио и видео с использованием искусственного интеллекта.
Обработка на устройстве
Системы искусственного интеллекта, такие как ChatGPT, выполняют всю обработку на удаленных серверах, но исследования, написанные Apple, предполагают, что у компании гораздо более амбициозная цель: использование обработки на устройстве.
Это будет иметь преимущество в скорости и конфиденциальности, но обеспечение работы таких сервисов в ограниченной памяти мобильных устройств представляет собой огромную проблему – и это, как полагают, является ключевой причиной того времени, которое компания тратит на запуск.
Мы уже видели, как компания сделала один небольшой шаг к этой цели, запустив автономную Siri в последних моделях Apple Watch еще в сентябре.
AI аудио и видео, а также язык
ChatGPT известен как LLM, поскольку его суть связана с языковой обработкой. Но амбиции Apple выходят за рамки этого: они стремятся внедрить искусственный интеллект в обработке видео и аудио.
Мы снова увидели некоторые первые признаки этого: визуальную и звуковую обработку искусственного интеллекта можно увидеть в функциях «Обнаружение дверей» и «Живые субтитры».
Следующее поколение Siri появится в iOS 18
Financial Times сообщает об ожидаемом запуске гораздо более мощной версии Siri.
Ожидается, что Всемирная конференция разработчиков Apple, обычно проводимая в июне, станет событием, на котором компания представит свою новейшую операционную систему iOS 18. Аналитики Morgan Stanley ожидают, что мобильное программное обеспечение будет ориентировано на поддержку генеративного искусственного интеллекта и может включать в себя голосового помощника Siri. работает от LLM […]
«Что касается чипов в их устройствах, они определенно все больше и больше ориентируются на искусственный интеллект с точки зрения дизайна и архитектуры», — сказал Дилан Патель, аналитик консалтинговой фирмы по полупроводникам SemiAnalysis.
Это перекликается с сообщением, опубликованным ранее в этом месяце одним из лидеров Apple, и Morgan Stanley указывает на списки вакансий Apple в качестве дополнительного доказательства.
Почти половина объявлений о вакансиях Apple в области ИИ теперь включает термин «глубокое обучение», который относится к алгоритмам, лежащим в основе генеративного ИИ — моделям, которые могут извергать человеческий текст, аудио и код за секунды.
Мнение
Хотя по-прежнему существует много спекуляций, идея крупного перезапуска Siri в этом году кажется все более правдоподобной.
Модели LLM, такие как ChatGPT, полностью изменили представления о том, чего мы сейчас ожидаем от систем искусственного интеллекта. Хотя Apple смогла указать на конфиденциальность как на причину, по которой возможности Siri остаются более ограниченными, чем у конкурентов, которые обрабатывают большое количество личных данных, сейчас мы достигли точки, когда Siri выглядит неприемлемо глупо. Ситуация должна измениться, и трудно представить, как Apple могла ждать дольше, чем в этом году.
Использование генеративного искусственного интеллекта для поддержки Siri значительно расширит возможности интеллектуального помощника Apple, а обработка на устройстве позволит компании продолжать рекламировать свои учетные данные конфиденциальности. Внедрение обработки видео и аудио дает компании реальный шанс убедить всех, что ожидание того стоило.
Фото Омида Армина на Unsplash