Skip to main content

Люди уже много лет жалуются на Siri, утверждая, что она отстает от Alexa и Google Assistant. Имея явные доказательства того, что в 2024 году произойдет значительное улучшение функций искусственного интеллекта Apple, изменит ли iOS 18 Siri наконец ситуацию?

Я очень надеюсь, что ответ положительный, и думаю, что есть три подсказки, которые дают некоторый повод для оптимизма…

 

Apple долго ждала улучшения Siri

Apple не поспешила с генеративным искусственным интеллектом по трем причинам.

Во-первых, компания имеет устоявшийся подход к новым технологиям. Он предпочитает, чтобы другие компании страдали от насущных проблем, и выходит на рынок только тогда, когда компания чувствует, что может предоставить опыт, превосходящий конкурентов.

Во-вторых, Apple уделяет большое внимание конфиденциальности, стремясь выполнять как можно больше обработки на устройстве, а не отправлять личные данные на сервер для обработки. Мы уже видели, как компания сделала один небольшой шаг к этой цели, запустив автономную Siri в последних моделях Apple Watch еще в сентябре.

В-третьих, Apple — консервативная компания с небольшим капиталом, предпочитающая избегать противоречий там, где это возможно. Генеративный ИИ поразил людей очевидным интеллектом своих ответов, но также совершил несколько поразительно глупых поступков – от предложения нацистской приветственной фразы в качестве предлагаемого ответа до, казалось бы, попытки мошенничества.

Я также утверждал, что голосовой интерфейс повышает ставки.

Но это год

Хотя я думаю, что Apple ждала по веским причинам, сейчас ситуация достигла точки, когда ждать больше просто невозможно, и теперь есть множество доказательств того, что 2024 год — это год, когда Apple садится на борт поезда генеративного ИИ.

Блумберг сообщила, что Apple называет iOS 18 одним из крупнейших обновлений iOS, которые она когда-либо делала, и что в центре внимания при этом находится искусственный интеллект.

Файнэншл Таймс стал немного более конкретным, указав, что Siri в этом году будет оснащена генеративной моделью искусственного интеллекта в стиле ChatGPT.

В бета-версии iOS 17.4 обнаружил доказательства того, что Apple работает над новой версией Siri, основанной на технологии генеративного искусственного интеллекта.

Даже генеральный директор Тим Кук, который обычно хранит молчание, когда речь заходит о планах Apple на будущее, сказал, что компания «рада поделиться подробностями нашей текущей работы в этой области». [AI] позже в этом году.»

Так чего же нам ожидать?

Подсказка 1: первоначальная цель команды Siri

Одним из самых больших недостатков Siri является то, что он не может эффективно взаимодействовать с другими приложениями. Конечно, он может управлять устройствами умного дома, и есть ярлыки Siri, но в целом, если для того, что вы хотите сделать, требуется стороннее приложение, Siri не сможет помочь. Отсюда и печально известный ответ «Вот что я нашел в сети».

Но это именно то, что нужно, чтобы превратить Siri в действительно полезный и умный помощник. Чтобы он действительно начал выполнять некоторые задачи, которые в настоящее время выполняют человеческие PA.

Фактически, именно этого и хотела достичь первоначальная команда, создавшая Siri. До приобретения Apple сторонняя версия приложения фактически интегрировалась с 42 различными сервисами. Именно Apple убрала эту возможность, вероятно, чтобы Siri могла выполнять меньше задач более надежно.

Итак, Apple пошла своим путем, значительно уменьшив возможности Siri, и первоначальная команда создала нового интеллектуального помощника — Viv, обеспечивающего глубокую интеграцию со сторонними приложениями для выполнения сложных задач.

Вот пример того, что Вив смог сделать еще в 2016 году:

«Купите мне пиццу в ресторане Pizz’a Chicago рядом с моим офисом», — сказал один из инженеров в свой смартфон. Это было их первое настоящее испытание Viv, технологии искусственного интеллекта, которую команда тихо создавала более года. Все немного нервничали. Затем прозвучало сообщение от Вив: «Хотите ли вы с этим начинку?»

Инженеры, всего восемь человек, начали вмешиваться: «Пепперони». «Половина сыра». «Салат Цезарь.» Воодушевленные результатом, они засыпали Вив новыми командами: «Добавьте больше начинки». Удалить начинку. Измените средний размер на большой.

Примерно через 40 минут — и после нескольких заминок, когда Вив перепутала адрес офиса — появился водитель Pizza Chicago с четырьмя приготовленными на заказ пиццами.

Подсказка 2: Способность генеративного ИИ угадывать намерения

С тех пор, конечно, у нас появился генеративный ИИ.

Хотя большинство людей были впечатлены выход – что в лучших примерах больше похоже на что-то, написанное человеком, чем машиной – меня больше всего впечатляет то, как такая технология, как ChatGPT, обрабатывает вход. Что он действительно хорошо умеет, так это предугадывать наши намерения.

Если Siri сможет понять, чего мы пытаемся достичь, и он может взаимодействовать со сторонними приложениями и сервисами, такими как Uber, Booking.com, авиакомпании и т. д., а затем мы открываем возможность использования нескольких приложений для выполнения сложных задач.

Подсказка 3: собственное исследование Apple по взаимодействию с приложениями

Окончательную подсказку мы получили ранее на этой неделе.

В исследовательском документе Apple описывается, как компания разрабатывала Ferret-UI, генеративную систему искусственного интеллекта, специально разработанную для понимания экранов приложений. В документе несколько расплывчато говорится о потенциальных приложениях этого — вероятно, намеренно — но самой захватывающей возможностью было бы использование гораздо более продвинутой Siri. […]

Пользователь может дать Siri инструкцию типа «Проверьте завтрашние рейсы из аэропорта Джона Кеннеди в Бостон и забронируйте место на рейс, который доставит меня туда к 10 утра с общей стоимостью билета менее 200 долларов». Затем Siri будет взаимодействовать с приложением авиакомпании, чтобы выполнить задачу.

Что это может означать для iOS 18 Siri?

Если мы соберем все это вместе, мы получим совершенно новую Siri, которая использует возможности генеративного искусственного интеллекта для понимания наших запросов; интерфейсы с популярными существующими сервисами; и может взаимодействовать с другими приложениями на нашем iPhone.

Это должно позволить Siri реагировать на такие вещи:

«Я собираюсь на WWDC 2024. Посоветуйте несколько рейсов и отелей».

Генеративный ИИ выполняет необходимый анализ. Он знает, что ему нужно просмотреть WWDC, чтобы узнать, где и в какие даты оно проводится. Он использует известное нам местоположение дома, чтобы определить, откуда нам нужно ехать.

Он использует приложения, установленные на моем iPhone, чтобы определить, какими авиакомпаниями я пользуюсь и какие группы отелей предпочитаю. Для популярных из них затем используется интеграция Siri, созданная Apple, с этими сервисами.

Если Apple не создала интеграцию с Siri, она взаимодействует с другими приложениями, необходимыми для реализации нашего намерения.

Я не предлагаю зайти настолько далеко, что просто доверить Siri все забронировать! Я думаю, что ему нужно будет обнародовать свои предложения, чтобы мы могли выбирать. Но как только мы это сделаем, тогда можно будет сказать: «Давай, бронируй Моссера и американские рейсы, вылетающие в 15:00 9-го числа и возвращающиеся в 11 утра 15-го числа».

Несбыточная мечта или реалистичные ожидания?

Прошло почти десять лет с тех пор, как я написал запрос на функцию, требующую, чтобы Siri могла взаимодействовать со сторонними приложениями. На самом деле этого еще не произошло; может ли это, наконец, случиться сейчас?

Это, конечно, амбициозная цель. Но первоначальная команда Siri уже продемонстрировала, насколько многое было возможно еще до появления генеративного ИИ. Учитывая прорывы, которые были сделаны с тех пор, мне хотелось бы верить, что то, что я изложил выше, осуществимо.

Каково ваше мнение? Считаете ли вы, что это разумное ожидание от совершенно новой версии Siri на базе генеративного искусственного интеллекта в iOS 18? Примите участие в нашем опросе и поделитесь своим мнением в комментариях.