Skip to main content

Я знаю, что это всего лишь бета-версия для разработчиков, и если кто-нибудь из Apple спросит, то мои первые впечатления о Visual Intelligence представлены исключительно в контексте его будущего потенциала. Но я должен сказать, что попытка сделать это вдохновляет меня на будущее.

Фактическая часть Apple Intelligence в настоящее время относительно ограничена. В большинстве случаев у вас есть выбор между просьбой ChatGPT описать вам то, что вы видите, и поиском в Google…

Фактические детали Apple Intelligence

Насколько мы можем судить, Apple Intelligence напрямую выполняет несколько функций:

  • Обобщение текста, увиденного в сцене
  • Получение информации о компаниях из Apple Maps
  • Распознавание даты и времени в тексте и открытие календаря для этого слота

Но для распознавания объектов эта функция в настоящее время использует исключительно ChatGPT и Google. По моему ограниченному опыту, Google, безусловно, производит самое сильное впечатление.

Распознавание изображений с помощью Google и ChatGPT

Я склонен тщательно изучать большинство своих нетривиальных покупок, прежде чем нажать кнопку. Читаю отзывы, спрашиваю советы у друзей и вообще допрашиваю Гугл до энной степени.

Поэтому, если я вижу где-то что-то используемое и хочу это проверить, мне нужны подробности: сказать мне, что я смотрю на компактную кофемашину для приготовления кофе в зернах или что-то подобное, на самом деле не получится.

Так как же работает Visual Intelligence v0.1? Я проверил это на нескольких вещах у себя дома.

Первым был мой Sage Combi Wave 3-в-1, комбинированная микроволновая печь, духовка и фритюрница. Он продается в США под брендом Breville. Визуальный интеллект сразу его определил (первое совпадение, вверху справа). Там также был показан конкурирующий продукт, но все остальные топ-хиты оказались правильными.

Далее моя кофеварка Sage Barista Touch. VI здесь был немного менее уверен, предполагая, что это может быть либо эта модель, либо гораздо более дорогая модель Oracle Touch от той же марки, но не нужно много времени, чтобы определить, какое из двух предложений верно. (Хотя кажется, что сюда добавлена ​​третья модель, это рекламное объявление с сайта с неправильно подписанной фотографией.)

Производитель газированной воды Aarke Carbonater II? Без проблем.

С Reidel O Wine Tumbler у него были некоторые проблемы, но это простительно, поскольку существует множество подражателей. В основном там показывались только оригиналы и прямые копии.

Перейдя в гостиную, он определил, что это кресло Имса, и, поскольку это копия с точностью до миллиметра, я прощу его за то, что я не смог отличить его от настоящего.

Я попробовал это на некоторых оригинальных работах менее известных (но не неизвестных) художников, но безуспешно. Однако когда дело дошло до отпечатка, идентифицировать его не составило труда.

В случае с моим Naim Mu-so предполагалось, что это устройство второго поколения, а не первого, но, учитывая, что визуально они идентичны и почти каждая ссылка в сети посвящена именно этой модели, это вполне понятно.

Я опробовал это на куче других устройств у себя дома:

  • Оригинальный HomePod
  • Эхо-точка
  • Переключатель Philips Hue
  • Умный дверной звонок Netatmo

Во всем этом он был прав.

Это отличное начало, и впереди еще много всего

Впервые я попробовал технологию распознавания изображений на основе искусственного интеллекта, когда попробовал очки Ray-Ban Meta, хотя для получения максимальной отдачи от них потребовалось тщательно сформулировать формулировку и/или задать дополнительные вопросы.

Визуальный интеллект уже кажется лучше, и именно его темпы развития меня больше всего волнуют. Учитывая, что в этой области конкурируют многочисленные компании, я думаю, что за очень короткое время мы увидим огромный прогресс.

Конечно, будут досадные ошибки, как и во всех технологиях искусственного интеллекта, но сама природа этой технологии такова, что она учится на каждом взаимодействии.

Я не думаю, что пройдет много времени, прежде чем мы сможем делать такие вещи, как наведение iPhone на случайный продукт, который мы видим в магазине или на улице, и мгновенно получать средний рейтинг и достойное резюме обзоров с помощью искусственного интеллекта. Обычно Apple говорит нам, что компании не терпится увидеть, что мы сделаем с ее новой технологией, но в данном случае все наоборот.

Если у вас есть доступ (в моем случае это заняло пару недель), каковы ваши первые впечатления от Visual Intelligence? Поделитесь своими мыслями в комментариях и посмотрите видео Фернандо ниже.

Фото: