Skip to main content

В исследовательской работе прямо говорится, что Apple не использует ваши данные для обучения Apple Intelligence. Это отличается от политики OpenAI, которая использует ваши сеансы ChatGPT для обучения своей модели.

Тем не менее, Apple заявляет, что она сканирует веб-сайты на наличие контента с помощью Applebot, и владельцы веб-сайтов должны явно отказаться от этого, если они не хотят, чтобы это произошло…

Как обучаются генеративные системы искусственного интеллекта

Большие языковые модели (LLM), такие как ChatGPT и Apple Intelligence, обучаются путем подачи им большого количества образцов текста, написанного людьми.

Некоторые считают это спорным, поскольку материалы, защищенные авторским правом, сканируются, а некоторые компании уже используют контент, созданный искусственным интеллектом, вместо контента, написанного людьми. По сути, писатели видят, что их собственные работы используются для обучения систем искусственного интеллекта, способных заменить их. Кроме того, многие веб-сайты содержат пользовательский контент, например комментарии и сообщения на форумах, поэтому не только писатели используют свои слова таким образом.

OpenAI идет дальше и по умолчанию также использует ваши сеансы ChatGPT в качестве дополнительного учебного материала. Вы можете отказаться (см. ниже), но большинство пользователей не знают, что это происходит, поэтому не будут знать, что это нужно сделать.

Apple не использует ваши данные для обучения Apple Intelligence

В исследовательском документе, опубликованном на этой неделе, объясняется, как Apple обучает свои собственные модели устройств и серверов, а также описываются средства защиты, которые компания внедрила.

Одна из гарантий заключается в том, что ваше взаимодействие с Apple Intelligence не будет использоваться в качестве учебного материала:

Мы не используем личные данные наших пользователей или взаимодействие с ними при обучении наших базовых моделей.

Обратите внимание, что эта политика также будет применяться к использованию ChatGPT, которое передается от Siri в iOS 18 и macOS 15.

Он сканирует Интернет, и владельцы должны отказаться от этого.

Однако, как и OpenAI и Google, Apple парсит Интернет для построения своих моделей – и компания также придерживается того же подхода, предполагая, что это нормально, если владельцы веб-сайтов явно не отказываются от этого.

Веб-парсер Apple, Applebot, уже делает это в течение многих лет, помогая обучать Siri и отображать предложения Spotlight за пределами ваших устройств. Applebot теперь дополнительно используется для обучения Apple Intelligence.

Мы обучаем наши базовые модели на лицензированных данных, включая данные, выбранные для улучшения конкретных функций, а также общедоступные данные, собранные нашим веб-сканером AppleBot. Веб-издатели имеют возможность отказаться от использования своего веб-контента для обучения Apple Intelligence с контролем использования данных.

Инструкции по отказу см. ниже.

Дополнительная защита Apple для веб-контента

Apple заявляет, что применяет дополнительные меры защиты веб-контента, призванные гарантировать, что он непреднамеренно не включает личные данные, а также отфильтровать потенциально оскорбительные материалы.

Мы применяем фильтры для удаления личной информации, такой как номера социального страхования и номера кредитных карт, которые общедоступны в Интернете. Мы также фильтруем ненормативную лексику и другой контент низкого качества, чтобы предотвратить его включение в обучающий корпус.

В более общем плане Apple утверждает, что это помогает избежать отражения предвзятого материала в результатах Apple Intelligence.

Мы постоянно работаем над тем, чтобы избежать закрепления стереотипов и системных предубеждений в наших инструментах и ​​моделях искусственного интеллекта.

GIGO – Garbage In, Garbage Out – была одной из самых больших проблем для программ LLM. Например, в сети много сексистских и расистских материалов, и если не принять меры по их фильтрации, ИИ может в конечном итоге извергнуть это.

Отказ от обучения Apple Intelligence

Веб-издатели могут отказаться, включив инструкции в файл robots.txt – тот же метод, который уже давно используется на веб-сайтах для контроля индексации Google.

Applebot соблюдает стандартные директивы robots.txt при обычном поисковом сканировании, ориентированном на Applebot. В этом примере Applebot не пытается сканировать документы, находящиеся в каталоге /private/ или /not-allowed/:

User-agent: Applebot
Allow: /
Disallow: /private/
User-agent: *
Disallow: /not-allowed/

Кроме того, Apple проявляет осторожность, соблюдая инструкции, адресованные роботу Googlebot.

Обратите внимание, что вы не можете отказаться от обучения Apple Intelligence самостоятельно: если вы заблокируете Applebot, материалы вашего сайта также не будут отображаться в предложениях Spotlight.

Отказ от обучения ChatGPT

Как уже упоминалось, ChatGPT не будет обучаться взаимодействиям, возникающим в результате передачи управления Siri в iOS 18 и macOS 15. Но если вы не хотите, чтобы ваш текущий взаимодействия с ChatGPT, используемым в качестве учебного материала, вы также можете отказаться от этого.

iOS-приложение

  • Меню из трех точек вверху справа: «Настройки» > «Управление данными».
  • Выключите параметр «Улучшить модель для всех».

Mac-приложение

  • В строке меню ChatGPT > Настройки > Управление данными.
  • Выключите параметр «Улучшить модель для всех».

Коллаж : Главное от Apple, значок логотипа Apple от Icons8