(Источник: Microsoft/PCMag)
Copilot Vision в Edge не похож ни на что из того, что есть в веб-браузерах, и развивает концепцию генеративного ИИ в новом направлении. Вместо того, чтобы создавать текст или изображения на основе подсказок, помощник по браузеру анализирует всё визуальное и текстовое содержимое веб-страницы и устно общается с вами, предоставляя контекст и пояснения. Да, функция Google Lens в Chrome немного похожа, позволяя выделять объекты на странице и получать результаты поиска в боковой панели, но это совсем не диалоговый интерфейс.
Была протестирована предварительная версия Copilot Vision в начале 2025 года, но теперь релизная версия доступна всем в десктопных сборках браузера Edge. Его основные функции по-прежнему впечатляют, хотя некоторые изменения в работе с сайтами, содержащими конфиденциальные данные, вызывают у меня сомнение. Я расскажу вам, как максимально эффективно использовать Copilot Vision и разобраться в его недостатках.
Изначально Copilot Vision был доступен только избранным подписчикам Copilot Pro (20 долларов в месяц), но теперь он бесплатен для всех, у кого есть десктопная версия браузера Edge. Copilot Vision предоставляется только по желанию.
Для начала убедитесь, что ваш браузер обновлён. Для этого выберите меню с тремя точками в правом верхнем углу, затем «Справка и отзывы», а затем «О Microsoft Edge». Верхний раздел этой страницы проверяет, установлена ли у вас последняя версия. Для использования Copilot Vision также необходимо войти в учётную запись Microsoft, поэтому сделайте это. Наконец, откройте Edge, выберите значок Copilot в правом верхнем углу, чтобы открыть боковую панель ИИ, и нажмите кнопку микрофона внизу.
Затем в нижней центральной части окна браузера появится диалоговое окно, в котором вы можете разрешить инструменту включить эту функцию. В нём говорится: «Получите помощь от Copilot, показав то, что на вашем экране, и обсудив это. Copilot слышит ваш голос и реагирует на ваши действия, как друг». Нажмите кнопку «Принять».
Затем вы видите панель инструментов Copilot в нижней центральной части окна со значками очков и микрофона. Они позволяют запретить ИИ просматривать ваш экран и отключить микрофон.
Поскольку функция голосовая (хотя она и называется Vision), вам необходимо включить микрофон. После нажатия на значок микрофона вы услышите фортепианную мелодию, а затем вас поприветствует реалистичная речь искусственного интеллекта Copilot Voice. Вы можете выбрать один из четырёх голосовых режимов: Canyon, Grove, Meadow или Wave. Я выбрал Wave (с британским акцентом), хотя на телефоне использую Canyon. Copilot Vision может описывать и предоставлять информацию о том, что вы видите на сайте, а также просто общаться на любые темы.
Как видите, интерфейс Copilot Vision полностью отличается от боковой панели Copilot в браузере Edge, которая представляет собой стандартный интерфейс чат-бота, похожий на ChatGPT. Панель инструментов Vision даже скрывается, когда вы её не используете.