Google I/O 2024: главные анонсы в области ИИ

Все, что было объявлено на конференции Google I/O 2024

Конференция Google I/O только что завершилась, и она была наполнена анонсами в области искусственного интеллекта. Как и ожидалось, на мероприятии был уделен особый акцент моделям искусственного интеллекта Gemini от Google, а также способам их интеграции в приложения, такие как Workspace и Chrome.

Если вы не смогли присутствовать на конференции в прямом эфире, вы можете ознакомиться со всеми последними новостями от Google в сводке ниже.

Google Lens теперь позволяет искать, записывая видео

Google Lens уже позволяет искать что-то на основе изображений, но теперь Google идет дальше, предоставляя возможность поиска с помощью видео. Это означает, что вы можете снять видео чего-то, что вы хотите найти, задать вопрос во время видео, и искусственный интеллект Google попытается найти соответствующие ответы в сети.

Флагманский продукт Google — модель Gemini — становится быстрее и мощнее

Google представила новую модель искусственного интеллекта в своем арсенале: Gemini 1.5 Flash. Новая мультимодальная модель так же мощна, как и Gemini 1.5 Pro, но оптимизирована для “узких, частотных, низколатентных задач”. Это делает ее более подходящей для генерации быстрых ответов. Google также внесла изменения в Gemini 1.5, которые, как они говорят, улучшат его способность к переводу, логическому выводу и программированию. Кроме того, Google увеличила окно контекста Gemini 1.5 Pro (сколько информации он может взять на входе) с 1 миллиона до 2 миллионов токенов.

Gemini присоединяется к пользователям в Workspace

Google внедряет свою последнюю модель языка, Gemini 1.5 Pro, в боковую панель для Docs, Sheets, Slides, Drive и Gmail. Когда она будет доступна для платных подписчиков в следующем месяце, она превратится в более общего помощника в рабочем пространстве, который сможет извлекать информацию из любого содержимого вашего Диска, независимо от того, где вы находитесь. Он также сможет выполнять для вас различные задачи, такие как написание электронных писем, включающих информацию из документа, который вы в настоящее время просматриваете, или напоминать вам позже о необходимости ответить на электронное письмо, которое вы просматриваете. Некоторые ранние тестировщики уже имеют доступ к этим функциям, но Google говорит, что в следующем месяце они будут доступны всем платным подписчикам Gemini.

Проект Astra — это будущее ИИ из Star Trek от Google

Проект Astra от Google — это мультимодальный ИИ-ассистент, который компания надеется сделать универсальным виртуальным ассистентом, который может наблюдать и понимать то, что он видит через камеру вашего устройства, помнить, где находятся ваши вещи, и делать за вас различные задачи. Это является основой для многих впечатляющих демонстраций на I/O в этом году, и цель компании заключается в том, чтобы он был настоящим агентом искусственного интеллекта, который не просто может разговаривать с вами, но и фактически что-то делать за вас.

Veo приносит генерацию видео в стиле Sora для создателей

Ответ Google на Sora от OpenAI — новая генеративная модель искусственного интеллекта, которая может создавать видео разрешением 1080p на основе текстовых, графических и видео-ориентированных запросов. Видео можно создавать в различных стилях, например, с воздушных съемок или таймлапсов, и можно настроить с помощью дополнительных запросов. Компания уже предлагает Veo некоторым создателям для использования в видео на YouTube, но также предлагает его Голливуду для использования в фильмах.

Gems предлагает создание настраиваемых чат-ботов для Gemini

Google выпускает создатель настраиваемых чат-ботов под названием Gems. Как и у GPTs от OpenAI, Gems позволяет пользователям давать инструкции Gemini для настройки того, как он будет реагировать и в чем он будет специализироваться. Если вы хотите, чтобы он был позитивным и настойчивым беговым тренером с ежедневными мотивациями и планами на бег — то есть мой худший кошмар — вы сможете сделать это в скором времени (если вы абонент Gemini Advanced).

Gemini становится лучшим партнером для разговоров

Новая функция Gemini Live нацелена на то, чтобы сделать голосовые чаты с Gemini более естественными. Голос чат-бота будет обновлен некоторой дополнительной индивидуальностью, и пользователи смогут прерывать его посреди фразы или просить его наблюдать через камеру их смартфона и давать информацию о том, что он видит в реальном времени. Gemini также получает новые интеграции, позволяющие ему обновлять или получать информацию из календаря Google, Задач и Заметок, используя мультимодальные функции для этого (например, добавление деталей с флаера в ваш личный календарь).

Круг к поиску теперь может помочь решить математические задачи

Если вы используете телефон или планшет на Android, теперь вы можете обвести математическую задачу на экране и получить помощь в ее решении. Искусственный интеллект Google не решит проблему за вас — так что он не поможет учащимся списывать домашнее задание — но он разобьет ее на шаги, что должно сделать ее выполнение проще.

Google Search получает обновление ИИ

Google запускает “Обзоры ИИ” — ранее известные как “Генеративный опыт поиска”, назвать которые было нелегко — для всех в США на этой неделе. Теперь “специализированная” модель Gemini будет разрабатывать и заполнять страницы результатов с суммированными ответами из сети (похоже на то, что вы видите в инструментах поиска AI, таких как Perplexity или Arc Search).

На Android появляется ИИ-обнаружение мошенничества

Используя умные наносети Gemini Nano на устройстве, Google говорит, что телефоны на Android смогут помогать вам избегать мошеннических звонков, выявляя красные флаги, такие как распространенные шаблоны разговоров мошенников, а затем выводя реальные предупреждения в реальном времени, как показано выше. Компания обещает предоставить более подробную информацию о функции позже в этом году.

Устройства на Android становятся более умными благодаря ИИ

Google говорит, что Gemini вскоре сможет позволять пользователям задавать вопросы о видео на экране, и он ответит на них на основе автоматических подписей. Для платных пользователей Gemini Advanced он также может обрабатывать PDF-файлы и предлагать информацию. Эти и другие мультимодальные обновления для Gemini на Android появятся в ближайшие несколько месяцев.

Google Chrome получает ИИ-помощника

Google объявила, что добавляет Gemini Nano, легковесную версию своей модели Gemini, в Chrome на рабочем столе. Встроенный ассистент будет использовать ИИ на устройстве, чтобы помогать вам генерировать текст для постов в социальных сетях, отзывов о продуктах и многого другого непосредственно в Google Chrome.

Google улучшает свой идентификатор SynthID для водяных знаков

Google говорит, что расширяет возможности SynthID — компания говорит, что будет внедрять водяные знаки в контент, созданный с помощью своего нового генератора видео Veo, и что он теперь также может обнаруживать видео, созданные с использованием ИИ.