Новый искусственный интеллект Gemini от Google

Новый искусственный интеллект Gemini от Google

13 февраля 2024 37 4 мин.

В четверг компания Google объявила, что реконструировала и переименовала своего чат-бота Bard — теперь называемого Gemini.

В четверг компания Google объявила, что реконструировала и переименовала своего чат-бота Bard — теперь называемого Gemini — чтобы предложить предприятиям и потребителям первую в отрасли мультимодальную генеративную платформу искусственного интеллекта (genAI),которая больше не полагается только на текст для предоставления ответов, подобных человеческим.

Выпуск Gemini представляет собой прямой вызов Microsoft Copilot, который основан на OpenAI ChatGPT, и любому другому чат-боту, основанному только на технологии большой языковой модели (LLM).

«Она [Gemini] в настоящее время является единственной доступной мультимодальной генеративной моделью ИИ», — сказал Чираг Декате, вице-президент-аналитик Gartner. «Google больше не играет в догонялки. Теперь все наоборот».

[Подготовьтесь к генеративному ИИ с помощью экспериментов и четких рекомендаций] Декейт назвал Gemini «действительно большим событием», потому что в мультимодальной модели один механизм генИИ выполняет отдельные задачи более точно, поскольку он учится на гораздо большем объёме знаний. По сути, это катапультирует Google во главе пакета genAI.

Google впервые представила свою модель Gemini AI в декабре, рекламируя мультимодальные возможности, которые позволяют ей комбинировать различные типы информации — входные и выходные — включая текст, код, аудио, изображения и видео.

В отличие от механизмов искусственного интеллекта, предназначенных только для LLM, таких как GPT OpenAI, Llama 2 от Meta или даже PaLM 2 от Google — все они используются в современных чат-ботах — Gemini не полагается на одну и ту же технологию. Вместо этого его можно обучать, используя все типы средств массовой информации и контента.

Это важно, поскольку теперь предприятие может создать чат-бота, который больше не ограничивается загрузкой ответов на запросы из текста, на котором было обучено его LLM.

«Когда я смотрю фильм, я смотрю видео, я читаю текст (субтитры),я слушаю аудио, и все это происходит одновременно, создавая сверхпогружение», — сказал Декате. «Это мультимодальность в Сравните это с просмотром фильма, прочитав только его сценарий (LLM); в этом разница между LLM и мультимодальностью».

Прошлый год, по словам Декате, был годом идей, поскольку предприятия и потребители узнали о genAI и чат-ботах после выпуска ChatGPT в конце 2022 года. Теперь предприятия лучше понимают возможности genAI и открывают свои кошельки, чтобы потратить значительные суммы на Наполните им серверную и клиентскую системы.

Если вы, например, компания здравоохранения, пытающаяся создать более захватывающий чат-бот для врачей, мультимодальный механизм genAI может принимать аудиофрагменты врачей, рентгенологические изображения и видеосканы МРТ, чтобы создавать гораздо более точные прогнозы и результаты лечения.

«Это создает сверхзахватывающий личный опыт. Ничего из этого невозможно, используя простой опыт LLM», — сказал Декате. «Если Google сможет позволить предприятиям и потребителям испытать этот мультимодальный опыт, то у Google появится шанс изменить долю рынка».

Ожидается, что в 2024 году расходы на решения genAI достигнут 40 миллиардов долларов по сравнению с 19,4 миллиарда долларов в 2023 году. Ожидается, что к 2027 году расходы на genAI достигнут 143 миллиардов долларов, а совокупный годовой темп роста за пять лет составит 73,3%, по данным исследовательской компании. ИДЦ.

«В прошлом году мы увидели появление моделей, ориентированных на конкретные задачи — текст-текст, текст-изображение, текст-видео, изображение-ext и т. д.», — сказал Декейт. «У каждой задачи была своя модель. Итак, если у вас узкая задача — преобразование текста в текст, то LLM работает хорошо».

Модель подписки Gemini от Google за 20 долларов в месяц также, похоже, нацелена на отвоевание доли рынка у лидера Microsoft.

Клиенты из США могут подписаться за 19,99 долларов в месяц, чтобы получить доступ к Gemini Advanced, который включает в себя более мощную модель Ultra 1.0 AI. Подписчики получат два терабайта облачного хранилища, которые обычно стоят 9,99 долларов в месяц, и вскоре получат доступ к Gemini в Gmail и пакете повышения производительности Google.

Новый план Google One AI Premium — это ответ Microsoft и ее партнеру по genAI OpenAI, которые разработали GPT LLM, лежащий в основе ChatGPT.

«Частично она конкурирует с Microsoft, а частично — предлагать премиальные услуги своим премиальным [клиентам», в основном пользователям бизнес-офисов, которые уже платят», — сказал Джек Голд, главный аналитик J.Gold Associates. «Кроме того, если вы взимаете плату, вы ограничиваете количество пользователей, которые могли бы войти в систему бесплатно. Это дает вам возможность исправить любые проблемы, с которыми сталкивается более ограниченное количество пользователей, и обеспечивает поток доходов для поддержания инженерное дело, а не полагаться на рекламу, чтобы платить за него».

Для Google также существует проблема стоимости, поскольку обучение большой модели ИИ в центрах обработки данных обходится недешево.

«Непонятно, как им платят за работу всего этого искусственного интеллекта в фоновом режиме, который требует гораздо больше вычислительной мощности, а мощность — одна из самых больших затрат на эксплуатацию облака/центра обработки данных», — сказал Голд.

«Что удивительно в Gemini, так это то, что они так хороши во многих вещах», — сказал генеральный директор Google DeepMind Деннис Хассабис. «Когда мы подошли к концу обучения, мы начали видеть, что Gemini превосходит любую другую модель в этих очень важных вопросах.

Источник:https://www.computerworld.com/article/3712825/google-throws-down-the-gauntlet-with-gemini-its-multimodal-genai-engine.html

Революция искусственного интеллекта: прогнозы поставок компьютеров и смартфонов с поддержкой ИИ

Искусство эффективного копирайтинга: Секреты создания убедительного контента

Пожертвования

Благодарим вас за выбор нашего сервиса! Пожалуйста, поддержите нас, отключив блокировщик рекламы или сделав пожертвование. Каждый рубль помогает нам развивать наши проекты.

Кошелек Юмани:
Наши криптокошельки:
  • Ether: 0x2764e55bbbc6e60fa0678da98aae46635e850bdc
  • Bitcoin cash: qzm2pkf9sdzc0lpe39lgh42u2gc52majqcnxc0uz8j

Если у вас есть желание сделать добровольное пожертвование, но возникли трудности или вопросы - переходите по этой ссылке где есть подробная инструкция, или напишите нам на почту support@txt-webcalypt.ru

*При нажатии или сканировании, вы просто перейдете на страницу оплаты.