IBM активно разрабатывает технологию AI Agent для выполнения сложных задач в динамичной бизнес-среде.
В конце октября IBM выпустила Granite 3.0, третье поколение своей флагманской серии моделей; он превзошел или не отстал от моделей конкурентов аналогичного размера во многих академических и отраслевых оценочных тестах, продемонстрировав превосходную производительность, гибкость настройки, прозрачность и безопасность.
IBM разрабатывает ряд новых технологий для содействия развитию ИИ корпоративного уровня: от моделей, помощников ИИ до инструментов, необходимых для оптимизации и развертывания ИИ для корпоративных данных и приложений. IBM активно разрабатывает технологию AI Agent, чтобы позволить ей самостоятельно направлять, просматривать и исправлять, а также выполнять сложные задачи в динамически меняющихся бизнес-средах.
IBM продолжает развивать возможности своей серии AI Assistants. Например, WatsonX Orchestrate помогает предприятиям использовать инструменты с низким кодом и автоматизацию для создания помощников ИИ, которые предварительно обучены для определенных задач или областей, таких как ответы на ежедневные вопросы клиентов или сотрудников, поддержка современной разработки мэйнфреймов и традиционных ИТ-приложений, руководство молодыми студентами для изучения возможных карьерных путей или предоставление онлайн-консультаций по ипотеке покупателям жилья. Помощник на основе искусственного интеллекта «IBM AskHR», которым пользуются 300 000 сотрудников IBM по всему миру, был разработан с использованием WatsonX Orchestrate.
В конце октября этого года IBM также анонсировала следующее поколение Watsonx Code Assistant (WCA). Новая версия поддерживается моделью кода Granite и может предоставлять общую помощь в разработке кода для таких языков, как C, C++, Go, Java и Python, а также предоставлять расширенные возможности модернизации приложений для корпоративных приложений Java. Функция помощи в разработке кода Granite теперь также доступна через IBM Granite.Code (расширение Visual Studio Code).
IBM планирует продолжить выпуск новых инструментов, чтобы помочь разработчикам использовать Watsonx.ai для более эффективного проектирования, настройки и развертывания ИИ, включая фреймворки агентов ИИ, возможности интеграции с существующими средами и расширенную поддержку общих сценариев применения (таких как RAG и агенты).
IBM работает над разработкой технологии агентов ИИ с более высокой автономностью, возможностями сложных рассуждений и многошаговым решением проблем и вызовом инструментов. Первая версия модели Granite 3.0 8B поддерживает основные функции агентов ИИ, такие как высокоуровневые рассуждения и высокоструктурированные шаблоны чатов и формы инструкций, необходимые для построения рабочих процессов для вызова инструментов. IBM также планирует добавить новые функции чата агентов ИИ в IBM WatsonX Orchestrate в первом квартале 2025 года, что позволит агентам ИИ «координировать» помощников ИИ, навыки и автоматизацию, что позволит предприятиям эффективно повышать общую производительность организации. IBM продолжит расширять возможности агентов ИИ в своем портфеле продуктов, включая предварительно обученных агентов для определенных доменов и сценариев применения.
Серия моделей IBM Granite 3.0, выпущенная IBM недавно, включает:
Общие/языковые модели: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Модели Guardian и безопасности: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
Гибридные модели Expert: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base
Основные характеристики моделей серии IBM Granite 3.0:
Пригодность: многие крупные языковые модели (LLM) основаны на общедоступном обучении и не содержат данных с правами интеллектуальной собственности или внутренних корпоративных данных. Granite 3.0 8B и 2B разработаны как рабочие лошадки для ИИ корпоративного уровня, обеспечивая высокую производительность для корпоративных задач, таких как генерация дополнения поиска (RAG), классификация, резюмирование, извлечение сущностей, использование инструментов и т. д. Эти компактные, универсальные модели можно настраивать на основе корпоративных данных и легко интегрировать с бизнес-сценариями или рабочими процессами.
Производительность: в ранговом тесте OpenLLM HuggingFace общая производительность модели Granite 3.0 8B Instruct в среднем соответствовала лучшей производительности моделей с открытым исходным кодом аналогичного размера от Meta и Mistral. В тесте безопасности AttaQ от IBM указанные выше модели превзошли модели Meta и Mistral по всем протестированным параметрам безопасности.
В этом выпуске также есть Mixture of Experts (MOE) Granite 3.0 1B-A400M и Granite 3.0 3B-A800M, которая является профессиональной технологией планирования, которая может динамически выбирать лучшую экспертную модель для рассуждений на основе входного контента, повышать эффективность и снижать требования к вычислительным ресурсам. Она особенно подходит для приложений с низкой задержкой и высокими требованиями к скорости отклика и учитывает идеальный баланс между производительностью и стоимостью вывода.
IBM также выпустила обновленную версию предварительно обученной модели временных рядов Granite. Эти новые модели основаны на в три раза большем объеме обучения данных, обладают большей гибкостью моделирования, поддерживают внешние переменные и скользящие прогнозы. В трех основных оценках моделей временных рядов производительность Granite превзошла модели, в десять раз превышающие модели Google, Alibaba и т. д.
Стоимость: включите небольшие модели Granite для конкретных задач с вашими собственными данными и используйте революционную технологию выравнивания InstructLab от IBM и RedHat, запущенную в мае этого года (2024), чтобы помочь компаниям обучать свои собственные модели эффективным и малозатратным способом. (Согласно результатам анализа затрат нескольких ранних проектов проверки концепции, снижение затрат составляет примерно от 3 до 23 раз).
Прозрачность: технический отчет Granite 3.0 и руководство по ответственному использованию подробно описывают наборы данных, используемые для обучения этих моделей, используемые этапы фильтрации, очистки и обработки данных, а также перечисляют результаты их производительности в основных академических и отраслевых тестах.
Правовая защита: IBM предоставляет компенсацию прав интеллектуальной собственности для всех моделей Granite на платформе watsonx.ai, чтобы укрепить уверенность корпоративных клиентов в принятии этой модели.
Безопасность: IBM выпустила новую серию моделей Granite Guardian. Разработчики приложений могут создавать «защитные ограждения», проверяя подсказки пользователей и ответы LLM, чтобы заранее обнаруживать различные риски. Модели Granite Guardian 3.0 8B и 2B предоставляют самые полные возможности обнаружения рисков и опасностей на рынке; их также можно использовать с любыми другими открытыми или специализированными моделями ИИ для усиления механизмов защиты безопасности ИИ.
Ответственность: в дополнение к индикаторам опасности ИИ, таким как предвзятость, ненависть, ругань, ненормативная лексика, насилие и попытки нарушить ограничения, модель Granite Guardian также обеспечивает уникальные проверки, специфичные для RAG, например, основана ли она на фактах, релевантности контексту и релевантности ответам. В комплексной оценке 19 стандартов безопасности и RAG модель Granite Guardian 3.0 8B имеет общую точность обнаружения опасности, которая в среднем лучше, чем три существующие версии модели Llama Guard от Meta; ее общая производительность в обнаружении галлюцинаций также сопоставима с моделями WeCheck и MiniCheck, которые специально используются для обнаружения галлюцинаций.
Инклюзивность: модель Granite 3.0 обучается с использованием более 12 триллионов токенов данных; данные поступают из 12 различных естественных языков и 116 различных языков программирования, с использованием нового двухэтапного метода обучения и со ссылкой на тысячи экспериментальных результатов для оптимизации качества данных, выбора данных и параметров обучения. Ожидается, что к концу этого года (2024) модели Granite 3.0 8B и 2B будут поддерживать расширение до длины контекста 128K и мультимодальные модели, которые могут не только обрабатывать длинные тексты, но и анализировать сложные документы, содержащие текст и изображения.
Открытость: весь набор моделей Granite 3.0 и обновленные модели временных рядов можно загрузить на HuggingFace по разрешительной лицензии Apache 2.0. Новые переменные инструкций языковых моделей Granite 3.0 8B и 2B и модели Granite Guardian 3.0 8B и 2B доступны в продаже на платформе IBM WatsonX. Некоторые модели Granite 3.0 также будут предоставляться в виде микросервисов NVIDIA NIM и посредством интеграции Vertex AI Model Garden и HuggingFace от Google Cloud.
Чтобы предоставить разработчикам выбор и простоту использования, а также для поддержки локального развертывания и периферийных приложений, некоторые модели Granite 3.0 также доступны на Ollama и Replicate. Новое поколение моделей Granite расширяет обширный каталог открытых исходных кодов LLM IBM: IBM работает с такими партнерами, как AWS, Docker, Domo, Qualcomm Technologies Inc. (через Qualcomm® AI Hub), Salesforce, SAP и другими, чтобы интегрировать несколько моделей Granite в свои продукты или платформы.
Расширение прав и возможностей: IBM также объявила, что Granite 3.0 является моделью ИИ по умолчанию на сервисной платформе расширения прав и возможностей ИИ IBM Consulting Advantage. 160 000 консультантов IBM по всему миру могут легко и удобно применять модель Granite в различных сценариях клиентских приложений, таких как обслуживание клиентов или модернизация ИТ, чтобы предоставлять бизнес-ценность клиентам более гибким, эффективным и экономичным способом.