Large 2 демонстрирует сопоставимые результаты с передовыми моделями в генерации кода, математических задачах и логических рассуждениях.
Релиз Large 2 последовал за выпуском Llama 3.1 модели Llama 3.1 405b с открытым исходным кодом. Важно отметить, что Mistral Large 2 опережает Llama 3.1 405B по производительности в генерации кода и решении математических задач.
Одной из ключевых задач при обучении Large 2 было снижение риска галлюцинаций. Модель была обучена быть более разборчивой в своих ответах и признавать, когда она чего-то не знает.
Mistral привлекла $640 млн в раунде финансирования серии B, что оценило компанию в $6 млрд.
Mistral Large 2 не имеет открытого исходного кода, для коммерческого использования требуется платная лицензия.
Модель отличается следующими характеристиками:
- Окно обработки в 128 000 токенов: это позволяет обрабатывать большое количество данных за один запрос.
- Многоязыковая поддержка: модель поддерживает более 80 языков программирования.
- Более краткие ответы: Mistral утверждает, что Large 2 выдает более краткие ответы, чем ведущие модели ИИ.
Large 2 доступна для использования в Google Vertex AI, Amazon Bedrock, Azure AI Studio и IBM Watsonx.ai.
Появление Mistral Large 2 – это еще один шаг в развитии искусственного интеллекта. Конкуренция между разработчиками моделей ИИ только усиливается, что приводит к постоянному улучшению технологий и расширению их возможностей.