Phi-4

Microsoft представила линейку моделей Phi-4: сверхмасштабные ИИ для сложных задач

Корпорация Microsoft анонсировала три новые версии своих нейросетевых моделей — Phi-4-reasoning, Phi-4-reasoning-plus и Phi-4-mini-reasoning. Эти разработки позиционируются как инструменты для решения задач, требующих глубокого логического анализа, от школьных математических задач до научных расчетов. Особый интерес вызывает то, что даже самая компактная модель (3,6 млрд параметров) способна работать на смартфонах и IoT-устройствах без перегрузки систем.

Что нового в линейке Phi-4?

Главное отличие новых моделей — их фокус на сложных рассуждениях. В отличие от базовых LLM, которые генерируют ответы на основе статистических паттернов, Phi-4 строит цепочки рассуждений, имитируя многоэтапный процесс мышления. Это достигается за счет:

  • Тщательной дообучки на специально отобранных примерах, где уровень сложности и разнообразие задач строго контролируются;
  • Генерации демонстраций рассуждений с помощью модели o3-mini;
  • Усиления через RL (подкрепления) для версии Plus, которая генерирует более длинные и детализированные цепочки.

Сравнение с конкурентами: как Phi-4 обошла 671-миллиардную DeepSeek-R1

Одним из ключевых достижений стала победа Phi-4-reasoning-plus над моделью DeepSeek-R1 (671 млрд параметров) в тестах AIME 2025 — бенчмарке для оценки математических способностей ИИ. Это примечательно, так как DeepSeek-R1 считалась эталоном в задачах, требующих логики и абстрактного мышления.

При этом Phi-4-mini-reasoning, несмотря на скромные 3,6 млрд параметров, показала впечатляющую эффективность в решении задач от школьного уровня до сложных научных расчетов. Ее оптимизация позволяет запускать модель на устройствах с ограниченными ресурсами, что открывает возможности для применения в мобильных приложениях и умных устройствах.

Как Microsoft обучала модели?

Методология Microsoft включает два этапа:

  • Supervised fine-tuning (SFT) на датасете из «преподаваемых» примеров. Каждый пример проверялся на сложность и разнообразие, чтобы избежать переобучения;
  • Reinforcement learning (RL) для Phi-4-reasoning-plus, где модель получала обратную связь на основе результатов, а не только качества рассуждений.

По данным технического отчета, такой подход позволил улучшить не только производительность в специализированных задачах, но и общую способность к рассуждению — эффект, который ранее считался сложным для передачи через трансферное обучение.

Где можно использовать Phi-4?

Сценарии применения моделей:

  • Образование: автоматическая проверка домашних заданий с разбором ошибок;
  • Наука: анализ данных и построение гипотез;
  • Индустрия IoT: локальная обработка данных на устройствах без отправки в облако;
  • Разработка ПО: генерация кода с учетом логических ограничений.

Для разработчиков модели доступны на HuggingFace и через Azure AI, что упрощает их интеграцию в существующие системы.

Почему это важно для экосистемы ИИ?

Выпуск Phi-4 демонстрирует два тренда:

  • Оптимизация масштаба: Microsoft показала, что даже относительно небольшие модели (по современным меркам) могут конкурировать с гигантами при правильном обучении;
  • Локализация ИИ: Phi-4-mini-reasoning работает на смартфонах, что снижает зависимость от облачных сервисов и повышает конфиденциальность данных.

Это похоже на ситуацию с эмуляцией игр Doom на бытовых приборах — казалось бы, зачем запускать сложные модели на IoT-устройствах? Но именно такие эксперименты расширяют границы возможного, как это произошло с запуском GPT-3 на Arduino.

Заключение: что дальше?

Microsoft не останавливается на достигнутом. В техническом отчете упоминается, что текущие результаты — лишь шаг к созданию ИИ, способного к самостоятельному улучшению своих рассуждений. Следующим этапом может стать интеграция Phi-4 в продукты Microsoft (например, Copilot) и партнерские проекты.

Для сообщества разработчиков это отличная возможность протестировать передовые методы рассуждений в своих приложениях — без необходимости строить собственные 100-миллиардные модели. А для пользователей — шанс увидеть, как ИИ становится не просто помощником, а полноценным соавтором решений.

No-code specialist, always eager to learn and tackle challenges, exploring neural networks

Каталог НЕЙРОСЕТЕЙ и ИИ инструментов — FutureTools.ru