Что такое Data Formulator и как он создаёт визуализации с ИИ
Data Formulator — экспериментальное приложение от Microsoft Research, использующее большие языковые модели для преобразования сырых данных в насыщенные интерактивные визуализации. Этот инструмент объединяет классический пользовательский интерфейс с возможностью ввода запросов на естественном языке, позволяя автоматически генерировать сложные графики и диаграммы без углублённых навыков программирования.
Установка: локально или в облаке
- Через PIP: Установка Python-пакета командой
pip install data_formulatorдля локальной работы - GitHub Codespaces: Запуск в предконфигурированной облачной среде без настройки
- Режим разработчика: Полный контроль над окружением через Docker-контейнеры
Как работает процесс создания визуализации
- Авторизация: Ввод API-ключей OpenAI и выбор модели (например, GPT-4)
- Определение формата: Указание типа диаграммы (столбчатая, точечная и др.) через интерфейс или текстовый запрос
- Трансформация данных: Автоматическое вычисление агрегаций, фильтрация и перекодирование силами ИИ
- Валидация: Одновременный просмотр финальной визуализации, исходных данных и сгенерированного кода Python/Vega-Lite
Для разработчиков и исследователей
Проект включает детальное руководство по созданию пользовательских инструментов анализа данных. Он основан на исследованиях Microsoft: “Формуляр данных 2: Итеративное создание насыщенных визуализаций” и “Формуляр данных: разработка концептуальной визуализации“, изучающих взаимодействие ИИ с визуальной аналитикой.
Участие в открытом проекте
Data Formulator принимает пул-реквесты и предложения через GitHub при соблюдении:
- Подписания Contributor License Agreement (CLA)
- Следования Microsoft Open Source Code of Conduct
- Уважения к торговым маркам Microsoft и третьих сторон
Исходный код доступен для изучения и модификации под открытой лицензией. Скачать или клонировать проект можно в репозитории: GitHub Microsoft/data-formulator.




