JetBrains представила первый открытый AI-модель для написания кода
Mellum: инновационная модель для дополнения кода теперь доступна на платформе Hugging Face
JetBrains, известная своими популярными инструментами для разработки приложений, представила свою первую открытую AI-модель для работы с кодом. В среду компания сделала доступной модель Mellum на платформе AI-разработок Hugging Face. Mellum, разработанная в прошлом году для различных программных пакетов компании, обучена на более чем 4 триллионах токенов и оснащена 4 миллиардами параметров, предназначена специально для автодополнения кода, то есть завершения фрагментов кода на основе контекста.
Параметры модели приблизительно соотносятся с её способностями к решению задач, тогда как токены представляют собой сырые данные, обрабатываемые моделью. Миллион токенов примерно эквивалентен 30 000 строк кода.
"Созданная для интеграции в профессиональные инструменты для разработчиков, такие как интеллектуальные подсказки в интегрированных средах разработки, AI-помощники для кодирования и исследовательская работа над пониманием и генерацией кода, Mellum также подходит для образовательных целей и экспериментов с настройкой," объясняет JetBrains в техническом отчёте.
JetBrains сообщает, что обучала Mellum, имеющую лицензию Apache 2.0, на данных, включающих код с разрешительными лицензиями из GitHub и статьи с англоязычной Википедии. Обучение заняло около 20 дней на кластере из 256 видеокарт Nvidia H200.
Для работы с Mellum требуется некоторая настройка. Базовую модель нельзя использовать сразу; её необходимо предварительно настроить. Хотя JetBrains предоставила несколько моделей Mellum, настроенных для Python, компания предупреждает, что они предназначены для оценки потенциальных возможностей, а не для использования в производственной среде.
AI, создающий код, безусловно, изменяет методы разработки программного обеспечения, но также вводит новые проблемы безопасности. По данным опроса 2023 года платформой безопасности для разработчиков Synk, более 50% организаций сталкиваются с проблемами безопасности вследствие кода, генерируемого AI, иногда или часто.
JetBrains также отмечает, что Mellum может отражать предвзятости, присутствующие в публичных кодовых базах, и код, предложенный моделью, может быть небезопасным или уязвимым.
"Это только начало," — говорится в блоге JetBrains. "Мы не гонимся за универсальностью, мы стремимся к фокусу. Если Mellum вдохновит хотя бы на один значимый эксперимент, вклад или сотрудничество, мы сочтём это успехом."