В пятерке лидеров:
Для анализа и составления рейтинга SolidityBench применялись два бенчмарка NaïveJudge и HumanEval, разработанных для оценки и ранжирования мастерства ИИ-моделей в генерации кода для смарт-контрактов.
Код от нейросетей оценивался на основе «строгих критериев» вроде реализации ключевых функций, обработки крайних случаев, работы с ошибками, правильного использования синтаксиса, общей структуры и поддерживаемость. Также анализировалась эффективность использования газа и управление хранением.
Диапазон баллов варьируется от 0 до 100, обеспечивая комплексную оценку функциональности, безопасности и эффективности.
Ранее Meta разработала ИИ-инструмент CodeCompose для генерации программного кода.
Напомним, в сентябре Google выпустила две обновленные версии моделей Gemini 1.5, которые продемонстрировали улучшения в работе с языками программирования.
от
Метки:
Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.