Найбільший україномовний каталог інструментів ШІ.
Дослідити каталогСлава Україні! Героям Слава!
Найбільший україномовний каталог інструментів ШІ.
Дослідити каталогСлава Україні! Героям Слава!

APIEval-20 — це відкритий бенчмарк для тестування API за допомогою ШІ-агентів. Цей інструмент буде корисним для українських розробників та тестувальників, які займаються автоматизацією тестування API. Безкоштовний тариф.
APIEval-20 is a black-box benchmark for API testing agents. Each agent gets only a JSON schema and one sample payload, then generates a test suite. We run those tests against live reference APIs with planted bugs and score bug detection, API coverage, and efficiency. Unlike LLM-as-judge evals, scoring is fully objective: a bug is either caught or it isn’t. Tasks span auth, errors, pagination, schemas, and multi-step flows. Open on Hugging Face.