Розробники можуть використовувати Patronus AI для порівняння набору великих мовних моделей і визначення, яка з них найкраще підходить для конкретного проєкту. Платформа також обіцяє полегшити кілька супутніх завдань, таких як виявлення технічних проблем у додатках ШІ після їхнього розгортання.
Цей інструмент бізнес може інтегрувати у свої робочі процеси, які пов’язані з ШІ.
«Ви можете налаштувати оцінку відповідно до потреб свого продукту. Ми дозволяємо клієнтам писати англійською те, що вони хочуть оцінити та перевірити», — сказав Ананд Каннаппан, генеральний директор Patronus AI, в інтерв’ю VentureBeat. Наприклад, компанія, яка надає фінансові послуги, може визначати правила дотримання нормативних вимог, тоді як постачальник медичних послуг може зосередитися на конфіденційності пацієнтів і медичній точності.
В основі платформи лежить Lynx — ШІ-модель виявлення галюцинацій, яка на 8,3% перевершує GPT-4 у виявленні медичних неточностей.
Платформа працює на двох швидкостях: версія швидкого реагування для моніторингу в режимі реального часу та більш ретельна версія для глибшого аналізу. Малі версії можна використовувати для моніторингу в режимі реального часу, а великі можуть бути більш придатними для офлайн-аналізу, сказали у стартапі.
Окрім традиційної перевірки помилок, стартап розробив спеціалізовані інструменти, такі як CopyrightCatcher, який виявляє, коли системи штучного інтелекту відтворюють захищений контент, і FinanceBench, перший у галузі бенчмарк для оцінки ефективності штучного інтелекту у фінансових питаннях. Ці інструменти працюють разом із Lynx, щоб забезпечити комплексний захист від збоїв у роботі ШІ.
Patronus AI вже залучив таких клієнтів, як HP, AngelList та Pearson, а також уклала угоди про партнерство з такими технологічними гігантами, як Nvidia, MongoDB та IBM.
Компанія прийняла модель оплати в міру використання, починаючи з $10 за 1000 викликів API для менших оцінювачів і $20 за 1000 викликів API для великих.