Американський стартап Patronus AI розробив перший self-serve API для зупинки галюцинацій ШІ. Це як перевірка орфографії для штучного інтелекту

Patronus AI, стартап із Сан-Франциско, запустив першу платформу для виявлення та запобігання збоям ШІ в режимі реального часу. Цей новий інструмент призначений допомогти розробникам гарантувати, що їхні програми штучного інтелекту генерують точні результати.

Уявіть собі, що це складна перевірка орфографії для систем штучного інтелекту, яка виявляє помилки ще до того, як вони досягнуть користувачів.

Розробники можуть використовувати Patronus AI для порівняння набору великих мовних моделей і визначення, яка з них найкраще підходить для конкретного проєкту. Платформа також обіцяє полегшити кілька супутніх завдань, таких як виявлення технічних проблем у додатках ШІ після їхнього розгортання.

Цей інструмент бізнес може інтегрувати у свої робочі процеси, які пов’язані з ШІ.

«Ви можете налаштувати оцінку відповідно до потреб свого продукту. Ми дозволяємо клієнтам писати англійською те, що вони хочуть оцінити та перевірити», — сказав Ананд Каннаппан, генеральний директор Patronus AI, в інтерв’ю VentureBeat. Наприклад, компанія, яка надає фінансові послуги, може визначати правила дотримання нормативних вимог, тоді як постачальник медичних послуг може зосередитися на конфіденційності пацієнтів і медичній точності.

В основі платформи лежить Lynx — ШІ-модель виявлення галюцинацій, яка на 8,3% перевершує GPT-4 у виявленні медичних неточностей.

Платформа працює на двох швидкостях: версія швидкого реагування для моніторингу в режимі реального часу та більш ретельна версія для глибшого аналізу. Малі версії можна використовувати для моніторингу в режимі реального часу, а великі можуть бути більш придатними для офлайн-аналізу, сказали у стартапі.

Окрім традиційної перевірки помилок, стартап розробив спеціалізовані інструменти, такі як CopyrightCatcher, який виявляє, коли системи штучного інтелекту відтворюють захищений контент, і FinanceBench, перший у галузі бенчмарк для оцінки ефективності штучного інтелекту у фінансових питаннях. Ці інструменти працюють разом із Lynx, щоб забезпечити комплексний захист від збоїв у роботі ШІ.

Patronus AI вже залучив таких клієнтів, як HP, AngelList та Pearson, а також уклала угоди про партнерство з такими технологічними гігантами, як Nvidia, MongoDB та IBM.

Компанія прийняла модель оплати в міру використання, починаючи з $10 за 1000 викликів API для менших оцінювачів і $20 за 1000 викликів API для великих.

Джерело

Схожі Новини

Залишити відповідь Скасувати коментар

Схожі Новини