Компанії наймають кваліфікованих фрилансерів для написання навчальних даних для ШІ. Тренувальні дані, які зараз наявні в інтернеті, можуть закінчитися вже до 2026 року


Оскільки моделям штучного інтелекту бракує даних для навчання, компанії, що займаються розробкою ШІ, все частіше звертаються до людей для написання навчального контенту.

Протягом багатьох років компанії використовували фрилансерів для навчання моделей штучного інтелекту таким простим завданням, як ідентифікація за фотографіями, коментування даних і маркування. Але технологія, що стрімко розвивається, потребує більш кваліфікованих працівників для її навчання. Про це пише Business Insider.

Такі компанії, як Scale AI та Surge AI вже наймають працівників з вищою освітою для написання есе та творчих підказок для ботів. Scale AI, наприклад, минулого року оголосила про вакансію для людей зі ступенем магістра або доктора філософії, які вільно володіють англійською, хінді або японською мовами й мають професійний досвід написання текстів у таких сферах, як поезія, журналістика та видавнича справа.

Вони повинні допомогти ШІ-ботам «стати кращими письменниками», йдеться у повідомленні Scale AI. І для такої роботи потрібна ціла армія працівників. За даними Times, на платформі Scale AI одночасно працюють десятки тисяч фрилансерів.

«Що дійсно робить ШІ корисним для користувачів, так це людський шар даних, і це дійсно повинні робити розумні люди, кваліфіковані люди й люди з певним рівнем знань і творчим підходом. У результаті ми зосередилися на фрилансерах, особливо в Північній Америці», — сказала Віллоу Прімак, віцепрезидент з операцій із даними в Scale AI.

Великі компанії вже намагаються знайти нові дані для навчання своїх технологій. Це пов’язано з тим, що програми навчаються так швидко, що їм вже не вистачає доступних ресурсів для навчання.

Величезна скарбниця інформації в інтернеті — від наукових праць до новин і сторінок Вікіпедії — вичерпується. Epoch, дослідницький інститут штучного інтелекту, попередив, що до 2026 року штучний інтелект може вичерпати дані.

Тому компанії знаходять все більш креативні способи переконатися, що їхні системи ніколи не перестануть навчатися. Google розглядає можливість доступу до даних своїх клієнтів у Google Docs, Sheets і Slides, а компанія Meta навіть думала про купівлю видавництва Simon & Schuster, щоб зібрати його книжкову колекцію.

Нагадаємо, що Федеральна торгова комісія (FTC) досліджує план Reddit дозволити компаніям штучного інтелекту використовувати створений користувачами контент для навчання свого програмного забезпечення.



Джерело

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *