«Боротьба триває». Як відрізнити ШІ-зображення, відео або текст від контенту, створеного людиною

Зміст

Мережу наповнили тексти, зображення та відео, згенеровані штучним інтелектом. Навіть Coca-Cola не гидує інструментами генеративного штучного інтелекту — цьогорічний рекламний ролик компанія створила за допомогою Generative AI. Проте користувачі залишились явно невдоволені таким контентом. А копірайтер Олексій Шепелюк згадав, як в одній агенції з копірайтингу, куди він влаштувався, був гучний скандал, коли один з авторів текстів надіслав замовнику матеріал, згенерований за допомогою ChatGPT. Та й взагалі, як підкреслив тимлід Артем Рева: «Настає ера, де фейк вже складно відрізнити від реальності».

Отже, поки обіг ШІ-витворів ще не регулюється на законодавчому рівні, багатьом цікаво, як же відрізнити ШІ-контент від того, що створений справжньою живою людиною. dev.ua опитав і зібрав думки кількох експертів, які допоможуть у цьому питанні. Вони поділились інструментами та лайфхаками, як розпізнати витвори штучного інтелекту.

Про текст

Проблема визначення текстів, що були згенеровані штучним інтелектом, є актуальною, вважає Олександр Краковецький, CEO ІТ-компаній DevRain і DonorUA, автор книжки «ChatGPT, DALL·E, Midjourney. Як генеративний штучний інтелект змінює світ». Він поділився з dev.ua своїми спостереженнями щодо контенту, згенерованого штучним інтелектом.

Він нагадав, що першою, хто спробував зробити класифікатор, була, власне, компанія OpenAI. Але після певних спроб проєкт був заморожений через низький рівень точності:

As of July 20, 2023, the AI classifier is no longer available due to its low rate of accuracy. We are working to incorporate feedback and are currently researching more effective provenance techniques for text, and have made a commitment to develop and deploy mechanisms that enable users to understand if audio or visual content is AI-generated.

Спроби зробити класифікатор із того часу не припиняються, недавно компанія з українським корінням Grammarly випустила власний класифікатор. Вони знаходять певні патерни та статистичні залежності, які можуть вказувати на те, що текст був згенерований. Однак достовірність роботи все ще під питанням.

Крім того, на один класифікатор припадає кілька сервісів, які займаються тим, що роблять тексти більш «людськими».

«Тому боротьба триває», — зазначив Олександр Краковецький.

Наразі, щоб визначити чи був текст згенерований, CEO ІТ-компаній DevRain порадив кілька підказок, якими можна скористатись:

Текст занадто ідеальний і/або без помилок. Звісно, є люди, які вміють писати блискучі і граматично/стилістично правильні тексти, однак більшість з нас все ж пише доволі посередні тексти й часто допускає ті чи інші помилки. Тому завдання умовних «хюманізаторів» — додати неідеальність.
Стиль текстів є нейтральним і збалансованим. Кожна людина має свою думку, тому «людські тексти» мають певний стиль і чіткість в аргументації. Штучний інтелект намагається бути нейтральним і ця нейтральність часто дуже є помітною.
Вживання «якорних» слів (стосується, першою чергою, ChatGPT). Це більш помітно в текстах англійською мовою, де часто можна зустріти такі слова як delve, cutting-edge, leveraging та інші, частота вживання яких збільшилась на порядки після того, як ChatGPT стали використовувати для написання текстів.
Структура побудови текстів. На перший погляд, це не помітно, але при довготривалому використанні починаєш бачити структурні патерни, які використовують ті чи інші моделі. Тому іноді в запит потрібно додатково включати формат відповіді, щоб приховати ці шаблони.

Попри те, що ці поради можуть допомогти визначити факт використання штучного інтелекту, довести це доволі важко, бо використання тих чи інших слів, структурних шаблонів не заборонено. І рано чи пізно згенеровані тексти будуть використовуватись в усіх сферах життя. Тому потрібно працювати над вмінням генерувати якісні тексти та акцентувати увагу на суть текстів, а не їх обсяг.

Крім того, Олександр підтвердив, що текст його коментаря був на 100% написаний людиною. «Grammarly зі мною погоджується», — додає він.

Product Copywriter Ксенія Куца завжди знає, коли автори надсилають текст, написаний GPT. Тексти, згенеровані GPT від нормального людського тексту відрізняє те саме, що відрізняє хороший текст від посереднього, вважає вона:

1. Шаблонна структура, яка повторюється.

Спочатку голосна заява («У сучасному світі…»).
Далі йде серединка з кволими прикладами
І на фінал кол ту екшон із 90-х: «Зробіть це прямо зараз!» ©

2. Складний синтаксис, важкий люкс та абстракції із зайвими уточненнями чи надмірними сполучниками. Як тут:

«У світі, де клієнти шукають більше, ніж просто продукт, маркетинг 2024 року — це про значущі зв’язки та задоволення реальних потреб аудиторії ©
«Ці тренди допоможуть вам не тільки утримувати увагу клієнтів, але й створювати довіру, яка формує стійкий попит.» ©

3. Вигадана статистика.

GPT часто додає цифри, які звучать правдоподібно, але не завжди точні. Оці всі» 90% клієнтів довіряють брендам”©.
GPT не має доступу до реального часу, перевіряйте такі дані. UPD: виправили в коментах, дякую: вже може. Але любить фантазувати.

4. Штампи. Причому, якщо текст об’ємний, ці штампи дублюються. Зокрема:

«У сучасному світі кожна секунда має значення.»
«Маркетинг — це потужний інструмент для збільшення прибутків.
«Секрет вашого успіху — це…»
«Створіть довіру і отримайте довготривалу лояльність клієнтів.
«Це змінює правила гри.»
«Це рішення ідеально підходить для всіх.»
«Технології змінюють правила гри.»
«Цифрова трансформація вашого бізнесу.»

5. Скопійований текст із чату GPT має досить характерні та впізнавані емоджі.

Золотий набір:

Кілька підказок щодо промтів від Ксенії:

Просіть машину прибрати абстракції і додати конкретику. Замінити загальні фрази фактами, прикладами або цифрами.
Просіть використовувати природній тон оф войс. Наприклад, «пиши текст від імені друга, який ділиться своїм досвідом».
Залучайте локальний контекст: GPT краще працює з деталями, якщо попросити використати конкретний приклад з вашої галузі чи країни.
Просіть додавати зрозумілі аналогії зі світу вашої аудиторії.

В мережі своїми лайфхаками щодо розпізнавання ШІ-тексту поділились й інші спеціалісти, а також враженнями від співпраці із GPT щодо текстів, зокрема:

SEO-спеціаліст / Project Manager Володимир Задор виявляє GPT по реченнях, які задумувалися англійською, але написані українською. «Начебто англомовна людина писала, яка дуже-дуже хоче вивчити українську, але поки що думає англійською», — пише фахівець.
Social Media Marketing Manager Назарій Вакула багато працює з ШІ в плані написання текстів і поки не побачив, що він може замінити людину. «Навіть із вдалими промптами тексти треба суттєво редагувати, переписувати, доповнювати. А це теж може робити тільки той чи та, хто вміє писати», — повідомив він.
«GPT добре працює, коли даєш йому інформацію, яку треба обробити. У інших випадках — це бідося», — пише маркетолог Аліна Чух.

Про відео

Відео можна згенерувати або з текстового опису, або зі статичного зображення (тобто «оживити його»), повідомив Олексій Мінаков, експерт із піару, комунікацій і застосування технологій AI.

Він розповів, що відео можна згенерувати або з текстового опису, або зі статичного зображення (тобто «оживити його»). Зараз більш реалістичні відео виходять саме зі статичного зображення. Їх і найскладніше відрізнити від тих, що знімаються на камеру. Але є декілька обмежень, які мають такі згенеровані відео. Наприклад, довжина відео. Поки технології дозволять більш-менш якісно згенерувати такі відео тривалістю 5 секунд. Якщо його уповільнити, буде трохи довше. Але все одно одним кадром це не буде дуже тривале відео саме у форматі реалізму.

Крім того, у відеогенераціях можливі так звані «артефакти», дефекти та спотворення: розмиття деталей, дивні або неправильні розташування об’єктів. Відеогенерація групових взаємодій (наприклад, натовпу чи кількох людей, які взаємодіють) також поки що складна, особливо якщо йдеться про фізику руху. Узагалі дотримання законів фізики — мабуть, найслабше місце поки, бо в цих моделей немає здорового глузду. Навіть у потужній моделі Sora від OpenAI, яку вже майже рік тестують окремі креатори, але яка ще недоступна всім, спостерігаються ці проблеми.

«Окремо я б виділив відео з цифровими копіями людей. Там складніше розпізнати. Бо тривалість може бути довгою, а цифрова копія імітує міміку, жести та голос цифрового оригінала-людини», — додав Олексій Мінаков.

На додаток, це може бути не статичне відео, а в динаміці, з рухом камери. Можна, звичайно, придивлятися і шукати певну «механічність» або патерни рухів, але з кожним місяцем технології розвиваються так, що просто візуально майже не відрізнити від знятого на камеру відео. Особливо, якщо застосовується технологія, коли на міміку та губи справжньої людини накладається інша людина.

Є декілька сервісів, які показують імовірність того, що відеоконтент згенерований ШІ, але всі вони орієнтовані на розпізнавання діпфейків, а не згенерованих ШІ відео загалом:

Deepware scanner — сканує чи відео є діпфейком.
AI-generated content detection — Моделі машинного навчання для виявлення контенту, створеного ШІ.
Sensity AI — виявлення глибоких фейків на основі штучного інтелекту для відео, зображень, аудіо.
AI or NOT — виявляє створені штучним інтелектом зображення й аудіо для бізнесу та для себе за допомогою штучного інтелекту чи ні (у них скоро з’явиться VIDEO AI CHECKER).

Про зображення

Артдиректорка GrandMa Studios і художниця Беата Куркуль розповіла про головні відмінності, на які варто звернути увагу, аналізуючи зображення. Зокрема, у ШІ-картинках зазвичай:

Багато ідеальності. Картинки «відполіровані», надто красиві, як правило, містять досить стандартне ефектне освітлення.
Помилки в анатомії — проблема рук залишилася, як і проблема ніг — їх нейромережі, зокрема Midjourney, генерує не завжди коректно.
Особи по дефолту (якщо не прописати в промпті інших характеристик) — шаблонно красиві, з розфокусованим поглядом. У дівчат зазвичай чуттєві, млосно-відкриті губи. І загалом ці ШІ-красуні досить стандартні.
Якщо генерується архітектура, то завжди будуть якісь артефакти в будівництві будинків — нерівні віконні рами, архітектурні елементи, неповна симетрія, дроти, що зникають у стінці тощо.
Наявність різних фонових артефактів (які можуть сприйматися як художній задум) — типу гілки, якісь лінії, якісь плями тощо.
Неправильне відображення тексту, написів і т. д.

ШІ в принципі непогано справляється з усіма типами зображень, доки не потрібні якісь специфічні конкретні елементи, наприклад, український піксельний камуфляж, тобто те, що не дуже добре представлено в інтернет-візуалі. Тож у кращому разі ШІ згенерує щось схоже на український піксель, у гіршому — істинно-кацапський піксель.

Також ШІ поки не дуже добре генерує складне світло у зображеннях — навіть якщо прописується кілометровий промпт, де вказується, що і як має бути освітлено.

Не дуже добре виходить генерувати пози людей — якщо це не якісь стандартні стереотипні. Вони часто виходять «пластиліновими», неприродними.

Навіть за наявності референсу, далеко не завжди правильно генерується техніка та механізми — за винятком загальновідомих (наприклад, болід «Феррарі» у Ф1 або Зоряний Руйнівник із «Зоряних Війн»).

«Інструментів, які б допомогли визначити, що це візуал ШІ, поки що немає. Можливо, десь над такими програмами працюють. Поки що ми покладаємося на власні очі, нагляд, уважність», — зауважує Беата Куркуль.

Спеціалісти Endertech радять виконувати пошук зображення, щоб спробувати визначити його джерело. Навіть фотографії, які опубліковані в багатьох постах соцмереж, можуть бути згенеровані. Тож експерти рекомендують шукати зображення, яке зацікавило, на авторитетних новинних сайтах. Якщо фото там не має — скоріш за все воно виготовлене штучно.

Tech lead / Technical product owner Віталій Богачук навів приклад AI-згенерованого фото, на якому виділив ключові зони, які видають штучне походження.

Крім того, ілюстраторка Ірина Сичова додала, що у людей на ШІ-фото дуже однакові, пластикові «ширі» посмішки. «Обличчя як в музеї мадам Тюссо», — підкреслила Ірина. А фотограф та SMM-менеджерка Марія Чорман звернула увагу, що фото людей, згенеровані штучним інтелектом, одразу видно по структурі шкіри.

Джерело