Здивування AI “Нецензорів” DeepSeek R1: Хто вирішує межі AI?


В ході, який привернув увагу багатьох, Здивування ai випустив нову версію популярної мови з відкритим кодом, яка позбавляє вбудованої китайської цензури. Ця модифікована модель, яка отримала назву R1 1776 (ім’я, що викликає дух незалежності), заснована на китайці DeepSeek R1. Оригінальний DeepSeek R1 зробив хвилі для своїх сильних можливостей міркувань-як повідомляється, конкуруючи з моделями вищого рівня за частку вартості-але воно має значне обмеження: він відмовився вирішувати певні чутливі теми.

Чому це має значення?

Це викликає вирішальні питання щодо Моніторинг AIупередженість, відкритість та роль геополітики в системах . У цій статті досліджено, що саме робило здивування, наслідки невдовзі моделі та того, як вона вписується у більшу розмову про прозорість та цензуру ШІ.

Що сталося: DeepSeek R1 залишається без цензури

DeepSeek R1-це велика мова з великою ваги, яка виникла в Китаї та здобула славу за свої чудові здібності до міркувань – Навіть наближаючись до продуктивності провідних моделей – все, будучи більш обчислювально ефективним. Однак користувачі швидко помічали химерність: щоразу, коли запити торкалися тем, чутливих до теми в Китаї (наприклад, політичні суперечки чи історичні події, які влада, що вважаються табу), DeepSeek R1 не відповість безпосередньо. Натомість він відповів консервованими, затвердженими державами заявами або відвертими відмовою, що відображає правила цензури уряду Китаю. Цей вбудований зміщення обмежило корисність моделі для тих, хто шукає відвертого або нюансованого дискусії з цих тем.

Рішення здивування AI полягало в тому, щоб «декенсор» моделі за допомогою широкого процесу після тренування. Компанія зібрала великий набір даних з 40 000 багатомовних підказок, що висвітлювали питання, що DeepSeek R1 раніше цензурував або відповідав ухиляючись. За допомогою експертів з людських експертів вони визначили приблизно 300 чутливих тем, де оригінальна модель, як правило, на ногу партії. Для кожного такого підказки команда курила фактичні, добре обґрунтовані відповіді на декількох мовах. Ці зусилля, що подаються в багатомовну систему виявлення та виправлення цензури, по суті навчають моделі, як визнати, коли вона застосовувала політичну цензуру та натомість реагувати на інформативну відповідь. Після цієї спеціальної тонкої настройки (яка здивованою на прізвисько “R1 1776”, щоб виділити тему свободи), модель була відкрито доступною. Задоволення стверджує, що усунуло китайські фільтри цензури та упередження від відповідей DeepSeek R1, не змінюючи інакше своїх основних можливостей.

Принципово важливо, що R1 1776 поводиться дуже по -різному щодо раніше табуючих питань. Задоволення наводило приклад, що включає запит про незалежність Тайваню та його потенційний вплив на ціну акцій – політично чутливу тему, яка торкається відносин Китаю – Тайвань. Оригінальний DeepSeek R1 уникав питання, відповідаючи на вирівнювані КПК, що вирівнюються. На відміну від цього, R1 1776 забезпечує детальну, відверту оцінку: в ній обговорюються конкретні геополітичні та економічні ризики (перебої ланцюгів поставок, нестабільність ринку, можливий конфлікт тощо), які можуть вплинути на акції Nvidia.

За відкритим джерелом R1 1776, здивування також зробило ваги моделі та змінює прозорі для спільноти. Розробники та дослідники можуть Завантажте його з обіймів обличчя і навіть інтегруйте його через API, гарантуючи, що видалення цензури можна було б перевірити та побудувати на інших.

(Джерело: здивування AI)

Наслідки усунення цензури

Рішення здивування AI усунути китайську цензуру з DeepSeek R1 має кілька важливих наслідків для спільноти ШІ:

  • Посилена відкритість та правдивість: Користувачі R1 1776 тепер можуть отримувати без цензури, прямі відповіді на раніше поза межами тем, що є виграшем для відкритого запиту. Це може зробити його більш надійним помічником для дослідників, студентів чи будь -кого, хто цікавиться чутливими геополітичними питаннями. Це конкретний приклад використання AI з відкритим кодом для протидії придушенню інформації.
  • Підтримується продуктивність: Існували занепокоєння, що налаштування моделі для усунення цензури може погіршити її ефективність в інших сферах. Однак, здивовано повідомляє, що основні навички R1 1776 – як математика та логічні міркування – залишаються нарівні з оригінальною моделлю. У тестах на понад 1000 прикладах, що охоплюють широкий спектр чутливих запитів, модель виявилася “повністю без цензури”, зберігаючи той самий рівень точності міркувань, що і DeepSeek R1. Це говорить про це Видалення зміщення (принаймні в цьому випадку) не прийшов ціною загальної розвідки чи можливостей, що є обнадійливим знаком для подібних зусиль у майбутньому.
  • Позитивний прийом та співпраця спільноти: Відкрито, що відкривається, Decensored Model, здивування запрошує спільноту ШІ перевірити та вдосконалити свою роботу. Це демонструє прихильність до прозорості – еквівалент AI проявлення своєї роботи. Ентузіасти та розробники можуть переконатися, що обмеження цензури справді зникають і потенційно сприяють подальшому вдосконаленню. Це сприяє довірі та спільних інновацій у галузі, де загальні закриті моделі та приховані правила помірності.
  • Етичні та геополітичні міркування: З іншого боку, повністю усунення цензури викликає складні етичні питання. Одне негайне занепокоєння полягає в тому, як може бути використана ця нецензурована модель У контекстах, де цензуровані теми є незаконними чи небезпечними. Наприклад, якщо хтось із материкового Китаю використовував R1 1776, не цензуровані відповіді моделі про площу Тяньаньмена або Тайвань можуть поставити під загрозу користувача. Існує також більш широкий геополітичний сигнал: американська компанія, що змінює модель китайсько-походження, щоб протистояти китайській цензурі, може розглядатися як смілива ідеологічна позиція. Сама назва “1776” підкреслює тему визволення, яка не залишилася непоміченою. Деякі критики стверджують це Заміна одного набору упереджень іншим можливим – По суті, сумніваючись, чи може модель тепер відображати західну точку зору в чутливих районах. Дебати підкреслюють, що цензура проти відкритості в ШІ – це не просто технічне питання, а політичне та етичне. Де одна людина бачить Необхідна помірністьінший бачить цензураі знайти правильний баланс складно.

Видалення цензури значною мірою відзначається як крок до більш прозорих та глобально корисних моделей AI, але воно також служить нагадуванням, що те, що AI слід скажімо, є чутливим питанням без універсальної згоди.

(Джерело: здивування AI)

Більша картина: цензура AI та прозорість з відкритим кодом

Запуск R1 1776 R1 1776 приходить в той час, коли спільнота AI стикається з питаннями про те, як моделі повинні обробляти суперечливий вміст. Цензура в моделях AI може надходити з багатьох місць. В Китаї, Технологічні компанії зобов’язані будувати у суворих фільтрах і навіть жорсткі відповіді на політично чутливі теми. Deepseek R1-це головний приклад цього-це була модель з відкритим кодом, але це чітко здійснило відбиток норм цензури Китаю у навчанні та тонкій настройці. Навпаки, багато моделей, розроблених на захід, як, наприклад, GPT-4 , або мета-лама, не призначені до керівних принципів КПК, але вони все ще мають помірковані шари (для таких речей, як мова ненависті, насильство чи дезінформація), які деякі користувачі називають «цензуром “. Лінія між розумна помірність і небажана цензура може бути розмитим і часто залежить від культурної чи політичної перспективи.

Те, що здивування AI зробив з DeepSeek R1, викликає думку про те, що моделі з відкритим кодом можуть бути адаптовані до різних систем цінностей або регуляторних середовищ. Теоретично можна створити кілька версій моделі: ту, яка відповідає китайським нормам (для використання в Китаї), а інший, який повністю відкритий (для використання в інших місцях). R1 1776 – це, по суті, останній випадок – нецензурна вилка, призначена для глобальної аудиторії, яка віддає перевагу нефільтрованим відповідям. Цей вид фальшивки можливий лише тому, що ваги DeepSeek R1 були відкрито доступними. Це підкреслює користь відкритого коду в AI: прозорість. Будь -хто може взяти модель і налаштувати її, будь то додавання гарантій або, як у цьому випадку, для видалення накладених обмежень. Відкрите пошук даних, код або ваг моделі також означає, що спільнота може перевірити, як модифікована модель. (Задоволення не повністю розкрило всі джерела даних, які він використовував для децензорування, а випустивши саму модель, яку вони дозволили іншим спостерігати за її поведінкою і навіть переплетувати її, якщо це потрібно.)

Ця подія також киває на більш широку геополітичну динаміку розвитку ШІ. Ми бачимо форму діалогу (або протистояння) між різними моделями управління для ШІ. Китайська розроблена модель з певними запеченими світоглядами приймається командою, що базується в США, і змінюється, щоб відобразити більш відкритий інформаційний етос. Це свідчення того, як Глобальний і безкордонний Технологія AI: дослідники в будь -якому місці можуть розвиватися на роботі один одного, але вони не зобов’язані переносити оригінальні обмеження. З часом ми можемо побачити більше випадків цього – де моделі “перекладаються” або коригуються між різними культурними контекстами. Це ставить питання про те, чи може AI коли-небудь бути справді універсальним, чи ми закінчимо версії, що стосуються регіону, які дотримуються місцевих норм. Прозорість та відкритість забезпечують один шлях для навігації: якщо всі сторони можуть перевірити моделі, принаймні розмова про упередженість та цензуру виходить на відкритому повітрі, а не приховано за корпоративною чи державною таємницею.

Нарешті, хід здивованості підкреслює ключовий момент у дискусіях про контроль AI: Хто може вирішити, що AI може чи не може сказати? У проектах з відкритим кодом ця влада стає децентралізованою. Громада – або окремі розробники – може вирішити реалізувати більш жорсткі фільтри або розслабити їх. У випадку R1 1776 р. Задоволення вирішила, що переваги нецензурної моделі переважають ризики, і вони мали свободу здійснити цей дзвінок і поділитися результатом публічно. Це сміливий приклад експерименту, який відкриває розвиток AI.



Джерело

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *