Где сидит кошка? Екатерина Марголис – об оговорке в телеэфире

Мы живём в эпоху предсказаний – и не в мистическом, а в самом буквальном смысле. И человеческий разум, и современные технологии основаны на прогнозах, которые исходят из огромного корпуса прошлого опыта – прежде всего языкового.

Не только человеческий интеллект, но и ИИ прогнозирует будущее, основываясь на данных прошлого. Пусть даже на уровне одного предложения.

Современные когнитивные науки на стыке лингвистики и программирования занимаются исследованиями, которые ложатся в основу языковых моделей ИИ. Все они построены на предсказаниях следующего слова – word prediction.

В простейшем виде задача выглядит так: есть начало текста, и модель должна угадать, какое слово (или символ) с наибольшей вероятностью будет следующим.

Например:

Вход: "Кошка сидит на"...

Модель оценивает вероятности:

• "стуле" — 0.45

• "окне" — 0.30

• "дереве" — 0.10

• "машине" — 0.05

Наиболее вероятный, исходя из статистики, вариант – "стуле".

В области человеческого интеллекта на это накладывается контекст и окружение, наиболее частотные выражения и даже визуальные образы.

С моделью все проще.

Модель работает не с целыми словами, а с токенами – кусочками текста (слова, части слов, знаки препинания).

Например, слово "невероятный" может быть разбито на токены: "не", "вероят", "ный".

Это упрощает работу модели и позволяет покрывать огромный словарь, комбинируя кирпичики смыслов.

Принцип прост: контекст → векторные представления (эмбеддинги) → распределение вероятностей → выбор токена → добавление его в контекст. Так, шаг за шагом рождаются предложения, статьи, диалоги.

Язык – не просто выразитель идеологии, он ее формирует. И оговорка ведущей "Дождя" тому наглядный пример

Постепенно модель обучается, и на огромных текстовых корпусах учится распознавать и генерировать грамматику (иначе не угадаешь правильные окончания), учитывать смысл (иначе не предскажешь логичное продолжение), распознавать контекст и стиль (иначе не угадаешь уместный тон речи).

В итоге простая механика превращается в эффект "понимания".

Чтобы "говорить целыми предложениями", модель просто многократно применяет эту операцию:

1. Берёт уже сгенерированный контекст

2. Предсказывает следующий токен

3. Добавляет его к контексту

4. Повторяет

Так строится диалог, эссе, код – всё, что угодно.

Когнитивные процессы и механизмы, подобные word prediction, влияют на речь и мышление человека.

В человеческом сознании тоже работает механизм "предсказания следующего слова".

Когда мы говорим, мозг заранее готовит возможные продолжения фраз. Эти "кандидаты" берутся не только из сознательных убеждений, но и из частоты встречаемости словосочетаний в среде, и из визуальных образов слова в сознании. В любом случае человек не придумывает каждое слово с нуля, а достаёт готовые паттерны – клише, устойчивые словосочетания.

Недавно журналистка известного своими оговорками телеканала "Дождь" Анна Монгайт, комментируя встречу Зеленского с европейскими лидерами и президентом США, произнесла: "Глава киевского… эээ… режима", а затем попыталась исправиться.

Фраза вызвала бурную реакцию, но интересна она не только сама по себе.

Дело в том, что словосочетание "киевский режим" – устойчивый шаблон, постоянно звучащий в российском медиапространстве. Если сравнить его употребление с выражениями, вроде "киевский торт" или "Киевский вокзал", станет очевидно: первое используется намного чаще.

Поэтому мозг русскоязычной журналистки автоматически "подтянул" привычный вариант.

У человека: "корпус данных" есть лингвистическая среда, в которой он живёт.

У модели (GPT и др.): "корпус данных" – это тексты, на которых её обучали.

В обоих случаях следующее слово определяется статистической силой привычного словосочетания.

Теперь зададимся самым интересным вопросом: почему лингвистическая медиасреда оппозиции не отличается от официальной?

Да, оговорка Монгайт не означает, что она разделяет риторику Кремля, но она однозначно указывает на то, что в её лингвистическом окружении словосочетание "киевский режим" звучит чаще всего, и поэтому сознание, работающее по принципу word prediction, выдает этот вариант первым.

Связано ли это с профессиональной необходимостью мониторить официальные российские СМИ? Возможно.

Но факт остаётся фактом. Отравленный воздух и контекст не щадят никого. И даже тот, кто покинул Россию, но продолжает сохранять тесные связи с ее языковым пространством, получает лингвистическую инфекцию русского мира воздушно-капельным путем.

Язык – не просто выразитель идеологии, он ее формирует. Формирует на нейроуровне. И оговорка ведущей "Дождя" тому наглядный пример.

Именно поэтому российские власти целенаправленно уничтожают украинские книги, учебники и культуру на оккупированных территориях и фактически вводят запрет на преподавание украинского и на украинском (а вспомним расстрелы людей в Мариуполе, Изюме и других городах только за то, что они отвечали оккупантам на своем языке).

Контроль над языком – ключ к контролю над колонизированными народами

В этом, увы, нет ничего нового – задолго до эпохи нейроисследований и лингвистических открытий российская империя интуитивно понимала, что контроль над языком – ключ к контролю над колонизированными народами. Он же и меч.

И нынешние инициативы российских властей по сокращению и отмене преподавания родных языков в регионах – продолжение той же сознательной политики подавления потенциальных очагов сопротивления.

Неслучайно слово "деколонизация" является таким триггером и для официальных, и для оппозиционных СМИ – например, "Новой Газеты Европа", где публикуются статьи Юлии Латыниной с инвективами в адрес "деколонизаторов" (непременно в кавычках).

Это общий знаменатель.

Точнее главное общее знамя – империя. Ментальная территория отражает географическое пространство и наоборот – посредством языка.

Именно поэтому Путин так настаивает на русском языке как официальном в Украине. Вся идеология защиты русскоязычия, подхваченная и оппозиционной интеллигенцией в РФ, и эмигрантами, и все москвоцентричные премии, издательства, СМИ вне зависимости от их идеологической направленности будут неизбежно нести в себе нейролингвистику русского мира, а значит работать на него и транслировать прямо или косвенно, сознательно или бессознательно его законы и иерархии.

Именно на нейролингвистическом уровне при наличии ресурсов, с помощью технологий и тиражирования контента и соответственно массовости контекстов, на которых будут обучаться русскоязычные модели ИИ – уже не через телевизор, а с помощью этих технологий можно будет всегда поддерживать "русский мир" в бывших колониях, и он будет завоевывать и разрушать гражданские демократические общества изнутри, потому что это ровно тот самый мир, который несовместим со своим омонимом: устойчивым и прочным миром.

От word prediction до war prediction один шаг.

Через язык империи русский мир будет паразитировать на всем, в том числе на новейших технологиях, на ИИ в первую очередь, как уже давно паразитирует на свободе слова и инструментах демократии (см. вмешательства в Брекзит и американские выборы и другие диверсии), на соцсетях и базовых потребностях человека в общении и уважении (см. конспирологию как инструмент пропагандистского влияния на самые уязвимые и необразованные слои населения).

Смотри также Плацдарм "русского мира". Екатерина Марголис – об Италии и RT

Свобода слова – это свобода выбирать свои слова

Он предсказуем в том, что несет в себе на уровне лингвистических структур императив деструктивной нормализации и нормализованного насилия как залог собственного существования. И будет нести, пока его не остановить. Это не свойство, а суть, modus vivendi et operandi.

Но есть и хорошие новости: мы наделены свободой воли. В том числе воли лингвистической.

Свобода слова – это свобода выбирать свои слова.

И даже если на языке крутится навязанное историческим и культурным бэкграундом, средой, привычкой, контекстом, конформизмом и удобством (экономией внутренних усилий и ресурсов) слово, мы вольны выбрать другое. Мы можем сопротивляться.

Чем больше людей будет совершать это усилие, тем быстрее изменится контекст – а значит, и будущее.

И предсказание, каким будет следующее слово мира, зависит буквально от каждого. Это не метафора, а технология.

Этот текст написан по-русски и отредактирован с помощью ИИ. Это не просто эксперимент. Это осознанный выбор. Потому что сопротивление возможно и в языке, и с помощью современных технологий.

Преодоление сопротивления материала тоже. Писать по-русски то, чему этот язык сопротивляется, что ему исторически и культурно чуждо – трудная, но необходимая задача.

В этом и состоит акт лингвистического сопротивления: создавать новые смыслы, которые смогут изменить будущее корпуса текстов, на которых будут учиться нейтральные технологии. И в этом лингвистическом сопротивлении залог не только нынешнего противостояния русскому миру и войне и навязанной ими предсказуемости, устойчивых контекстов, иерархий и нарративов, но и построения иного будущего – иных слов, в ином порядке. Иных контекстов. В построении иного корпуса текстов, на которых тоже будут тренироваться стремительно развивающиеся, но совершенно равнодушные к ценностям технологии.

Конструктивное сопротивление состоит не в борьбе с ИИ, соцсетями, развитием технологий и прогрессом, а в порождении смыслов, способных противостоять использованию их во зло.

Екатерина Марголис – художница и писательница

Высказанные в рубрике "Право автора" мнения могут не отражать точку зрения редакции

Где сидит кошка? Екатерина Марголис – об оговорке в телеэфире

Материалы по теме

Эпоха поводыря. Сергей Добрынин – об удобстве вместо свободы

Кто ломает нейросети?

Чьи жизни ухудшит ИИ?