Мы живём в эпоху предсказаний – и не в мистическом, а в самом буквальном смысле. И человеческий разум, и современные технологии основаны на прогнозах, которые исходят из огромного корпуса прошлого опыта – прежде всего языкового.
Не только человеческий интеллект, но и ИИ прогнозирует будущее, основываясь на данных прошлого. Пусть даже на уровне одного предложения.
Современные когнитивные науки на стыке лингвистики и программирования занимаются исследованиями, которые ложатся в основу языковых моделей ИИ. Все они построены на предсказаниях следующего слова – word prediction.
В простейшем виде задача выглядит так: есть начало текста, и модель должна угадать, какое слово (или символ) с наибольшей вероятностью будет следующим.
Например:
Вход: "Кошка сидит на"...
Модель оценивает вероятности:
• "стуле" — 0.45
• "окне" — 0.30
• "дереве" — 0.10
• "машине" — 0.05
Наиболее вероятный, исходя из статистики, вариант – "стуле".
В области человеческого интеллекта на это накладывается контекст и окружение, наиболее частотные выражения и даже визуальные образы.
С моделью все проще.
Модель работает не с целыми словами, а с токенами – кусочками текста (слова, части слов, знаки препинания).
Например, слово "невероятный" может быть разбито на токены: "не", "вероят", "ный".
Это упрощает работу модели и позволяет покрывать огромный словарь, комбинируя кирпичики смыслов.
Принцип прост: контекст → векторные представления (эмбеддинги) → распределение вероятностей → выбор токена → добавление его в контекст. Так, шаг за шагом рождаются предложения, статьи, диалоги.
Язык – не просто выразитель идеологии, он ее формирует. И оговорка ведущей "Дождя" тому наглядный пример
Постепенно модель обучается, и на огромных текстовых корпусах учится распознавать и генерировать грамматику (иначе не угадаешь правильные окончания), учитывать смысл (иначе не предскажешь логичное продолжение), распознавать контекст и стиль (иначе не угадаешь уместный тон речи).
В итоге простая механика превращается в эффект "понимания".
Чтобы "говорить целыми предложениями", модель просто многократно применяет эту операцию:
1. Берёт уже сгенерированный контекст
2. Предсказывает следующий токен
3. Добавляет его к контексту
4. Повторяет
Так строится диалог, эссе, код – всё, что угодно.
Когнитивные процессы и механизмы, подобные word prediction, влияют на речь и мышление человека.
В человеческом сознании тоже работает механизм "предсказания следующего слова".
Когда мы говорим, мозг заранее готовит возможные продолжения фраз. Эти "кандидаты" берутся не только из сознательных убеждений, но и из частоты встречаемости словосочетаний в среде, и из визуальных образов слова в сознании. В любом случае человек не придумывает каждое слово с нуля, а достаёт готовые паттерны – клише, устойчивые словосочетания.
Недавно журналистка известного своими оговорками телеканала "Дождь" Анна Монгайт, комментируя встречу Зеленского с европейскими лидерами и президентом США, произнесла: "Глава киевского… эээ… режима", а затем попыталась исправиться.
Фраза вызвала бурную реакцию, но интересна она не только сама по себе.
Дело в том, что словосочетание "киевский режим" – устойчивый шаблон, постоянно звучащий в российском медиапространстве. Если сравнить его употребление с выражениями, вроде "киевский торт" или "Киевский вокзал", станет очевидно: первое используется намного чаще.
Поэтому мозг русскоязычной журналистки автоматически "подтянул" привычный вариант.
У человека: "корпус данных" есть лингвистическая среда, в которой он живёт.
У модели (GPT и др.): "корпус данных" – это тексты, на которых её обучали.
В обоих случаях следующее слово определяется статистической силой привычного словосочетания.
Теперь зададимся самым интересным вопросом: почему лингвистическая медиасреда оппозиции не отличается от официальной?
Да, оговорка Монгайт не означает, что она разделяет риторику Кремля, но она однозначно указывает на то, что в её лингвистическом окружении словосочетание "киевский режим" звучит чаще всего, и поэтому сознание, работающее по принципу word prediction, выдает этот вариант первым.
Связано ли это с профессиональной необходимостью мониторить официальные российские СМИ? Возможно.
Но факт остаётся фактом. Отравленный воздух и контекст не щадят никого. И даже тот, кто покинул Россию, но продолжает сохранять тесные связи с ее языковым пространством, получает лингвистическую инфекцию русского мира воздушно-капельным путем.
Язык – не просто выразитель идеологии, он ее формирует. Формирует на нейроуровне. И оговорка ведущей "Дождя" тому наглядный пример.
Именно поэтому российские власти целенаправленно уничтожают украинские книги, учебники и культуру на оккупированных территориях и фактически вводят запрет на преподавание украинского и на украинском (а вспомним расстрелы людей в Мариуполе, Изюме и других городах только за то, что они отвечали оккупантам на своем языке).
Контроль над языком – ключ к контролю над колонизированными народами
В этом, увы, нет ничего нового – задолго до эпохи нейроисследований и лингвистических открытий российская империя интуитивно понимала, что контроль над языком – ключ к контролю над колонизированными народами. Он же и меч.
И нынешние инициативы российских властей по сокращению и отмене преподавания родных языков в регионах – продолжение той же сознательной политики подавления потенциальных очагов сопротивления.
Неслучайно слово "деколонизация" является таким триггером и для официальных, и для оппозиционных СМИ – например, "Новой Газеты Европа", где публикуются статьи Юлии Латыниной с инвективами в адрес "деколонизаторов" (непременно в кавычках).
Это общий знаменатель.
Точнее главное общее знамя – империя. Ментальная территория отражает географическое пространство и наоборот – посредством языка.
Именно поэтому Путин так настаивает на русском языке как официальном в Украине. Вся идеология защиты русскоязычия, подхваченная и оппозиционной интеллигенцией в РФ, и эмигрантами, и все москвоцентричные премии, издательства, СМИ вне зависимости от их идеологической направленности будут неизбежно нести в себе нейролингвистику русского мира, а значит работать на него и транслировать прямо или косвенно, сознательно или бессознательно его законы и иерархии.
Именно на нейролингвистическом уровне при наличии ресурсов, с помощью технологий и тиражирования контента и соответственно массовости контекстов, на которых будут обучаться русскоязычные модели ИИ – уже не через телевизор, а с помощью этих технологий можно будет всегда поддерживать "русский мир" в бывших колониях, и он будет завоевывать и разрушать гражданские демократические общества изнутри, потому что это ровно тот самый мир, который несовместим со своим омонимом: устойчивым и прочным миром.
От word prediction до war prediction один шаг.
Через язык империи русский мир будет паразитировать на всем, в том числе на новейших технологиях, на ИИ в первую очередь, как уже давно паразитирует на свободе слова и инструментах демократии (см. вмешательства в Брекзит и американские выборы и другие диверсии), на соцсетях и базовых потребностях человека в общении и уважении (см. конспирологию как инструмент пропагандистского влияния на самые уязвимые и необразованные слои населения).
Свобода слова – это свобода выбирать свои слова
Он предсказуем в том, что несет в себе на уровне лингвистических структур императив деструктивной нормализации и нормализованного насилия как залог собственного существования. И будет нести, пока его не остановить. Это не свойство, а суть, modus vivendi et operandi.
Но есть и хорошие новости: мы наделены свободой воли. В том числе воли лингвистической.
Свобода слова – это свобода выбирать свои слова.
И даже если на языке крутится навязанное историческим и культурным бэкграундом, средой, привычкой, контекстом, конформизмом и удобством (экономией внутренних усилий и ресурсов) слово, мы вольны выбрать другое. Мы можем сопротивляться.
Чем больше людей будет совершать это усилие, тем быстрее изменится контекст – а значит, и будущее.
И предсказание, каким будет следующее слово мира, зависит буквально от каждого. Это не метафора, а технология.
Этот текст написан по-русски и отредактирован с помощью ИИ. Это не просто эксперимент. Это осознанный выбор. Потому что сопротивление возможно и в языке, и с помощью современных технологий.
Преодоление сопротивления материала тоже. Писать по-русски то, чему этот язык сопротивляется, что ему исторически и культурно чуждо – трудная, но необходимая задача.
В этом и состоит акт лингвистического сопротивления: создавать новые смыслы, которые смогут изменить будущее корпуса текстов, на которых будут учиться нейтральные технологии. И в этом лингвистическом сопротивлении залог не только нынешнего противостояния русскому миру и войне и навязанной ими предсказуемости, устойчивых контекстов, иерархий и нарративов, но и построения иного будущего – иных слов, в ином порядке. Иных контекстов. В построении иного корпуса текстов, на которых тоже будут тренироваться стремительно развивающиеся, но совершенно равнодушные к ценностям технологии.
Конструктивное сопротивление состоит не в борьбе с ИИ, соцсетями, развитием технологий и прогрессом, а в порождении смыслов, способных противостоять использованию их во зло.
Екатерина Марголис – художница и писательница
Высказанные в рубрике "Право автора" мнения могут не отражать точку зрения редакции