В США ведется активная работа по созданию различных моделей искусственного интеллекта, включая большие языковые модели (LLM), одним из лидеров разработки которых является компания OpenAI. Специалистам известно, что российские, американские и китайские модели обучаются на разных массивах информации, часто не фильтруемой, и, соответственно, дают ответы по-разному на одни и те же заданные вопросы. Разработка американских моделей пришлась на время правления демократов и продвижения ими либеральной повестки со всеми вытекающими отсюда последствиями. Американские нейросети даже после прихода президента Трампа продолжат продвигать либеральные идеи, совершенно не соответствующие идейным установкам республиканцев.
Мы становимся свидетелями все более активного взаимодействия компаний, создающих нейросети со СМИ, прежде всего в США. В частности, у OpenAI были подписаны соглашения c Financial Times, Associated Press, News Corp, Axel Springer SE, Conde Nast, Le Monde, Prisa Media, TIME. С одной стороны, речь идет об обучении нейросетей на очень больших массивах информации, с другой — о внедрении новостных информационных потоков в базы данных, используемых ИИ для обучения. Как отмечают некоторые исследователи в области компьютерной лингвистики, предвзятость данных может быть системной проблемой: модели способны воспроизводить стереотипы и идеологии, заложенные в их обучающих выборках.
Авторы: Александр Яковенко, Руководитель комитета по глобальным проблемам и международной безопасности научно-экспертного совета Совета Безопасности РФ
Олег Рогов
К.ф.-м.н., руководитель научной группы «Доверенные и Безопасные Интеллектуальные Системы», Институт AIRI
В США ведется активная работа по созданию различных моделей искусственного интеллекта, включая большие языковые модели (LLM), одним из лидеров разработки которых является компания OpenAI. Специалистам известно, что российские, американские и китайские модели обучаются на разных массивах информации, часто не фильтруемой, и, соответственно, дают ответы по-разному на одни и те же заданные вопросы. Разработка американских моделей пришлась на время правления демократов и продвижения ими либеральной повестки со всеми вытекающими отсюда последствиями. Американские нейросети даже после прихода президента Трампа продолжат продвигать либеральные идеи, совершенно не соответствующие идейным установкам республиканцев.
Мы становимся свидетелями все более активного взаимодействия компаний, создающих нейросети со СМИ, прежде всего в США. В частности, у OpenAI были подписаны соглашения c Financial Times, Associated Press, News Corp, Axel Springer SE, Conde Nast, Le Monde, Prisa Media, TIME. С одной стороны, речь идет об обучении нейросетей на очень больших массивах информации, с другой — о внедрении новостных информационных потоков в базы данных, используемых ИИ для обучения. Как отмечают некоторые исследователи в области компьютерной лингвистики, предвзятость данных может быть системной проблемой: модели способны воспроизводить стереотипы и идеологии, заложенные в их обучающих выборках.
Уже сейчас свыше 10% аналитических материалов ведущих информагентств и СМИ формируются с применением генеративного ИИ, и их доля будет только возрастать. Однако возникает вопрос о мере предвзятости нейросетей к тем или иным темам.
Этот процесс можно рассматривать сквозь призму информационного влияния: контроль над исходными данными позволяет формировать нарративы на уровне языка. В социологии подобные механизмы изучаются в рамках подхода «агентности медиа», где СМИ не просто проводник информации, но своеобразный конструктор ее восприятия через автоматизированный инструментарий выбора тем и таргетированный подбор формулировок рекомендательными системами. То есть рост доли генеративного контента косвенно создает потенциальный риск усиления предвзятости, если ИИ массово обучается на текстах из неверифицируемых источников. Это можно трактовать и как новый вектор мягкой силы, где доминирующие нарративы масштабируются глобально через современные технологии.
В США Дональд Трамп может столкнуться с аспектами американского ИИ, который предрасположен к транслированию неолиберальных установок, не совместимых с новой концепцией «реализма», предложенной республиканской партией. Естественно, такой ИИ будет работать против политики Трампа не только у себя в стране, но и за ее пределами ввиду глобальной доступности и монетизирумости решений на его основе.
Насколько Трамп сможет справиться с этим технологическим вызовом?
Чтобы перестроить американский искусственный интеллект (ИИ), потребуется много усилий. Демократы оставили новой администрации сложное наследие, и Трампу, если он вернется к власти, возможно, придется заняться этим вопросом на уровне законов. Например, он может потребовать от СМИ быть более объективными и отвечать за то, чтобы их материалы соответствовали фактам. Всё, что выходит за эти рамки, можно будет считать попыткой внушить аудитории определенные идеи.
Пример такой стратегии Трамп уже показал на практике — в своем видении украинского конфликта и его урегулирования. Он опровергает ту версию событий, которую продвигала предыдущая администрация. Кроме того, было бы полезно вернуть в США российские медиа, которые, по сути, были наказаны только за то, что часто оказывались правы в своих материалах.
Разработка и внедрение больших языковых моделей (LLM) — это не просто технологический прорыв. Это еще и новая глобальная борьба за контроль над информацией, которая формирует наше представление о мире. От того, как будет развиваться этот процесс, зависит будущее не только технологий, но и всей мировой информационной системы.
Особый интерес также представляет возможность налаживания международного сотрудничества в области обучения искусственного интеллекта по направлениям Россия-Китай, Россия-США. Многие сегодня задаются вопросом: действительно ли большие языковые модели «понимают» смысл текста или просто подбирают слова для ответа? Одна из главных задач, над которой работают разработчики, — это найти способ точно оценить, насколько правильны и понятны ответы таких моделей. Обычные тесты и проверки часто оказываются недостаточными или нерелевантными, особенно когда речь идет о сложных или деликатных темах.
Налаживание же международного сотрудничества позволило бы совместно оценить качество ответов лингвистических моделей, охватывающих ключевые области: историю, географию, обществознание и политологию. Звучит амбициозно. Но многие начинания иногда так и выглядят, пока не меняется геополитический контекст.
Источник: Эксперт