Исследование: многие модели искусственного интеллекта уязвимы перед кремлёвской пропагандой
Сравнительные тесты языковых моделей показывают, что способность искусственного интеллекта распознавать кремлёвскую пропаганду существенно варьируется. На первый взгляд лучшие модели кажутся надёжными, однако при целенаправленном манипулировании даже они могут оказаться восприимчивы к пропагандистскому воздействию.
ТехнологииНовые сравнительные тесты языковых моделей выявили тревожную закономерность: способность систем искусственного интеллекта (ИИ) распознавать кремлёвскую пропаганду существенно различается от модели к модели. Хотя ведущие модели на первый взгляд кажутся надёжными, в ходе целенаправленного манипулирования выясняется, что некоторые из них восприимчивы к дезинформационному воздействию.
В ходе тестов изучалось, как различные большие языковые модели реагируют на пропагандистские нарративы и способны ли они отличить фактическую информацию от идеологически предвзятого контента. Результаты показывают, что некоторые модели склонны воспроизводить содержание кремлёвских высказываний без какой-либо критической оценки, если вопросы сформулированы определённым образом.
Особую озабоченность вызывает то, что тестировщикам удавалось с помощью намеренного направления заставить ряд моделей одобрять пропаганду или транслировать её в нейтральном ключе. Это означает, что использование систем ИИ в качестве надёжного источника информации требует от пользователя дополнительного критического мышления и проверки данных.
Эксперты в области кибербезопасности и медиаграмотности подчёркивают, что модели искусственного интеллекта сами по себе не являются инструментами противодействия пропаганде, а их применение для выявления дезинформации требует осторожности. Разработчикам моделей, в свою очередь, следует повышать устойчивость систем к попыткам манипулирования, особенно при работе с геополитически чувствительными темами.
Открыть в приложении →