Характерные признаки текстов, создаваемых искусственным интеллектом

Характерные признаки текстов, создаваемых искусственным интеллектом

Лингвисты и исследователи выявили характерные языковые паттерны, которые часто встречаются в текстах, написанных нейросетями и системами генерации текста. Одна из самых очевидных особенностей — повторяющееся использование конструкции "это не просто то — это другое", которая стала почти верным признаком синтетического содержимого.

Технологии

По мере того как системы искусственного интеллекта становятся всё более распространёнными и доступными, исследователи обращают внимание на отличительные черты, которые выдают машинно-сгенерированные тексты. Один из наиболее заметных лингвистических маркеров — это характерная синтаксическая структура, которая приобрела устойчивый характер в результате обучения нейросетей на больших объёмах текстовых данных.

Данная конструкция основана на противопоставлении двух идей и часто используется для создания драматического эффекта или для уточнения смысла высказывания. Однако в текстах, созданных искусственным интеллектом, эта фраза применяется настолько часто и механистично, что она становится почти клише. Исследователи отмечают, что системы генерации текста, обученные на примерах человеческого письма, усвоили эту модель как признак убедительного и структурированного изложения.

Проблема этого явления заключается в том, что перепроизводство одинаковых лингвистических паттернов затрудняет различие между человеческим и машинным контентом. Читатели, ознакомившиеся с несколькими текстами, созданными нейросетями, легко узнают эту конструкцию и начинают подозревать синтетическое происхождение любого текста, где она встречается. Это создаёт определённые сложности для легитимных авторов, которые используют эту конструкцию в своём письме.

Исследование этих закономерностей важно не только для выявления поддельного контента, но и для улучшения алгоритмов, которые генерируют текст. Разработчики систем искусственного интеллекта всё активнее работают над тем, чтобы созданные системы производили более разнообразный и естественный текст, который не содержал бы таких очевидных маркеров.

Открыть в приложении →