Кандидат филологических наук, доцент кафедры английской филологии Института иностранных языков МГПУ Марина Овсянникова назвала признаки, по которым можно распознать сгенерированный текст, пишет RT.
У нейросети довольно бедный словарный запас, говорит специалист. И когда в сгенерированном тексте может вдруг возникнуть какое-то редко употребляемое слово, это выдаст его искусственность.
«Опытный специалист, который постоянно работает с текстами, обладает, как правило, языковой интуицией, — говорит Марина Овсянникова. — Прежде всего насторожить может излишняя «правильность» текста: он напоминает стену, через которую сложно пробиться к смыслу. Банальные сравнения, клишированные словосочетания, однообразный синтаксис».
Текст, написанный человеком, всегда более сложен синтаксически. Мы можем использовать повторы, эллиптические конструкции, когда какой-то член предложения опускается. Иногда применяем особую пунктуацию, которая имплицирует наши эмоции. Ничего этого нейросети делать пока не умеют, отмечает Марина Овсянникова.
Неестественно логичное повествование — тоже признак сгенерированного текста. К тому же, понятия «сарказм» и «намек» также не знакомы нейросети, это особенность человеческого мышления.
Другой особенностью «цифрового» текста является отсутствие или переизбыток эмоциональности, что бросается в глаза и выделяется неестественностью.