Чат-бот не пройдет. Шесть признаков, что текст написал искусственный интеллект
Фото: Игорь Иванко / Коммерсантъ
Чат-боты с искусственным интеллектом поставили перед нами новую проблему: как определить, написан ли текст человеком или машиной? По мере развития умных систем это становится всё сложнее. «Новый проспект» нашел шесть признаков, которые говорят о машинном тексте — их легко увидеть и устранить.
Маркетологи, копирайтеры и студенты используют ИИ для написания текстов, курсовых, детских историй, стихов, поздравлений и электронных писем. В некоторых случаях нет разницы, кто написал текст, но в других это архиважно. Как научиться отличать искусственно созданное произведение от человеческого?
Стопроцентного способа определить, написан ли конкретный текст чат-ботом, не существует. Задача языковых моделей с искусственным интеллектом как раз и заключается в создании повествования, похожего на человеческое. И чем новее языковые модели, тем лучше у них получается.
Онлайн-сервисы, которые призваны выявить происхождение текста, пока часто ошибаются. Например, детектор GPTZero некоторые фрагменты из Библии помечает как на 88% сгенерированные искусственным интеллектом. С произведениями Пушкина и Достоевского ему, правда, определиться немного проще.
Распознать работу ИИ позволили бы скрытые маркеры. OpenAI уже добавляет метаданные к изображениям, сгенерированным программой DALL-E. Для текстов также разработаны знаки и способы их интеграции, но разработчики не спешат их внедрять.
Причина ясна. Ведь далеко не все машинные произведения — зло. Люди просят ИИ перевести на другой язык собственные заметки или написать основу, а затем перерабатывают ее, либо просто проверяют орфографию. Однако водяной знак автоматически пометил бы такие работы как машинные, а это в корне неверно.
Проблема уже привела к появлению консультантов, которые устраняют признаки использования ИИ в курсовых и других работах. Но машинный текст можно распознать и без сервисов и фрилансеров. Вот эти признаки. Они не являются абсолютным доказательством, но могут помочь в работе.
1. Слова, которые любит ИИ
Некоторые слова и словосочетания машина использует чаще других. Стремясь создавать гладкие и плавные тексты, алгоритмы часто используют распространенные клише и формальные конструкции. Вот некоторые из них:
- в заключение
- следовательно
- однако
- на основе данных
- в свою очередь
- на данный момент
- итак
- стоит отметить
- в конечном итоге
- таким образом
- как было упомянуто ранее
- в связи с этим
Почему нейросети выбирают эти слова? Вероятно, потому что профессиональные и академические тексты, на которых они обучались, часто их содержат. Эти выражения универсальны и удобны для различных контекстов. Они помогают ИИ создать иллюзию логичного и структурированного текста.
Что делать? Удалить или заменить эти слова вручную. Например, вместо «таким образом» можно сказать «вот почему», вместо «следовательно» — «поэтому», вместо «однако» — «но».
2. Главки и списки
Задача чат-ботов — донести информацию максимально эффективно и удобно для восприятия. О чем бы вы ни спросили ИИ, чат-бот, как правило, структурирует ответ, разбивая его на главки и подглавки, выделяет списки, да еще и делает выделения жирным. И это действительно очень удобно. Так, если вы интересуетесь преимуществами электрического автомобиля, ответ ИИ может быть таким:
«Преимущества электрического автомобиля
- Экологичность: отсутствие выхлопных газов.
- Экономичность: снижение расходов на топливо.
- Тихая работа: минимальный уровень шума.
- Простота обслуживания: меньшее количество движущихся частей».
Такой текст короче и лучше воспринимается, особенно если он рассчитан на соцсети, сайты и презентации. Но такой формат не всегда к месту и легко даст опытному глазу понять, что писала машина.
Также у машинного текста абзацы примерно равной длины. Живые авторы редко так пишут.
Что делать? Попросить чат-бота писать в формате сплошного текста без использования списков и подглавок. Постарайтесь также отредактировать длину абзацев, чередуя более длинные и совсем короткие.
3. Идеальная орфография
Даже самый грамотный человек иногда допускает опечатки: забывает закрывающие кавычки, пропускает буквы или пишет слитно то, что должно быть раздельно. Искусственный интеллект таких опечаток не делает, хотя изредка в русском может сделать ошибку — неправильно образовать глагольную форму или запутаться в предлогах. Если не дать ему указаний, то букву «Ё» он будет писать с точками.
GPT по умолчанию использует американский вариант английского языка. Поэтому travelling он напишет с одной L (traveling), а colour без U (color). Если текст требует британского английского, это надо написать в задании.
На форумах люди уже делятся опытом, как избежать подозрений в использовании ИИ. Они намеренно добавляют в свои работы мелкие опечатки и небрежности, чтобы тексты не вызывали подозрений.
Что делать? Включить в текст незначительные опечатки: вставить лишние пробелы между словами, не закрыть кавычки, поставить лишнюю точку. Главное не переборщить. В переводах на английский, если вам нужна британская версия, дайте знать об этом GPT.
4. Однообразный стиль
У человека стиль письма обычно меняется: он может вставить жаргонизм, сленг или ввернуть модное словечко даже в довольно серьезный текст. Искусственный интеллект пока не всегда умеет делать это естественно. Он избегает нестандартных выражений, хотя уже пробует шутить и употреблять слова в переносном значении.
Кроме того, ИИ не использует конструкции с «Я» и не выражает своего мнения, избегая субъективности.
Что делать? Вставьте, если это уместно, несколько неформальных слов и выражений, чтобы текст звучал более живо. Приведите личные истории или примеры — что-то из вашего опыта или интересный случай, связанный с темой.
5. Страдательный залог
Чат-боты часто используют пассивный (страдательный) залог. Например, вместо «команда завершила проект в срок» ИИ напишет «проект был завершён в срок». Это допустимо в научных текстах и докладах, но не всегда подходит для текстов, ориентированных на читателя.
Что делать? Дайте машине команду переписать текст, заменив страдательный залог на действительный. Обычно она справляется. Или перепишите эти предложения сами — текст станет более динамичным и живым, что нравится поисковым системам.
6. Заключительный абзац
Искусственный интеллект обычно подытоживает свой ответ в финальном абзаце, чтобы вы уж точно разобрались в теме. Люди же часто заканчивают свою мысль там, где считают нужным.
Поэтому, используя текст от GPT, проверьте, есть ли там суммирующий абзац. Это, пожалуй, самый заметный признак машинного текста. Он может иметь заголовок «Выводы», «Заключение» или «прятаться» без заголовка.
Что делать? Если формат вашего текста не требует выводов, смело удаляйте такой абзац. Это сделает текст более естественным. Например, если текст заканчивается фразой вроде «таким образом, можно сделать вывод, что...», лучше убрать ее или заменить на более органичную.