2022/05/24 12:31:39

Искусственный интеллект для написания текстов в СМИ и литературе

Когда журналистов, писателей и поэтов заменят роботы?

Содержание

Основная статья: Искусственный интеллект

2023

Популярное техноиздание Gizmodo закрыло испанское отделение, заменив журналистов на ИИ

29 августа 2023 года компания G/O Media, родительская структура популярного интернет-ресурса Gizmodo, посвященного дизайну, технологиям и науке, сообщила о сокращении всех сотрудников испанского отделения названного сайта. Вместо них для перевода материалов будет использоваться искусственный интеллект. Подробнее здесь.

Немецкий медиахолдинг Bild увольняет 200 сотрудников редакции, заменив их искусственным интеллектом

В середине июня 2023 года немецкий медиахолдинг Bild объявил о программе сокращения расходов в размере €100 млн, которая приведет к увольнению около 200 сотрудников. Компания предупредила работников о том, что ожидает дальнейших редакционных сокращений в связи с возможностями ИИ. Подробнее здесь.

Какие нейросети уже сегодня можно использовать в СМИ

Сегодня все больше людей понимают, что за нейросетями будущее, и что на них можно делать вещи, которые раньше были невозможны. Как и любой инновационный продукт - широкой аудитории нейросети кажутся чем-то малоприменимым, но любопытным. Они умеют писать музыку, обрабатывать и генерировать изображения, выделять главное, озвучивать текст, поддерживать несложный диалог. Но после первого восторга все наиграются, и новинка станет рабочей обыденностью во всех сферах. Например, специально для СМИ было отобрано несколько способов потенциального применения нейросетей для решения реальных задач.

В статье «Медиа будущего: какие нейросети уже сегодня можно использовать в СМИ» представлены результаты исследования экспертов, которые, опираясь на свой многолетний опыт работы в онлайн-СМИ, проанализировали: что могло бы упростить журналистам работу, улучшить качество материалов и повысить эффективность бизнеса. Подробнее здесь.

Британская газета использовала ChatGPT для написания новостей и разочаровалась в результатах

Чат-бот ChatGPT на основе искусственного интеллекта, разработанный компанией OpenAI, пока не подходит на роль репортёра. Об этом, как стало известно в начале марта 2023 года, свидетельствуют результаты эксперимента, проведённого британской газетой. Подробнее здесь.

2022

В МИСиС научили искусственный интеллект писать пьесы

Экспериментальную модель нейросети – генератор пьес «НейроСтаниславский» представили в Москве. Проект открывает следующую эпоху в театральном искусстве и в сфере нейронных сетей: искусственный интеллект уже создавал музыку и картины, но впервые в России написал пьесу. Об этом НИТУ МИСиС (Национальный исследовательский технологический университет) сообщил 11 ноября 2022 года. Подробнее здесь.

Нейросеть от "Сбера" написала сборник рассказов вместе с писателем Павлом Пепперштейном

Нейросеть от «Сбера» ruGPT-3 написала сборник рассказов вместе с писателем Павлом Пепперштейном, который выпустило издательство Individuum. Об этом «Сбер» сообщил TAdviser 24 мая 2022 года.

Нейросеть от Сбера написала сборник рассказов вместе с писателем Павлом Пепперштейном

«Пытаясь проснуться» — это первый в мире сборник рассказов, родившийся в результате сотрудничества писателя и его «двойника»-нейросети. Из 24 текстов в нём только половина принадлежит Пепперштейну, ещё дюжину сочинила генеративная нейросеть ruGPT-3, дополнительно обученная на рассказах Павла и фрагментах его интервью.

Алгоритм писал тексты в несколько заходов, с промежуточной настройкой иБанковская цифровизация: ускоренное импортозамещение и переход на инновации. Обзор и рейтинг TAdviser 13.3 т дополнительным обучением на классической литературе: сначала команда SberDevices задавала вектор для текста нейросети, а затем наиболее удачные варианты машинного творчества отбирали главный редактор Individuum Феликс Сандалов и соавтор книги Павел Пепперштейн.

«
Работа с нейрописателем сопряжена с постоянным техношоком: с одной стороны, перед вами «всего лишь машина», однако её остроумие, интуиции, умение строить отсылки и рассказывать истории отличаются в лучшую сторону от многих «белковых коллег». Меня не покидало ощущение чуда, как будто в лаборатории удалось создать литературного Голема, вложив ему в рот бумажку с рассказами Пепперштейна,
сказал Феликс Сандалов, главный редактор Individuum.
»

«
Честно говоря, мне не показалось, что между моими рассказами и рассказами, написанными Нейро Пепперштейном, есть хоть какое-то сходство. Тем не менее рассказы Нейро Пепперштейна мне понравились,
отметил Павел Пепперштейн, писатель и художник.
»

Помимо создания архитектуры нейросети, её обучения и отбора текстов, вмешательство человека в творчество цифрового «двойника» Пепперштейна ограничилось работой корректора. Сочинения нейросети предлагаются читателю в том виде, в котором их написала нейросеть. Прежде чем писать свои рассказы для сборника, Павел Пепперштейн познакомился с написанными машиной текстами, чтобы не только алгоритм имитировал стиль писателя, но и наоборот.

В сборнике у каждого рассказа один автор, а читателям оставлена возможность угадывать, кому принадлежит тот или иной рассказ — человеку или машине. В разделе с содержанием книги читателям предлагается ставить пометки, кто написал тот или иной рассказ, и делиться своими догадками с другими читателями.

Книга «Пытаясь проснуться» вышла с голографической обложкой с изображением двух картин. Одну написал Павел, а вторую — нейросеть ruDALL-E, созданная SberDevices и Sber AI при содействии SberCloud, которая предварительно «изучила» творчество Пепперштейна-художника.

2020: Суд впервые защитил авторским правом текст, написанный искусственным интеллектом

В середине января 2020 года суд в Шэньчжэне (Китай) постановил, что статья, созданная с помощью искусственного интеллекта, защищена авторским правом. Это первый случай, когда суд защитил авторским правом текст, написанный ИИ.

В течение пяти лет китайский технический титан Tencent публиковал статьи, созданные автоматизированным программным обеспечением Dreamwriter, уделяя основное внимание материалам на тему бизнеса и финансов. Алгоритмы для ИИ, создающего новостной контент, эксперты Tencent разработали в 2015 году. 20 августа 2018 года программа Dreamwriter написала финансовый отчет, который был опубликован на веб-сайте Tencent Securities с указанием на то, что отчет была автоматически сгенерирован роботом Dreamwriter.

Суд в Китае постановил, что тексты, написанные искусственным интеллектом, должны быть защищены авторским правом

Через несколько недель онлайн-платформа, управляемая компанией Shanghai Yingxun Technology Company, разместила на своем веб-сайте тот самый финансовый отчет. Поскольку текст был сгенерирован ИИ, онлайн-платформа Shanghai Yingxun посчитала возможным скопировать его без разрешения. Компания решила, что у материала, составленного ИИ, нет автора в традиционном понимании этого слова, то есть формально они не нарушали закон об авторском праве.

Тем не менее, суд установил, что формулировки статьи имели «определенную оригинальность» и соответствовали юридическим требованиям, которые должны быть классифицированы как письменное произведение. Форма изложения соответствовала требованиям письменной работы, а при ее создании потребовался отбор, анализ и обработка соответствующей информации. Таким образом, созданный ИИ текст подпадал под действие закона о защите авторских прав.

Хотя ответчик уже удалил статью со своего веб-сайта, он все равно должен будет заплатить штраф в размере 1500 юаней ($217).[1]

2018: Система машинного перевода успешно прошла newstest2017

Группа ученых Microsoft Research 30 марта 2018 года сообщила о том, что созданная ими система машинного перевода успешно прошла тест newstest2017, который включает в себя 2 тыс. предложений, взятых из профессионально переведенных новостных статей. Такие стандартизированные тесты широко применяются при разработке систем искусственного интеллекта и помогают внести объективность в оценку их работы.

Внешние эксперты, владеющие обоими языками, оценили результаты работы искусственного интеллекта при переводе предложений из выборки, сравнивая их с двумя профессиональными переводами.

Достичь таких успехов помогли недавние открытия в области нейросетей. В распоряжении ученых с каждым годом оказывается все больший набор разнообразных техник, комбинирование которых позволяет улучшить результаты. Например, один из приемов работы с искусственным интеллектом — это «двойное обучение». Система переводит фразу с китайского на английский, а человек переводит результат обратно на китайский — примерно, как если бы учитель обратно переводил для ученика фразу, чтобы тот понял свою ошибку.

Впереди у ученых еще много работы: в частности, они планируют добавить новые языковые пары и добиться схожих результатов в переводе текстов на более широкие темы.

2017: Нейросеть научили писать стихи определенного жанра и на любую тему

Исследователи Facebook AI Research (подразделения Facebook, занимающегося разработкой программного обеспечения для искусственного интеллекта), в начале июля 2017 года представили новый подход к автоматическому написанию поэзии. Созданная система нейросетей умеет писать стихи определенного жанра и на любую тему, практически неотличимые от тех, которые мог бы написать человек. Однако главная цель поэзии — передача мыслей и чувств через образные средства языка — по-прежнему остается недоступной для искусственного интеллекта.[2]

У любого поэтического произведения есть два важных компонента: форма и содержание. Форма выражается в метрических характеристиках стиха: ритме и рифме; содержание отвечает за наполненность стихотворения — лексические и образные средства, используемые для того, чтобы передать определенную мысль.

Может ли компьютер сочинять настоящие стихи? До недавнего времени считалось, что нет, однако нейросеть, созданная в Facebook AI Research, практически научилась это делать

Авторы нового исследования предложили две модели, которые основываются на уже существующих языковых нейросетях. Первая модель извлекает из обучающей выборки и форму, и содержание стихотворения, и дает на выходе произведение определенного стихотворного жанра. Такая модель была обучена на небольшой (300 тыс. слов) выборке сонетов и смогла создать произведение, написанное пятистопным ямбом (размером, традиционным для сонета на английском языке).

Однако у такой модели есть одно важное ограничение: она может создавать произведения только той поэтической формы, которая была представлена ей в выборке для обучения. Принимая это во внимание, исследователи предложили другой подход, который заключается в использовании порождающей состязательной сети, одна часть которой (генератор) отвечает за содержание, а другая (дискриминатор) — за форму.

Модель автоматического стихосложения обучили на большой выборке поэтических произведений (7,56 млн слов) самых разных жанров. Затем ученые поставили эксперимент: они взяли стихотворения, созданные нейросетью, смешали их с забавно-абсурдными стихами реальных поэтов и предложили семидесяти читателям определить, кто написал то или иное стихотворение — человек или компьютер. Респонденты правильно установили авторство людей в 51,4% случаев; в случае с компьютерной поэзией эта доля составила 53,8%.

Респондентам также необходимо было отметить по пятибалльной шкале «читабельность» стихов («Насколько представленный фрагмент легок для прочтения?»), их эмоциональность («Насколько данный фрагмент пробуждает в вас эмоции?») и красоту («Насколько данный фрагмент приятно читать?»). Оказалось, что самыми «человеческими», эмоциональными и красивыми стихотворениями респонденты посчитали именно те, которые были созданы компьютером.

Вот, например, одно из четверостиший, использованных в эксперименте:

How dreary to be somebody,
How public like a frog
To tell one’s name the livelong day
To an admiring bog.


Смысл стихотворения кажется темным. Словосочетание admiring bog («восхищающаяся трясина») выглядит абсурдно, и в чем именно выражается публичность лягушки? Однако написано оно не компьютером. Автор этого четверостишия — Эмили Дикинсон («I'm nobody! Who are you?»).

А вот другой пример, использованный при опросе респондентов:

The frozen waters that are dead are now
black as the rain to freeze a boundless sky,
and frozen ode of our terrors with
the grisly lady shall be free to cry.


В этом отрывке проглядывается понятная читателю метафора зимы как смерти и страха. Стихотворение мрачное, оно наполнено различными сравнительными средствами и кажется достаточно эмоциональным, однако написал его компьютер.

Несмотря на то, что работа новой нейросети приблизила искусственный интеллект к настоящему поэтическому творчеству, до настоящих поэтов ему пока что далеко.

Как отметил поэт Риши Дастидар (Rishi Dastidar) в беседе с интернет-издаем New Scientist, у компьютерных стихотворений нет никакого подтекста: нейросеть может ставить одно слово за другим так, чтобы результат соответствовал определенной поэтической модели, и подбирать их так, чтобы они относились к определенной теме, но никакой идеи и эстетической глубины такие стихи не имеют. Для того чтобы произведения компьютера выражали мысли и чувства (одна из главнейших задач поэзии в ее повседневном понимании), искусственный интеллект должен научиться мыслить и чувствовать сам.

Ознакомиться с работой нейросети и оценить ее можно на сайте neuralpoetry.getforge.io.

2016

Narrative Science: К 2025 году 90% всех текстов будут писать роботы

К 2016 использует роботов-журналистов и журнал Forbes, для которого компания Narrative Science создала соответствующую специализированную платформу. Статьи, написанные искусственным интеллектом, пока очень простые, однако соучредитель компании Narrative Science Кристиан Хэммонд верит в большие перспективы данного направления, полагая, что к 2025 году 90% всех текстов в мире будет писаться именно искусственным интеллектом. Предположение, безусловно смелое, однако некоторые эксперты с этим отчасти согласны.

«В будущем роботы журналисты вполне смогут быть конкурентоспособны на рынке труда, особенно по части создания простых новостных заметок. При этом они могут обладать рядом преимуществ: в машину можно заложить четко структурированный алгоритм, по которому будет писаться текст, например, какую информацию помещать в начало, какую – в середину, а какую – в конец. Это позволит повысить читабельность новостных заметок. Зачастую журналисты забывают об этом правиле, предоставляя всю актуальную информацию уже на первых строчках текста», - гендиректор «Комсомольской правды» Владимир Сунгоркин.

Все же большинство экспертов абсолютно уверены в неспособности искусственного интеллекта полностью заменить человека в такой сложной задаче, как написание интересных статей.

«Заменить человека полностью машина вряд ли сможет. Роботы не способны почувствовать интересную историю – они лишь способны отвечать на поставленные вопросы», - исполнительный директор Службы финансово-экономической информации «Интерфакса» Юрий Погорелый.

Книга, написанная роботом, прошла 4 этапа отбора литературной премии

Однако несмотря на столь значительный скептицизм, практика показывает, что перспективы искусственного интеллекта все же не так туманны. Весной 2016 года книга «День, когда компьютер напишет роман», созданная искусственным интеллектом, смогла выйти в финал литературной премии имени Хоси Синъити. Да, произведение не смогло в конце завоевать главный приз, однако сам факт того, что оно прошло четыре этапа отбора, говорит о многом.

Премия Хоси Синъити прежде всего известна тем, что в ней на конкурс можно выставить произведения, написанные машиной. В 2016 году, из 1450 книг около 11 были написаны искусственным интеллектом, однако в финал смогла пройти лишь одна. При этом жюри не было проинформировано, что рассматривает книгу, написанную ИИ.

«Меня удивила работа искусственного интеллекта, поскольку перед нами лежит действительно хорошо структурированный роман. Однако у него все же есть ряд проблем, которые не позволили ему выиграть главный приз. Например, не до конца раскрыты персонажи. Над решением подобной проблемы разработчиками еще предстоит провести ряд исследований», - заявил на пресс-конференции конкурса писатель-фантаст Хасэ Сатоси.

Разработчики из Университета будущего Хакодате, где был создан роман, до сих пор еще не раскрыли алгоритм работы искусственного интеллекта. Известно лишь, что для написания произведения были изначально заданы детали сюжета, характеристики героев и используемые слова и фразы.

Авто поэзия Google

В мае 2016 года искусственный интеллект Google, проанализировав 11 тысяч неизданных книг, начал писать свои первые литературные произведения. Однако пока они достаточно мрачноваты:

Он надолго замолчал.
Он смолк на мгновение.
На секунду стало тихо.
Было темно и холодно.
Возникла пауза.
Теперь мой черед.

2015: Роботы "Яндекса" начинают писать заметки о погоде и ситуации на дорогах

В ноябре 2015 года направление подготовки автоматических текстов открыла российская компания Яндекс. В это время искусственный интеллект Яндекса выпускает лишь короткие заметки о погоде и ситуации на дорогах, однако в дальнейшем представители компании обещают расширить список тематик для публикаций.

2014: Associated Press запускает автоматическую подготовку текстов по финотчетам компаний

В 2014 году компания Associated Press объявила, что отныне большая часть новостей, связанных с доходами компаний, будут создаваться с помощью роботов.

«На протяжении долгих лет у нас уходило много времени, чтобы разобраться с цифрами о доходах компаний при подготовке статей. Однако платформа Wordsmith от компании Automated Insights позволила нам не только автоматизировать этот процесс, но и значительно увеличить производительность», - рассказал шеф-редактор Associated Press Лу Феррара.

Применение автоматизированных технологий позволило Associated Press увеличить число ежеквартальных новостей о доходах компаний с 300 до 4400. Позднее аналогичным сервисом воспользовался новостной портал Yahoo News. В 2016 году роботы-репортеры Associated Press несколько расширили свою тематику. Им стали доверять небольшие новостные заметки, связанные с Малой бейсбольной лигой США.

2013: Запуск сервиса "Яндекс.Автопоэт"

Специалисты Яндекс и Google проводили активные исследования, направленные на обучение машины поэзии. Сервис «Яндекс.Автопоэт», который был создан в декабре 2013 года, уже на протяжении нескольких лет составляет стихотворные строки на основе запросов пользователей и новостных заголовков. Для этих целей робота специально научили определять стихотворные размеры и рифмовать строчки между собой. Ознакомиться с полным списком произведений Автопоэта можно здесь. Один из примеров его стихотворений (орфография и пунктуация сохранены):

Эхо самарской полиции,
евро теряет позиции,
Курску грозит затопление,
доллар продолжил падение

Робототехника



Примечания