Как ChatGPT используется для создания подкастов и аудиоконтента

Когда поднимается вопрос о возможностях искусственного интеллекта в сфере творчества, вспоминается сцена из популярного голливудского фильма “Я робот”. Когда герой Уилла Смита спрашивает высокотехнологичного собеседника – “Может ли робот написать симфонию или превратить чистый холст в произведение искусства?”. Тогда человек это говорил с чувством собственного превосходства, намекая на то, что креативность – сугубо его привилегия. Но сейчас, по мере технического прогресса, разница между человеком и ИИ все больше сокращается.

ChatGPT и другие нейросети. Могут ли они создавать музыку

Чтобы понять, каким потенциалом обладает искусственный интеллект на текущей стадии своего развития, пройдемся по основным этапам создания музыки. Как и все в творчестве, музыка начинается с идеи. ChatGPT в этом плане очень полезен, так как по правильно составленному запросу способен выдать целый список советов и экспериментальных креативов. Самое простое, что можно сделать, это попросить нейросеть подкинуть идей для мелодии, сказав пару слов о жанре и содержимом трека. Например: “Напиши несколько идей мелодии для романтической песни”. В получившихся результатах будут рекомендации по аккордам, куплетам, использованию тех или иных музыкальных инструментов.

С текстом для песен все куда сложнее. ChatGPT совершенно не умеет рифмовать, поэтому по запросу “Напиши текст песни” он выдает что-то напоминающее перевод японских хокку. Но даже при отсутствии рифмы сгенерированные песни могут оказаться полезны, поскольку в плане смыслового наполнения вполне соответствуют тому, что способен написать живой человек. Остается только позаимствовать идеи, зарифмовать их и использовать при создании собственного музыкального хита.

Итак, идея для песни у вас есть, примерное представление о том, как должна звучать мелодия, тоже. Пора переходить к следующему этапу – созданию музыки. И поскольку далеко не все люди умеют играть на множестве музыкальных инструментов или готовы оплачивать труд битмейкеров/композиторов, здесь на выручку тоже приходит ИИ. Только это не ChatGPT, а другие проекты, специализирующиеся на музыкальной тематике. AIVA, Soundful, Ecrett Music – все они позволяют делать мелодии в разных жанрах, задавая в интерфейсе простые команды. Готовая минусовка для песни будет качественной и достаточно уникальной, поэтому никаких обвинений в нарушении авторских прав ждать не стоит.

Когда нейросеть сделала за “исполнителя” практически всю работу, ему останется только записать составленный текст песни и наложить на сгенерированную минусовку. Или ИИ-помощник сможет и тут заменить человека? Ведь есть такие инструменты, как Suno AI – нейронка, записывающая реалистичный вокал и даже позволяющая копировать стиль исполнения известных музыкантов, вплоть до дублирования их голоса. С ее помощью можно перепеть “Миллион алых роз” Пугачевой, например, голосами немецкой группы Rammstein, или переделать ню-металл каких-нибудь Mudvayne в произведение в стиле классической музыки.

ChatGPT как помощник в создании подкастов и прочего аудиоконтента

Когда речь идет об аудиоконтенте, одной только музыкой дело не ограничивается. Люди нуждаются в качественном звуке во время прослушивания подкастов, аудиокниг, различных инфопродуктов (тренинги, семинары, обучающие руководства). С производством всего перечисленного тоже может помочь ChatGPT. OpenAI как раз добавила своей нейросети функцию Read Aloud, позволяющую зачитывать ответы голосом на 37-и популярных языках, в том числе и на русском. Удобнее всего пользоваться этой функцией через Ultimate-версию телеграмм бота GPTaskBot.

Специалисты компании при создании этого голоса тесно сотрудничали с профессиональными актерами озвучки, поэтому речь ИИ-помощника практически избавлена от монотонных роботизированных ноток, которые характерны для большинства других онлайн “говорилок”. Также ChatGPT может заниматься и обратной деятельностью – преобразованием аудио в текстовый формат. Конечно, такой текст нельзя назвать готовым, поскольку распознавание работает со сбоями (особенно в ситуациях, когда исходник с плохим качеством звука), но после редактирования результат получается более чем достойным.

Само собой, аудиокнигу, подкаст или другой инфопродукт нужно красиво оформить, чтобы у пользователя интернета возникало желание его прослушать. И тут на помощь опять приходит GPTaskBot, у которого есть полезная функция генерации изображений по текстовому описанию. Причем совсем не обязательно задавать детализированный промпт. Можно ограничиться парой фраз, а затем попросить нейросеть дописать уточняющие детали, подобрать самостоятельно какие-то креативные идеи. Обычно среди 5-6 попыток генерации попадается хотя бы одна интересная идея, требующая лишь минимальной доработки (например, нанести на картинку пользовательский текст сможет любой графический редактор).

Подведение итогов

В настоящее время искусственный интеллект способен помочь в работе с аудио практически на всех этапах – от разработки идей, до создания мелодий, обработки звука и даже записи вокала. Его преимущества наверняка оценят певцы, композиторы, авторы подкастов, производители аудиокниг и многие другие творческие люди. Сейчас создаваемое при помощи нейросетей аудио звучит не идеально, но через пару лет грань между ИИ-контентом и музыкой/голосовыми записями живых исполнителей может вообще исчезнуть.

Значит ли это, что через несколько лет заниматься творчеством ради финансовой выгоды не будет никакого смысла? Вряд ли. Просто традиционные средства производства контента окажутся вытеснены инструментами на базе искусственного интеллекта, позволяющими оптимизировать рутинные задачи и избавить от необходимости тратить многие годы на обучение творческому ремеслу.