Когда речь идет об аудиоконтенте, одной только музыкой дело не ограничивается. Люди нуждаются в качественном звуке во время прослушивания подкастов, аудиокниг, различных инфопродуктов (тренинги, семинары, обучающие руководства). С производством всего перечисленного тоже может помочь ChatGPT. OpenAI как раз добавила своей нейросети функцию Read Aloud, позволяющую зачитывать ответы голосом на 37-и популярных языках, в том числе и на русском. Удобнее всего пользоваться этой функцией через Ultimate-версию
телеграмм бота GPTaskBot.
Специалисты компании при создании этого голоса тесно сотрудничали с профессиональными актерами озвучки, поэтому речь ИИ-помощника практически избавлена от монотонных роботизированных ноток, которые характерны для большинства других онлайн “говорилок”. Также ChatGPT может заниматься и обратной деятельностью – преобразованием аудио в текстовый формат. Конечно, такой текст нельзя назвать готовым, поскольку распознавание работает со сбоями (особенно в ситуациях, когда исходник с плохим качеством звука), но после редактирования результат получается более чем достойным.
Само собой, аудиокнигу, подкаст или другой инфопродукт нужно красиво оформить, чтобы у пользователя интернета возникало желание его прослушать. И тут на помощь опять приходит GPTaskBot, у которого есть полезная функция генерации изображений по текстовому описанию. Причем совсем не обязательно задавать детализированный промпт. Можно ограничиться парой фраз, а затем попросить нейросеть дописать уточняющие детали, подобрать самостоятельно какие-то креативные идеи. Обычно среди 5-6 попыток генерации попадается хотя бы одна интересная идея, требующая лишь минимальной доработки (например, нанести на картинку пользовательский текст сможет любой графический редактор).