Услышьте, как виолончель кричит от гнева и других странностей
- Нвидиа
- Он может создавать и микшировать аудио различными методами, но пока не выпущен
- Fugatto обещает создавать уникальные звуки, аудиомиксы, речь и многое другое.
Fugatto, который является сокращением от Foundational Generative Audio Transformer Opus 1, может работать с текстовыми подсказками и аудиообразцами изменить или добавить аудиоклипы.
Например, вы можете преобразовать звук поезда в пышную оркестровую аранжировку или с волнением мелодию банджо со звуками дождя флейты, просто вёл подсказку.
Fugatto также может изолировать вокал от треков и изменять стиль подачи вокала, а также ограничивать речь с нуля который вам нравится, в любом стиле.
Плохая новость — пока недоступно.
Пока что нет: жертвы довольствуются рекламными видео Nvidia и сайтом с образцами. Пока неизвестно, когда. Fugatto будет доступен для публичного тестирования.
Некоторые из образцов, опубликованных Nvidia, включают звук лая женского голоса, крики фабричного станка, шепот, пишущей машинки и крики виолончели с гневом. Вы можете увидеть широкий спектр возможные аудиоэффекты.
Компания Nvidia также продемонстрировала, как движок искусственного интеллекта учёных создателей фрагменты устной речи, которые затем можно транслировать с различными факторами (от гнева до радости) и даже с разными акцентами.
— «Фугатто — это наш первый шаг к будущему, в котором неконтролируемое многозадачное обучение в области синтеза и преобразования звук возникает из масштаба данных и моделей».