Lines
Slide
Slide
Slide
Slide
Slide
Slide
Slide
Slide

INVENTED
WORLDS

Нейронные сети (звук)

Эмулятор голоса RVC

https://huggingface.co/datasets/Ba1yya/RVC_rmvpe/tree/main см. Общий генератор аудио

Разделение записи на отрезки

pip install pydub
from pydub import AudioSegment
from pydub.silence import split_on_silence

# Нормализация
def match_target_amplitude(aChunk, target_dBFS):
    ''' Нормализация полученных отрезков '''
    change_in_dBFS = target_dBFS - aChunk.dBFS
    return aChunk.apply_gain(change_in_dBFS)

song = AudioSegment.from_mp3("Misha.mp3")
chunks = split_on_silence (
    song, 
    # время длительности тишины.
    min_silence_len = 1000,
    # порог тишины
    silence_thresh = -60
)

# Нарезка треков
for i, chunk in enumerate(chunks):
    # отступ тишины.
    silence_chunk = AudioSegment.silent(duration=500)
    # склейка.
    audio_chunk = silence_chunk + chunk + silence_chunk
    # нормализация по громкости.
    normalized_chunk = match_target_amplitude(audio_chunk, -20.0)
    # экспорт.
    print("Exporting chunk{0}.mp3.".format(i))
    normalized_chunk.export(
        ".//chunk{0}.mp3".format(i),
        bitrate = "192k",
        format = "mp3"
    )

Для WAV

from pydub import AudioSegment
from pydub.silence import split_on_silence

# Нормализация
def match_target_amplitude(aChunk, target_dBFS):
    ''' Нормализация полученных отрезков '''
    change_in_dBFS = target_dBFS - aChunk.dBFS
    return aChunk.apply_gain(change_in_dBFS)

# Загрузка аудио из WAV файла
song = AudioSegment.from_wav("Misha.wav")

# Разделение на отрезки по тишине
chunks = split_on_silence(
    song,
    min_silence_len=1000,
    silence_thresh=-60
)

# Нарезка и обработка треков
for i, chunk in enumerate(chunks):
    # отступ тишины
    silence_chunk = AudioSegment.silent(duration=500)
    # склейка
    audio_chunk = silence_chunk + chunk + silence_chunk
    # нормализация по громкости
    normalized_chunk = match_target_amplitude(audio_chunk, -20.0)
    # экспорт в WAV
    print("Exporting chunk{0}.wav.".format(i))
    normalized_chunk.export(
        ".//chunk{0}.wav".format(i),
        format="wav"
    )

Генератор музыки MusicGen

git clone https://github.com/facebookresearch/audiocraft

находясь внутри директории audiocraft

python -m pip install -e .

Скопировать musicgen_app.py из demos в корень audiocraft и запустить

python musicgen_app.py

Длинна вставляемой музыки для образца не больше 30 секунд см. Общий генератор аудио

Общий генератор аудио

https://github.com/gitmylo/audio-webui/

git clone https://github.com/gitmylo/audio-webui/

Запуск из run.bat Обновление из update.bat Дополнительно поставить tensorboardX

source venv/Scripts/activate
pip install tensorboardX

RVC создать 40к v2 RVC во вкладке train. Указать путь к wav файлу с записанными фразами. Можно самому не делить. Тренировать и преобразовывать на torchcrepe (torchcrepe hop length = 256) или на rmvpe. Для тренировки использовать фразы только на одном языке. rmvpe 300 эпох с Filter radius = 3 Обученные модели класть в C:\Music_NW\audio-webui\data\models\rvc\имя_модели В барк модели использовать профиль v2/ru_4 Text temperature = 0.65 Waveform temperature = 0.05 min end of audio probability = 0.05 В преобразовании torchcrepe hop length = 256 Index rate for feature retrieval = 0 (иногда 1 даёт лучшей результат, зависит от исходной записи) Filter radius = 0 Protect amount = 0

Изменение голоса в режиме реального времени

https://github.com/w-okada/voice-changer/blob/master/README_en.md Виртуальный аудио кабель https://vb-audio.com/Cable/index.htm Скачать последнюю версию для win (MMVCServerSIO_win_onnxgpu-cuda_v.1.5.3.17b.zip), PyTorch(cpu,cuda) https://huggingface.co/wok000/vcclient000/tree/main Запускать из start_http.bat Extra на максимум — 131072 Модель rmvpe Chunk в зависимости от задержки, минимум от 256 — 320 В дискорде: Выключить автоматическое шумоподавление Выключить автоматическая регулировка усиления

Соединение 2 треков в один

https://rave.dj/mix

SUNO

https://suno.com/create Если надо продлить трек или взять его стиль — Extend Чтобы поменять слова в песне: Подготовить в AdobeAudition (если авторские права) — Пресеты — Time and Pitch — Pitch Shifter. Тон на 3 сдвинуть (-мужской, +женский), cents на 12 в ту же сторону. Применить — Apply. При добавлении своих слов не добавлять никаких стилей. В Style of Music: pop, rock, electro, female vocal, earworm Пример разметки в Lyrics:

[Intro]
СтАло слОжно так педагогом быть. 
Покричать нельзя, с уроков отпустить. 
Сочинения надо проверять, 
Личные дела в школе заполнять. 

[Instrumental Interlude]
 
[Verse 1]
Что же делать нам, как же повлиять? 
Надо всех жалеть, ещё и обучать. 
Классный час, зачем? Ведь восьмой урок. 
Как же трудно, но... Но я педагог! 
 
[Bridge]
Хэхэ-хэ-хэ-хэй! Танцуй! 
 
[Pre-Chorus]
Дети, я учИтель, по партам не скачИте, 
Костя, хватит драться, ты уже большОй. 
Дети, я учИтель, я друг, а не мучИтель, 
Вы потом поймёте, пАру лет спустя. 

[Piano Solo]
 
[Verse 2]
Дежурство уроки. Моя жизнь. 
Сегодня контрольная. Мозг мой держись, 
Журналы, тетради для кого-то совет 
Храню я в памяти этот секрет 
 
[Verse 3]
Свобода формы, свобода мыслей 
Чем больше учишь, тем интересней 
Дети, приколы, коллеги, уроки 
Я педагог, это не просто строки 
 
[Verse 4]
Пусть польётся пляс и формат слетит. 
В школу я иду, пусть грызу гранит 
Праздник жизни тут и улыбок строй 
Ты готов? Со мной эту песню пой! 
 
[Chorus]
Любимая родная! Душу согревает. 
В школе мы как дома. Дружная семья. 

Любимая родная! Душу согревает. 
В школе мы как дома. Дружная семья. 
 
Любимая родная! Душу согревает. 
В школе мы как дома. Дружная семья. 
 
[Outro]
Любимая родная! Душу согревает. 
В школе мы как дома. Дружная семья. 

[End]

Комментарии

Комментариев пока нет.