INTELLIGENZE ARTIFICIALI

Creare musica da descrizione testuale

MusicLM

ISTRUZIONI

MusicLM è uno strumento rivoluzionario che genera musica di alta qualità da descrizioni testuali come “una melodia rilassante di violino supportata da un riff di chitarra distorto”​. Ecco una semplice guida per iniziare a utilizzare MusicLM:

  1. Iscriviti alla lista d’attesa di MusicLM: MusicLM è attualmente disponibile per i tester anticipati tramite AI Test Kitchen, il campo di prova di Google per la tecnologia AI. Per iscriversi alla lista d’attesa di MusicLM, vai al sito di Google’s AI Test Kitchen.
  2. Conferma la tua iscrizione: Dopo l’iscrizione, Google ti invierà un’email per confermare la tua aggiunta alla lista d’attesa.
  3. Inizia a utilizzare MusicLM: Una volta approvato, puoi iniziare a utilizzare MusicLM. Puoi dare a MusicLM una frase descrittiva come “musica di sottofondo ambientale e morbida a cui posso studiare”.
  4. Ascolta e scegli la tua traccia preferita: Dopo aver fornito la descrizione, MusicLM genererà due tracce musicali. Puoi ascoltare entrambe le tracce e premiare con un trofeo quella che preferisci di più.
  5. Fornisci un feedback: Il tuo feedback aiuterà a migliorare il modello di MusicLM. Premiando la traccia che preferisci, aiuti MusicLM a capire meglio le tue preferenze e a migliorare la qualità della musica generata in futuro​.

Questa è una guida di base per iniziare a utilizzare MusicLM, se vuoi spingerti nella scoperta, questi sono alcuni esempi d’uso di alcune delle modalità disponibili:

  1. Audio Generation From Rich Captions: Questa funzione ti permette di generare musica da descrizioni testuali dettagliate. Ad esempio, potresti fornire un testo come “La colonna sonora principale di un gioco arcade. È veloce e vivace, con un accattivante riff di chitarra elettrica. La musica è ripetitiva e facile da ricordare, ma con suoni inaspettati, come schianti di piatti o rullate di tamburo”​.
  2. Long Generation: Questa funzione genera 5 minuti di audio continuo, coerente e ad alta fedeltà. Puoi utilizzare prompt testuali come “Heavy metal”, “Reggae rilassante”, ecc​.
  3. Story Mode: Questo modo permette di generare musica fornendo una sequenza di prompt testuali utilizzati per condizionare la continuazione dei token semantici generati a partire dalla didascalia precedente. Ad esempio, potresti iniziare con “Una melodia di violino calma”, seguita da “Un riff di chitarra distorta si unisce”, e così via. Ogni nuova didascalia condizionerà l’audio generato successivamente, creando una narrazione musicale coerente​3​.
  4. Text and Melody Conditioning: Questa funzione ti permette di generare musica che rispetta il prompt testuale mentre segue la melodia fornita. Ad esempio, potresti fornire una melodia di base (ad esempio fischiata o canticchiata) e un prompt testuale come “Una melodia di chitarra jazz”, e MusicLM genererà musica che rispetta il tuo prompt testuale seguendo la melodia fornita​4​.

È importante notare che MusicLM è stato sviluppato sulla base di AudioLM e MuLan, che gli conferiscono la capacità di generare musica a partire da descrizioni testuali, estendere le funzionalità a partire da una melodia di input, e generare lunghe sequenze di qualsiasi strumento musicale​. MusicLM si basa su un modello di generazione autoregressiva multistadio e incorpora il condizionamento del testo per estendere le sue capacità​.

Risorse utilizzate per redarre questo caso d’uso:

  1. Google Research – MusicLM
  2. Mashable – MusicLM, an experimental tool from Google that turns written prompts into music
  3. Tasq AI – Google’s MusicLM​​
  4. MusicLM Github.io – Advanced Features​.