Az új Stable Audio neurális hálózat szöveges leírás alapján generál zenét
Vegyes Cikkek / / September 14, 2023
A Stable Diffusion alkotóitól.
Stabilitási mesterséges intelligencia, amely elsősorban a képeket generáló neurális hálózatokról ismert (Stabil diffúzió, Stabil Doodle és nem csak) kiadták új neurális hálózat Stable Audio. Ahogy a neve is sugallja, hangklipeket generál.
Minden nagyjából ugyanúgy működik, mint a szöveges leírásokon alapuló képgenerátorok. A felhasználó kulcsszavakat ad meg (pl. "dallamos lo-fi hip-hop, melodikus, 85 BPM" ill. „death metal erőteljes gitárriffekkel és gyors dobokkal”), a kívánt időtartamot, és várja az eredményt.
Ugyanazt a modellt használtuk, mint a Stable Diffusion-nál, de kép helyett zenei kompozíciókra tanítottuk. Összességében körülbelül 800 ezer számot táplált be az AudioSparx stock zenei oldalról - vagyis körülbelül 19 500 órányi különböző hangzást.
Az alkotók megjegyzik, hogy a Stable Audio fő jellemzője egy adott hosszúságú kompozíciók generálása. Korábban a neurális hálózatok csak meghatározott időtartammal működtek: ha 30 másodperces hangfelvételekre oktatták őket, akkor csak 30 másodperces kompozíciókat tudtak generálni. Egy szám időtartamának beállításához a fejlesztőknek meg kellett változtatniuk a modellt, és metaadatokat kellett hozzáadniuk a kompozíció elejéhez és végéhez.
A Stable Audio három modellben kapható. Az ingyenes verzió legfeljebb 20, legfeljebb 45 másodperces dal létrehozását teszi lehetővé havonta. Létezik egy professzionális előfizetés is, amellyel akár 500, legfeljebb 90 másodperces számot hozhat létre 12 dollárért. hónap (≈1200 rubel) és az Enterprise opció olyan vállalatok számára, amelyek képesek egyénileg kiválasztani a termelési mennyiséget és az árat rendben. Fizetős előfizetés nélkül az előállított zenét kereskedelmi célokra nem használhatja fel.
A többi hasonló neurális hálózathoz hasonlóan a Stable Audio is inkább a tartalomkészítőket célozza meg, mint a professzionális zenészeket. Az ilyen eszközök alkalmasak podcastok és videók háttérzenéjének gyors létrehozására, amikor nincs ideje vagy költségvetése a zeneszerzővel való együttműködésre. Az alaphangokat is helyettesítheti, ha egyedi nevetésre vagy tömegzajokra vágyik.
Kipróbálhatja a Stable Audiot a hivatalos weboldalon. Regisztrálnia kell, vagy be kell jelentkeznie egy Google fiókkal. Kezdetben megszakítások léphetnek fel a hozzáférésben a szerver nagy terhelése miatt.
Stabil hang →
Még több új neurális hálózat🦾✨
- A Sber AIDA virtuális asszisztense diagnosztizálja a betegeket a moszkvai klinikákon
- Az Artisse új alkalmazás remek fotókat készít a felhasználó arcával
- A Stability AI bemutatta a Stable Chat chatbotot – a ChatGPT ingyenes analógját