Ieskats jaunajā Al Generatīvā mākslā

Al ģeneratīvā māksla ir mākslas veids, vairumā gadījumu vizuālais, kas balstās uz sadarbību starp cilvēku un autonomu sistēmu. “Autonomā sistēma” ir definēta kā Mākslīgais intelekts programmatūra, algoritms vai modelis, kas spēj veikt sarežģītas darbības bez programmētāja iejaukšanās.

No dīvainajiem attēlu pretnostatījumiem, ko radījis Dall-E Mini uz NFT tirgū, mākslīgā intelekta algoritmu ģenerētie attēli arvien vairāk ienāk galvenajā iztēlē. Faktiski divi svarīgi projekti par šo tēmu, kas ir jāanalizē, ir: Pusceļš un DALL-E2.

Protams, ziņas ir nonākušas arī Twitter. Cita starpā to komentē Čārlzs Hoskinsons, kurš rakstīja:

Al Generative Art: agrīnie eksperimenti un funkcijas

Saprotot, kas ir ģeneratīvā māksla, ir svarīgi uzsvērt vienu no tās pamatprincipiem: nejaušība. Kas ir ģeneratīvās mākslas pamatīpašība.

Faktiski, atkarībā no programmatūras veida, autonomā sistēma spēj apstrādāt rezultātus, kas vienmēr ir atšķirīgi un unikāli katru reizi, kad tiek izpildīta ģenerēšanas komanda, vai arī tā var atgriezt mainīgu rezultātu skaitu, reaģējot uz lietotāja ievadi.

Pirmie eksperimenti ģeneratīvajā mākslā aizsākās 1960. gados ar eksperimentiem ar Harolds Koens un viņa AARON programma. Koens pirmo reizi izmantoja atsevišķu programmatūru, lai radītu abstraktus mākslas darbus, kurus iedvesmojuši popmākslas sietspiedes. Koena darbi tagad ir apskatāmi Teita galerijā Londonā.

Vēl viens ģeneratīvās mākslas atribūts, kas ir arvien mazāk prerogatīva, ir programmētāja nodrošināto un programmatūras koda ietvaros ieviesto modeļu vai abstrakto elementu atkārtošana.

Turklāt arvien sarežģītāku neironu tīklu attīstība, kas darbojas, izmantojot teksta attēlu asociāciju, ir ļāvusi izstrādāt ģeneratīvus modeļus, kas spēj radīt arvien reālistiskākus un precīzākus attēlus. Vispazīstamākais šīs ģeneratīvās mākslas kategorijas piemērs ir Dals-E.

Dall-E ir multimodāls neironu tīkls, kura pamatā ir GPT-3 dziļās mācīšanās modelis no OpenAI, tas pats uzņēmums, kas arī nesen attīstījās ChatGPT, tērzēšanas robots tika palaists 2022. gada novembrī un optimizēts ar "uzraudzīts" un pastiprināšanas mācīšanās metodes.

Atgriežoties pie Dall-E, mēs redzam, ka šī sistēma spēj ģenerēt attēlus no teksta apraksta, ko sauc par "pamudināt," pamatojoties uz teksta un attēla pāru datu kopu.

Pirmā Dall-E versija, kas tika prezentēta sabiedrībai 2021. gada janvārī un palika neliela skaita šīs jomas profesionāļu prerogatīva, pārstāvēja īstu revolūciju šāda veida ģeneratīvā modeļa ziņā, pārspējot GPT- inovācijas. 3 pati.

Nozīmīgs ir arī fakts, ka Dall-E apstrādāto rezultātu precizitāte izrādījās lieliska vieta citam OpenAI risinājumam: CLIP (Kontrastīvās valodas-attēla priekšapmācība).

Attēlu klasifikācijas un ranžēšanas neironu tīkls, kas apmācīts, pamatojoties uz teksta un attēla asociācijām, piemēram, internetā atrodamiem parakstiem. Pateicoties CLIP iejaukšanās, kas samazina lietotājam piedāvāto rezultātu skaitu vienā uzvednē līdz 32, tika konstatēts, ka Dall-E vairumā gadījumu atgriež apmierinošus attēlus.

Midjourney: dizains, cilvēku infrastruktūra un mākslīgais intelekts

Kā paredzēts, Pusceļš ir svarīgs projekts, kas ir daļa no topošās Al Generative Art koncepcijas. Konkrēti, Midjourney ir neatkarīga pētniecības laboratorija, kas pēta jaunus domāšanas līdzekļus un paplašina cilvēku sugas iztēles spējas.

Tās lietošana ir vienkārša: vispirms ir jāizveido konts Neatbilstība, platforma, kas mitina dažādas kopienas, kur viena no tām ir Midjourney. Lietojumprogrammā ir dažādas tērzēšanas istabas, kurās var aktīvi piedalīties vai nepiedalīties diskusijās.

Ir svarīgi norādīt, ka, lai pirmo reizi mēģinātu izmantot mākslīgo intelektu, ir jāiet uz "iesācēji" kanāli, kur 25 bezmaksas renderēšanas Ir pieejami.

Viens renderējums atbilst četru dažādu variantu ģenerēšanai, kas ģenerēti no vienas teksta ievades.

Tādējādi 25 atveidojumi attiecas uz 25 apstrādes darbiem, ko veic Midjourney robots. Līdz ar to attēla ģenerēšanai ir nepieciešama mijiedarbība ar Midjourney robotu, izmantojot īsziņu, ko sauc par “prompt”, kurā būs atslēgvārdi, kas apraksta attēlu, ko lietotājs ir domājis.

Jūs varat pievienot tik daudz detaļu, cik vēlaties, galvenais ir sadalīt atslēgvārdus ar komatu. Kad renderēšana ir pabeigta, dators atgriež četrus dažādus attēlus, pamatojoties uz aprakstiem, no kuriem izvēlēties.

Turklāt, kad programma ir pabeigusi renderēšanu, varat paziņot savas preferences, pamatojoties uz attēliem, un, ja vēlaties, vēlreiz ģenerēt vēl četras versijas.

DALL-E 2: jaunā mākslīgā intelekta sistēma mākslas darbiem

Papildus Midjourney, DALL-E 2 ir arī jaunā AI sistēma, kas var radīt reālistiskus attēlus un mākslas darbus no apraksta dabiskajā valodā. Ne tikai tas, ka DALL-E 2 var arī apvienot koncepcijas, atribūtus un stilus.

Jaunās mākslīgā intelekta sistēmas spēks slēpjas arī tajā, ka tā spēj paplašināt attēlus, pārsniedzot to, kas ir oriģinālajā audeklā, radot jaunas ekspansīvas kompozīcijas. Turklāt tas var veikt reālistiskas izmaiņas esošajos attēlos no paraksta dabiskajā valodā un var pievienot un noņemt elementus, ņemot vērā ēnas, atspulgus un faktūras.

DALL-E 2 iespējas ietver arī attēla uzņemšanu un vairāku tā variāciju izveidi, iedvesmojoties no oriģināla. DALL-E 2 ir iemācījies attiecības starp attēliem un to aprakstīšanai izmantoto tekstu.

Tas izmanto procesu, ko sauc "difūzija", kas sākas ar nejaušu punktu modeli un pakāpeniski maina šo modeli attēla virzienā, kad tā atpazīst konkrētus šī attēla aspektus.

Tātad pēc tam, kad OpenAI 2021. gada janvārī ieviesa DALL-E, tagad jaunākā sistēma DALL-E 2 ģenerē reālistiskākus un precīzākus attēlus ar četras reizes lielāku izšķirtspēju.

DALL-E 2 sākās kā pētniecības projekts un tagad ir pieejams kā a beta versija. Drošības mazināšanas pasākumi, ko sistēma ir izstrādājusi un turpina uzlabot, ietver: ierobežojot sistēmas spēju radīt vardarbīgus, naida vai pieaugušo attēlus un uz mācībām balstītu pakāpenisku izvietošanu.

Avots: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/