Key takeaways
- DALL·E är ett nytt neur alt nätverk som kan rita bilder baserat på text.
- Nätverket är ett av ett växande antal AI-projekt som kan efterlikna människors kreativa resultat.
- Experter säger att bilder ritade av AI inte är originalskapelser.
Flytta dig över, Picasso. Ett nytt neur alt nätverk kan rita bilder baserat på text.
DALL·E, en portmanteau av namnen på konstnären Salvador Dalí och Pixars WALL·E, kan ta vilken text som helst och skapa en bild av den. Systemet använder ett neur alt nätverk som har tränats på miljarder bilder och textexempel. Det är ett av ett växande antal AI-projekt som kan efterlikna, men inte replikera, människors kreativa resultat.
"Eftersom naturligt språk ständigt utvecklas, och mycket beroende av kontextuella nyanser, är det en mycket viktig prestation att lära en maskin att förstå språket tillräckligt bra för att rita en bild", Tamara Schwartz, professor i cybersäkerhet vid York College of Pennsylvania, sa i en e-postintervju. "Föreställ dig en polisskisser, det är en sällsynt talang, som har förmågan att skapa en bild baserat på en vittnesbeskrivning."
Använda Big Data för att producera bilder
DALL-E skapades av AI-forskningsföretaget OpenAI och fungerar genom att samla stora mängder data från internet. Data bearbetas sedan av en naturlig språkmodell och tränas för att producera bilder från text. DALL-E fungerar på samma sätt som den nyligen släppta GPT-3, en språkmodell skapad av OpenAI som kan uppmanas att generera origin altextpassager. GPT-3 tränades med en halv biljon ord internettext och kan producera överraskande verklighetstrogen text.
Att lära en maskin att förstå språk tillräckligt bra för att rita en bild är en mycket betydande prestation.
Michael Yurushkin, grundare och CTO för BroutonLab, ett datavetenskapsföretag, sa i en e-postintervju att DALL-E är "ett av mänsklighetens få framgångsrika försök att efterlikna vår kreativitet och fantasi." Han tillade, "Det är lättare att inse hur AI förutsäger något genom att gå igenom relevant data, men att förstå hur den kan skapa ritningar av saker som den aldrig "hört" om förut är svårare."
Schwartz är noga med att notera att AI inte skapar information, utan snarare tar språkdata och omvandlar den till bilder.
"Den initiala kreativiteten kommer från människan som konstruerade uppgiften", sa Schwartz. "Det finns en viss "kreativitet" hos AI:n, eftersom den experimenterar med olika kombinationer av data och sedan väljer från ett antal potentiella utdata. Men en människa undersöker resultatet och lär AI hur man väljer bland de många kombinationerna."
Robotdetektivarbete?
En maskin kan experimentera med denna data- och objektkombination mycket snabbare än en mänsklig konstnär. Schwartz noterade att DALL-E en dag skulle kunna samarbeta med en detektiv som försöker rekonstruera en brottsplats genom en skiss, baserad på ögonvittnen.
"När vittnen lämnar sina uttalanden kan datorn ta den talade, naturliga språkinformationen och skapa en teckning av scenen, eller många teckningar av scenen", sa hon. "Dessa visualiseringar kan sedan integreras för att skapa en mer exakt bild av förlorade bevis. Denna visualisering kan berikas genom att integrera tidigare bilder av platsen före brottet."
Flera andra AI-drivna program kan producera konst. Till exempel använder Ai-Da ett robotarmsystem och ansiktsigenkänningsteknik i kombination med artificiell intelligens för att skapa konst. Systemet kan analysera en bild som läggs framför maskinen, som matas in i en algoritm för att producera robotens armrörelser.
Mänskliga konstnärer bör dock inte oroa sig för att robotöverherrar kommer att ersätta dem, hävdade Ahmed Elgammal, chef för Art and Artificial Intelligence Lab vid Rutgers University, i The New York Times förra året.
"Medan definitionen av konst ständigt utvecklas, är det i dess kärna en form av kommunikation mellan människor", skrev han. "Utan en mänsklig artist bakom maskinen kan AI göra lite mer än att leka med formen, oavsett om det innebär att manipulera pixlar på en skärm eller anteckningar på en musikalisk bok. Dessa aktiviteter kan vara engagerande och perceptuellt spännande, men de saknar mening utan interaktion mellan artist och publik."
Efter att ha tittat på DALL-E:s verk förstår jag Elgammals poäng att de AI-skapade bilderna inte är konst. Å andra sidan är de bättre än någon konst jag skulle kunna skapa. Så, egentligen, vad är skillnaden?