Key takeaways
- AI-systemet som heter DALL-E2 verkar ha skapat ett eget system för skriftlig kommunikation.
- Vissa experter säger att det uppenbara språket bara kan vara trams.
- Det är ett exempel på hur svårt det är att tolka resultaten av avancerade AI-system.
Det ser ut som att artificiell intelligens (AI) har utvecklat sitt eget språk, men vissa experter är skeptiska till påståendet.
OpenAI:s text-till-bild AI-system som heter DALL-E2 verkar ha skapat ett eget system för skriftlig kommunikation. Det är ett exempel på hur svårt det är att tolka resultaten av avancerade AI-system.
"På grund av storleken och djupet hos stora modeller är det mycket svårt att förklara modellbeteende", sa Teresa O'Neill, chef för lösningsarkitektur för förståelse av naturligt språk på iMerit, till Lifewire i en e-postintervju. "Detta är en av kärnutmaningarna, och i vissa fall etiska frågor med allt kraftfullare modeller. Om vi inte kan förklara varför de beter sig som de gör, kan vi förutsäga deras beteende eller hålla det i linje med våra normer och förväntningar?"
AI Chats
Datorvetenskapsstudenten Giannis Daras noterade nyligen att DALLE-2-systemet, som skapar bilder baserat på textinmatning, skulle returnera nonsensord som text under vissa omständigheter.
"En känd begränsning av DALLE-2 är att den kämpar med text", skrev han i en tidning publicerad på preprint-servern Arxiv. "Till exempel, textuppmaningar som: 'En bild av ordet flygplan' leder ofta till genererade bilder som skildrar nonsenstext."
Men, skrev Daras, det kan finnas en metod bakom det uppenbara snacket. "Vi upptäcker att den här producerade texten inte är slumpmässig, utan snarare avslöjar en dold vokabulär som modellen verkar ha utvecklat internt", fortsatte han. "Till exempel, när den matas med den här skratttexten producerar modellen ofta flygplan."
I sin tweet påpekade Daras att när DALLE-2 blev ombedd att texta en konversation mellan två bönder, visade den att de pratade, men pratbubblorna var fyllda med vad som såg ut som orimliga ord. Men Daras upptäckte att orden verkade ha sin egen betydelse för AI: bönderna pratade om grönsaker och fåglar.
Nicola Davolio, VD för teknikföretaget Hupry, som arbetar med AI, förklarade för Lifewire i en e-postintervju att språket är baserat på symboler som DALL-E2-systemet har lärt sig att associera med vissa begrepp. Till exempel kan symbolen för "hund" vara relaterad till en hunds bild, medan symbolen för "katt" kan vara associerad med en bild av en katt. DALL-E2 har skapat sitt språk eftersom det gör det möjligt för den att kommunicera mer effektivt med andra AI-system.
Pussel som det uppenbarligen dolda ordförrådet i DALL-E2 är roliga att brottas med, men de lyfter också fram tyngre frågor…
"Språket är sammansatt av symboler som ser ut som egyptiska hieroglyfer och verkar inte ha någon specifik betydelse", tillade han. "Symbolerna är förmodligen meningslösa för människor, men de är perfekta för AI-systemet eftersom det har tränats på miljontals bilder."
Forskare tror att AI-systemet skapade språket för att hjälpa det att bättre förstå relationerna mellan bilder och ord, sa Davolio.
"De är inte säkra på varför AI-systemet utvecklade sitt språk, men de misstänker att det kan ha något att göra med hur det lärde sig att skapa bilder", tillade Davolio. "Det är möjligt att AI-systemet utvecklat sitt språk för att göra kommunikationen mellan olika nätverksdelar mer effektiv."
AI Mysteries
DALL-E2 är inte det enda AI-systemet som har utvecklat sitt interna språk, påpekade Davolio. Under 2017 skapade Googles AutoML-system en ny form av neural arkitektur som kallas ett "barnnätverk" efter att ha lämnats för att bestämma hur man bäst skulle slutföra en given uppgift. Detta barnnätverk kunde inte tolkas av dess mänskliga skapare.
"De här exemplen är bara några få fall där AI-system har utvecklat sätt att göra saker som vi inte kan förklara", sa Davolio. "Det är ett framväxande fenomen som i lika hög grad är fascinerande och alarmerande. När AI-system blir mer komplexa och autonoma kan vi i allt högre grad befinna oss i situationen att vi inte förstår hur de fungerar."
O'Neill sa att hon inte tror att DALL-E2 skapar sitt eget språk. Istället sa hon att orsaken till den uppenbara språkliga uppfinningen förmodligen är lite mer prosaisk.
"En rimlig förklaring är en slumpmässig chans - i en modell som är så stor, kan lite av Murphys lag gälla: om något konstigt kan hända kommer det förmodligen att göra det", tillade O'Neill. En annan möjlighet som föreslås av forskningsanalytiker Benjamin Hilton i en Twitter-tråd som diskuterar Daras fynd är att formen av frasen "apoploe vesrreaitais" härmar formen av ett latinskt namn på ett djur. Så systemet har skapat en ny ordning av Aves, tillade O'Neill.
"Pussel som det uppenbarligen dolda ordförrådet i DALL-E2 är roliga att brottas med, men de lyfter också fram tyngre frågor kring risken, partiskheten och etiken i det ofta outgrundliga beteendet hos stora modeller", sa O'Neill.