Key takeaways
- Ett nytt AI-drivet verktyg kan hjälpa historiker att dechiffrera gamla texter.
- Ithaca är det första djupa neurala nätverket som kan återställa den saknade texten i skadade inskriptioner, identifiera deras ursprungliga plats och hjälpa till att fastställa datumet de skapades.
- AI är användbart för att fylla i saknade data som textens plats och datum eftersom det är bra på att lära sig mycket komplexa mönster genom att analysera data.
De senaste framstegen inom artificiell intelligens (AI) driver ansträngningarna att förstå det förflutna.
Ithaca, en maskininlärningsmodell byggd av AI-forskare vid DeepMind, kan gissa ord som saknas och platsen och datumet för det skrivna språket, enligt en ny artikel. Ansträngningen kan hjälpa historiker att dechiffrera forntida manuskript.
"Ithaca är ett djupt neur alt nätverk, och som sådant är det otroligt kapabelt att hitta dolda mönster i stora mängder data", sa historikern Thea Sommerschield, medförfattare till den senaste tidningen, till Lifewire i ett e-postmeddelande intervju. "Sådana mönster kan vara textuella (grammatiska, syntaktiska eller kopplade till en upprepad 'formel' i många texter) eller kontextuella (vissa ord som förekommer konsekvent i vissa genrer av texter: t.ex. ett politiskt dekret från klassiska Aten som nämner orden 'allians,' råd, församling…')."
Avslöjar det förflutna
Ithaca är det första djupa neurala nätverket som kan återställa den saknade texten i skadade inskriptioner, identifiera deras ursprungliga plats och hjälpa till att fastställa datumet de skapades, sa Sommerschield.
Ithaca är uppkallad efter den grekiska ön i Homeros Odyssey. Forskarna fann att Ithaca uppnår 62 % noggrannhet när det gäller att återställa skadade texter, 71 % noggrannhet när det gäller att identifiera deras ursprungliga plats och kan datera texter till inom 30 år efter ursprungsdatum.
Ithacas visualiseringshjälpmedel är avsedda att göra det lättare för forskare att tolka resultat. Tidningens författare skrev att historiker uppnådde 25% noggrannhet när de arbetade ensamma för att återställa gamla texter. Men historikerns prestanda ökar till 72 % när man använder Ithaca, vilket överträffar modellens prestanda och visar potentialen för samarbete mellan människa och maskin.
“Ithaca erbjuder tolkbara resultat, som visar den ökande betydelsen av samarbete mellan mänskliga experter och maskininlärning, och visar hur matchning av mänskliga experter med djupinlärningsarkitekturer för att ta itu med uppgifter tillsammans kan överträffa den individuella (ohjälpt) prestandan för både människor och modell på samma uppgifter, säger Sommerschild till Lifewire.
Till exempel är historiker för närvarande oense om datumet för en rad viktiga atenska dekret som utfärdades vid en tidpunkt då anmärkningsvärda personer som Sokrates och Perikles levde, skrev Sommerschield i ett blogginlägg. Dekreten har länge ansetts ha skrivits före 446/445 f. Kr., även om nya bevis tyder på ett datum på 420-talet f. Kr. "Även om det kan verka som en liten skillnad är dessa dekret grundläggande för vår förståelse av den politiska historien om det klassiska Aten", skrev hon
Det närmaste verket till Ithaca är ett tidigare maskininlärningsverktyg kallat Pythia som Sommerschield och hennes medarbetare släppte 2019. Pythia var den första antika textåterställningsmodellen som använde djupa neurala nätverk.
"Idag är Ithaca den första modellen som tar sig an de tre centrala uppgifterna i epigrafens arbetsflöde holistiskt", sa Sommerschield i ett mejl. "Det främjar inte bara den tidigare toppmoderna uppsättningen av Pythia, utan den använder också djupinlärning för geografisk och kronologisk tillskrivning för första gången och i en aldrig tidigare skådad skala.”
AI för att hjälpa historiker
AI är användbart för att fylla i saknad data som textens plats och datum eftersom den är bra på att lära sig mycket komplexa mönster genom att analysera data, sa Brad Quinton, VD för AI-företaget Singulos Research, till Lifewire via e-post.
"Med hjälp av maskininlärningstekniker kan AI titta igenom ett stort antal "kända bra" exempel för att hitta mönster mellan till exempel en given text och dess datum och plats för skapandet, tillade Quinton. "Ofta är dessa mönster så komplexa att de inte skulle vara uppenbara för en mänsklig expert."
Förutsäga saknad data är en vanlig uppgift för maskininlärningsbaserad AI. Till exempel kan GPT-3 från OpenAI förutsäga saknade ord i en mening eller till och med saknade meningar i ett stycke. Och många AI-baserade bildbehandlingssystem har använts för att återställa video och bilder genom att intelligent förutsäga vad som har gått förlorat från originalet.
“Begreppsmässigt skulle forskare kunna använda liknande tekniker för att bestämma datum och ursprung för konst eller verktyg, eller andra historiska konstgjorda artefakter där det finns en förväntan om förändring i den underliggande stilen och tekniken över tid och lokalisering av ursprung”, sa Quinton.