Key takeaways
- Ny teknik kan leda till datorer som bättre förstår mänskligt tal.
- Microsoft och NVIDIA tillkännagav nyligen en ny AI-driven metod för att tolka språk.
- Quantum computing kan vara ett annat sätt att avancera inom språkbehandling.
Det finns gott om smarta prylar att ge kommandon till nuförtiden, men vi är fortfarande långt ifrån datorer som förstår konversationstal.
Microsoft och NVIDIA tillkännagav nyligen en ny AI-driven metod för att tolka tal som kan förändra hur vi chattar med vår elektronik. Det är en del av en växande rörelse som förändrar hur datorer förstår tal, även kallad Natural Language Processing (NLP).
"Modellerna som driver NLP blir större och mer avancerade och kommer närmare mänsklig förståelse", sa AI-experten Hamish Ogilvy till Lifewire i en e-postintervju.
"Ett av de stora framstegen är att NLP går längre än enkla sökord. Du kanske är van idag att skriva eller tala ett eller två sökord för att få sökresultat, men nyare modeller för bearbetning av naturligt språk använder sammanhang för att ge rikare resultat."
chattbots
NVIDIA och Microsoft har gått ihop för att skapa Megatron-Turing Natural Language Generation-modellen (MTNLG), som duon hävdar är den "kraftigaste monolitiska transformatorspråkmodellen som tränats hittills." AI-modellen körs på superdatorer.
Men forskare fann att MTNLG-modellen tog upp mänskliga fördomar när den kammade genom berg av mänskliga talprover.
"Medan gigantiska språkmodeller utvecklar det senaste inom språkgenerering, lider de också av problem som partiskhet och toxicitet", skrev forskarna i ett blogginlägg. "Våra observationer med MT-NLG är att modellen plockar upp stereotyper och fördomar från data som den är tränad på."
Datorer som bättre förstår tal kommer inte bara att förbättra smarta högtalare som Alexa, hävdar Ogilvy. Textbaserade sökwebbplatser som Amazon kommer också att bättre förstå frågor som skrivs in.
"Google har haft den uppenbara ledningen här, men NLP-teknik kommer att finnas överallt", sa Ogilvy. "För text- och röstbaserade sökningar kan användare vara mer beskrivande eftersom NLP förstår mer än bara texten; den förstår sammanhanget för det du letar efter för att ge bättre resultat."
Quantum Chats?
Quantum computing kan vara ett sätt att avancera inom NLP. På onsdagen tillkännagav företaget Cambridge Quantum lambeq, som det hävdar är den första kvantverktygssatsen för NLP.
…NLP förstår mer än bara texten; den förstår sammanhanget för vad du letar efter för att ge bättre resultat.
Företaget säger att verktyget tillåter översättning av meningar till naturliga språk med hjälp av kvantkretsar som körs på kvantdatorer. Kvantberäkning är en typ av beräkning som använder de ovanliga egenskaperna hos kvanttillstånd, såsom superposition, interferens och intrassling, för att utföra beräkningar.
"Sättet som kvantdatorer hanterar NLP skiljer sig mycket från klassiska maskiner. Faktum är att NLP är "kvantinfödd", sa Bob Coecke, chefsforskare vid Cambridge Quantum, till Lifewire i en e-postintervju. "Detta beror på en upptäckt vi gjorde för några år sedan, att grammatiken som styr meningar och mening har en struktur som är väldigt lik den matematik som används för att programmera kvantdatorer."
Coecke sa att kvant-NLP kan leda till bättre röstassistenter och översättningsverktyg.
En annan lovande metod för att förbättra taligenkänning, kallad Zac Liu, en dataforskare på företaget Hypergiant, berättade för Lifewire i en e-postintervju. "Kort sagt, när dataforskare förbättrar NLP-data, garanterar det nästan att de kommer att ha en bättre NLP-modell och bättre NLP-kapacitet."
Nästa steg är att integrera datorseendemodeller med NLP, som att träna en AI-modell att titta på videor och producera en textsammanfattning av den videon, sa Liu.
"Tillämpningen av detta framsteg kan vara obegränsad, från hälsovård, läsning av radiologiska filmer och tillhandahållande av preliminära diagnoser, till att designa hem, kläder, smycken eller liknande föremål", tillade han. "Kunden kan förklara kraven muntligt eller skriftligt, och denna beskrivning kan automatiskt konverteras till bilder eller videor för bättre visualisering."