Hvordan Google Translate, der engang blev kritiseret for oversættelsesfejl, blev et revolutionerende værktøj med deep learning-baseret GNMT

H

Google Translate, som blev kritiseret for sine oversættelsesfejl for et par år siden, har i høj grad forbedret naturligheden og nøjagtigheden af ​​sine oversættelser med introduktionen af ​​deep learning-baseret GNMT-teknologi, som sammen med fremskridt inden for kunstig intelligens forventes at kunne lave oversættelser endnu mere perfekt i fremtiden.

 

De fleste, der har brugt Google Oversæt, har oplevet fejl i Google Oversæt på et tidspunkt i deres liv. Inden du brugte Google Translate, havde du måske en forventning om, at Google Translate ville gøre alt for dig, selvom du ikke kunne et fremmedsprog, men efter at have brugt det, er den forventning gået ud af vinduet. Google Translate har for nylig gennemgået en transformation, der har gjort det til en meget bedre oplevelse, end det var for et par år siden. Konteksten for oversættelsen er blevet meget mere naturlig, og selv poetiske udtryk kan nu fortolkes.
Google Translate har altid kæmpet for at håndtere subtile nuancer, især mellem sprog. Dette har ført til, at mange brugere er nødt til at gå tilbage til Google Oversæt for at rette eller genfortolke dets output. I de senere år er dette besvær dog blevet reduceret kraftigt. Takket være introduktionen af ​​nye teknologier er Google Translate i stand til at levere meget mere sofistikerede og præcise oversættelser end før, hvilket er et stort skridt fremad for global kommunikation.
Årsagen til denne meteoriske stigning er introduktionen af ​​Neural Machine Translation System (GNMT) til Google Translate-tjenesten. Før introduktionen af ​​GNMT var systemet bag Google Translate et sætningsbaseret maskinoversættelsessystem. Dette system var baseret på en database med grammatiske regler og semantik af sproget indlæst af mennesker, og det skulle oversætte hvert ord eller hver sætning i en given sætning én efter én og derefter samle dem til en sætning som et puslespil. På grund af dette havde selve sætningsstrukturen en stærk følelse af at blive leget med separat, og ordrækkefølgen og konteksten i selve den oversatte sætning var meget unaturlig at læse. Selvfølgelig kunne forfatterens mening og hensigt i sætningen ikke fattes. Siden Google har leveret oversættelsestjenester baseret på dette system, har mange brugere oplevet pinlige oversættelsesresultater.
Den nyligt introducerede GNMT-teknologi er imidlertid en oversættelsesteknologi, der udnytter deep learning, en kerneteknologi inden for kunstig intelligens. GNMT-teknologien genkender strømmen af ​​hele sætningen og forstår forfatterens formål med sætningen for at levere en oversættelse, hvilket gør fortolkningen mærkbart mere smidig. Mens introduktionen af ​​GNMT er en stor innovation i sig selv, er det vigtigt at forstå de grundlæggende begreber for dyb læring for at forstå de ændringer, det har medført.
Så hvad er deep learning, kerneteknologien inden for kunstig intelligens, der har bragt os til dette punkt? Deep learning er en generel kunstig intelligens-algoritme, der blev brugt i AlphaGo, computer Go-programmet, der konkurrerede mod Lee Sedol. Det er et ord, du sikkert har hørt før, da det ofte er i offentlighedens øjne. Sammen med dette har du måske også hørt, at AlphaGos strømforbrug i kampen mod Lee Sedol var svimlende. Det skulle efter sigende have brugt 1,200 CPU'er, hvilket nogenlunde svarer til 300 computere. Disse massive computere studerer som mennesker, før de spiller mod Lee Sedol. De studerer, hvilke trends der vinder, og hvilke trends der vil tabe. AlphaGo lærer mønstre ved at analysere eksisterende brikker og skabe nye ud fra dem, og når det er færdigt, spiller det mod Lee Sedol. I løbet af spillet leder AlphaGo efter det mønster, der mest ligner det aktuelle træk fra det første træk, det studerede. AlphaGo lærer ved at orientere sig mod det vindende træk. Ligesom et menneske lærer. Programmer, der er trænet på denne måde, er i stand til at udføre millioner eller titusinder af beregninger hurtigere end mennesker, nogle gange bedre end dem.
Som du kan se, er deep learning en form for kunstig intelligens, der er udviklet fra kunstige neurale netværk, som bruger et input-output lag af information, der ligner neuroner i hjernen til at lære af data. Et kunstigt neuralt netværk, som går forud for dyb læring, er en algoritme, der er modelleret efter den menneskelige hjerne til at behandle information på samme måde som den menneskelige hjerne. Den menneskelige hjerne er opbygget af strukturelle enheder kaldet neuroner, og erfaringen har lært os, at den har en række specifikke funktioner, såsom mønstergenkendelse og kognition. Disse neurale netværk er muliggjort af computernes stigende kraft. Der er dog nogle problemer med denne teknologi. De har en langsom indlæringstid og mister deres ændringsretning, efterhånden som antallet af lag stiger. Dyb læring har overvundet mange af disse mangler.
Introduktionen af ​​deep learning har ikke bare forbedret ydeevnen af ​​Google Translate, men har åbnet op for en lang række applikationer. For eksempel på det medicinske område kan diagnostiske systemer, der anvender dyb læring, spille en vigtig rolle i at opdage visse sygdomme tidligt og foreslå behandlingsmetoder. Som du kan se, gennemsyrer dyb læring i stigende grad mange aspekter af vores liv, og mulighederne er uendelige.
GNMT-teknologi, som anvender ovenstående dybe læringsteknikker, matcher ikke ord eller sætninger 1:1, som mennesker gør. GNMT-teknologien genkender hele sætningen som en oversættelsesenhed og er i stand til at forstå konteksten og afspejle den i resultaterne. GNMT'er analyserer og lærer også af eksisterende oversættelser, og i processen kan GNMT'er forbedre deres ydeevne ved at ændre forbindelserne mellem kunstige neurale netværk.
For at evaluere GNMT's ydeevne udvalgte Googles forskere sætninger fra Wikipedias kommentarer og nyhedsartikler og oversatte dem til flere sprog. De satte dem derefter side om side med oversættelser fra Googles eksisterende system og menneskelige oversættere og bad menneskelige evaluatorer om at vurdere kvaliteten af ​​oversættelserne. Resultaterne viste, at kinesisk til engelsk oversættelse, et notorisk vanskeligt sprog, scorede væsentligt bedre end vores eksisterende system. Oversættelser mellem nogle sprog scorede også tæt på menneskelig oversættelse med hensyn til nøjagtighed. Men oversættelser mellem indiske og europæiske sprog haltede bagefter. "Det skal bemærkes, at de udvalgte sætninger var gennemarbejdede korte sætninger," understreger forfatterne.
Google Translate er drevet af deep learning, en nøgleteknologi inden for kunstig intelligens. Google Translate har været i stand til at akkumulere big data ved at datamininge internettet og oversætte hele sætninger som en enhed. Siden oversættelsesenheden er blevet udvidet fra ord og sætninger til sætninger, er oversættelsesresultaterne blevet mærkbart forbedret i forhold til tidligere. Barak Turovsky, Head of Product Management, Google Translate, kommenterede "Neural maskinoversættelsesteknologi reducerer sandsynligheden for fejl med op til 85%. Det er en stor udvikling, end vi har opnået i de sidste 10 år."
Men virkeligheden er, at der er stor variation, når det kommer til at oversætte sprog. Selv inden for et sprog er der individuelle forskelle og dialekter, og sprog ændrer sig over tid. Ydermere, når det kommer til at oversætte legende eller poetiske udtryk, bliver fortolkningen endnu mere upræcis og klodset. Nogle har hævdet, at neurale netværksoversættelsesteknologi er mindre nøjagtig end sætningsbaserede maskinoversættelsessystemer. Deep learning er dog kernen i teknologien bag Google Translate, så maskinens hjerne akkumulerer oversættelsesdata, mens du læser dette. Med tiden vil maskinen også være i stand til selv at lære og indsamle information om de data, den netop har akkumuleret. Efterhånden som dette akkumuleres, vil det i sidste ende være i stand til at oversætte på måder, der mangler i øjeblikket. Faktisk har Google indrømmet, at dets oversættelser endnu ikke er så gode som menneskelige oversættelser, og at der er mange fejl. Virksomheden understregede dog, at det vil udvikle sig til næsten perfektion, efterhånden som det akkumulerer læringserfaring og fremskridt inden for deep learning-baseret AI og relaterede teknologier. Vi kan kun håbe, at Google Translate med sin oversættelsesteknologi for neurale netværk vil være i stand til at nedbryde sprogbarrierer i den nærmeste fremtid.

 

Om forfatteren

Blogger

Hej! Velkommen til Polyglottist. Denne blog er for alle, der elsker koreansk kultur, uanset om det er K-pop, koreanske film, dramaer, rejser eller noget andet. Lad os udforske og nyde koreansk kultur sammen!

Om blogejeren

Hej! Velkommen til Polyglottist. Denne blog er for alle, der elsker koreansk kultur, uanset om det er K-pop, koreanske film, dramaer, rejser eller noget andet. Lad os udforske og nyde koreansk kultur sammen!