Forestil dig, at du bor i nogle dystopisk fremtid, og du er blevet beskyldt for at være en avanceret AI, som er forbudt i dette samfund. Straffen er døden, og for at overbevise dommeren, der bestemmer din skæbne, kan du kun udtale et ord, ethvert ord, du kan lide fra ordbogen, for at bevise, at du er kød og blod. Hvilket ord vælger du?,
det lyder som opsætningen for en osteagtig sci-fi kort, men dette er faktisk en del af et nysgerrig papir fra et par forskere ved MIT på noget, de kalder “Minimal Turing Test.”
i Stedet for en maskine, der forsøger at overbevise nogen, de er mennesker gennem samtale — der var den forudsætning for den oprindelige Turing-Test, der er beskrevet af den Britiske forsker Alan Turing i sin skelsættende 1950 papir “Computing Machinery and Intelligence” — den Minimale Turing Testen anmoder om, at bare et enkelt ord, enten vælges helt frit eller plukket fra et par ord.,forskerne ansvarlige, John McCoy og Tomer Ullman, præciserer, at den minimale Turing-Test ikke er et benchmark for AI-fremskridt, men en måde at undersøge, hvordan mennesker ser sig selv i forhold til maskiner. Dette spørgsmål vil blive mere og mere relevant i en verden fyldt med AI assistenter, deepfak mennesker, og Google auto svar håndtering af din e-mail. I en verden af menneske – lignende AI, Hvad tror vi sætter os fra hinanden? Hvad gør os anderledes?,
i den første af McCoy og Ullmans to test blev 936 deltagere bedt om at vælge ethvert ord, de kunne lide, som de troede kunne være et bevis på deres menneskehed. På trods af det frie udvalg af valg, resultater grupperet omkring et lille antal temaer. De fire oftest plukket ord var “kærlighed” (134 svar), “medfølelse” (33 svar), “menneske” (30 svar), og “du” (25 svar), som udgjorde en fjerdedel af alle svar. Andre klynger var empati (ord som “følelser,” “følelser” og “sympati”), og tro og tilgivelse (ord som “barmhjertighed,” “håb” og “gud”).,
alt i alt dækkede 936 svarene 428 individuelle ord, hvilket er en slående mængde samhørighed.
i den anden test måtte 2.405 deltagere vælge mellem par ord og beslutte, hvilken af de to, de troede, blev givet af et menneske og en maskine. Igen scorede ord som” kærlighed”,” menneske “og” venligst “stærkt, men det vindende ord var enklere og tydeligt biologisk:” poop.,”Ja, ud af alle ordparringerne blev “poop” valgt hyppigst for at betegne selve essensen og sjælen i menneskeheden. Lort.i en tale med The Verge understregede McCoy fra MIT ‘ s Sloan Neuroeconomics Laboratory, at testen handlede mere om socialpsykologi end datalogi.
“vi ser det ikke bruges som det næste ,” siger McCoy. “De praktiske anvendelser, Det har i AI-computerrummet, er mere, når du tænker på brugergrænsefladedesign og sådan noget., I disse sammenhænge er det måske nyttigt at vide, hvordan folk tænker på computere, og hvad de synes, adskiller dem.”
dette giver mening, da selv den originale Turing-Test længe er faldet ude af fordel med computerforskere som en test af maskinens intelligens. Kritikere siger, at det tester programmørernes evne til at finde konversationshacks, der kan narre mennesker mere end intelligens.
for eksempel udtalte nyhedsdækning i 2014, at Turing-testen var blevet bestået af en chatbot., Programmørerne narrede dommerne ved at få deres bot til at identificere sig som en 13-årig ukrainsk dreng ved navn Eugene Goostman. Dette gav den perfekte dækning for botens mange fejl og dens manglende evne til at besvare visse spørgsmål. Som kritikere som computerforsker Gary Marcus bemærkede, ” hvad Goostmans sejr virkelig afslører … er ikke fremkomsten af SkyNet eller cyborg kultur, men snarere den lethed, hvormed vi kan narre andre.”
men det er ikke at sige, at Turing-testen er ubrugelig., Oprettelse af computerprogrammer, der kan chatte overbevisende, er en frugtbar udfordring for AI-forskere, der kan gavne menneskeheden. Testen er også stadig et fantastisk tankeeksperiment, der kan hjælpe os med at udforske komplekse spørgsmål omkring vores forståelse af intelligens. Vi kan også ændre det for at skærpe sit fokus ved at bede computere om ikke blot at chatte, men at besvare forespørgsler, der kræver en nuanceret og rig forståelse af verden. (Et eksempel er at spørge en computer, ” Hvad er flertallet af ‘platch’ og ‘snorp’?,”Et menneske ville sandsynligvis svare “platches ” og” snorps”, på trods af at disse ord er nonsens og ikke kan findes i en ordbog.)
det er inden for denne ramme, at den minimale Turing-Test bedst værdsættes som et tankeeksperiment, ikke et benchmark for AI-fremskridt. McCoy siger, hvad overraskede ham mest om forskningen var, hvor meget kreativitet der var i svarene. “Folk kom op med alle mulige interessante shibboleths og ordspil,” siger han, med ord som “bootylicious” “supercalifragilisticexpialidocious.”(Prøv at stave det uden Google.,)
“det fortæller dig noget om kløften mellem mennesker og smarte robotter,” siger McCoy, “at folk, der aldrig har været nødt til at tænke på denne situation før, kom med mange smarte og sjove resultater.”Det er med andre ord noget, som en computer ville kæmpe med.