Ein Turing-Test mit einem Wort legt nahe, dass "Poop" uns von den Maschinen unterscheidet

Stellen Sie sich vor, Sie leben in einer dystopischen Zukunft, und Sie wurden beschuldigt, eine fortschrittliche KI zu sein, die in dieser Gesellschaft verboten ist. Die Strafe ist der Tod, und um den Richter zu überzeugen, der Ihr Schicksal entscheiden wird, können Sie nur ein Wort aussprechen, jedes Wort, das Sie aus dem Wörterbuch mögen, um zu beweisen, dass Sie Fleisch und Blut sind. Welches Wort wählst du?,

Es klingt wie das Setup für einen kitschigen Science-Fiction-Kurzfilm, aber dies ist tatsächlich Teil eines kuriosen Papiers eines Forscherpaares am MIT über etwas, das sie den „Minimal Turing Test“ nennen.“

Anstelle einer Maschine, die versucht, jemanden durch Konversation davon zu überzeugen, dass sie ein Mensch sind — was die Prämisse des ursprünglichen Turing-Tests war, den der britische Wissenschaftler Alan Turing in seiner bahnbrechenden 1950-Arbeit „Computing Machinery and Intelligence“ skizzierte-Der minimale Turing-Test verlangt nur ein Wort, entweder völlig frei gewählt oder aus einem Wortpaar ausgewählt.,

Die verantwortlichen Forscher John McCoy und Tomer Ullman stellen klar, dass der Minimal-Turing-Test kein Maßstab für den KI-Fortschritt ist, sondern eine Möglichkeit, zu untersuchen, wie sich Menschen in Bezug auf Maschinen sehen. Diese Frage wird in einer Welt voller KI-Assistenten, tiefgefrorener Menschen und Google Auto Reply, die mit Ihrer E-Mail umgehen, immer relevanter. In einer Welt der menschenähnlichen KI, was denken wir, unterscheidet uns? Was macht uns anders?,

Im ersten der beiden Tests von McCoy und Ullman wurden 936 Teilnehmer gebeten, ein beliebiges Wort auszuwählen, von dem sie dachten, dass es ein Beweis für ihre Menschlichkeit sein könnte. Trotz der freien Auswahlmöglichkeiten gruppierten sich die Ergebnisse um eine kleine Anzahl von Themen. Die vier am häufigsten ausgewählten Wörter waren “ Liebe „(134 Antworten),“ Mitgefühl „(33 Antworten),“ Mensch „(30 Antworten) und“ Bitte “ (25 Antworten), die ein Viertel aller Antworten ausmachten. Andere Cluster waren Empathie (Wörter wie „Emotion“, „Gefühle“ und „Sympathie“) und Glaube und Vergebung (Wörter wie „Barmherzigkeit“, „Hoffnung“ und „Gott“).,

Insgesamt deckten die 936 Antworten 428 einzelne Wörter ab, was eine bemerkenswerte Menge an Zusammenhalt ist.

Antworten aus dem Ein-Wort-Test zeigen, dass die beliebteste Einzelantwort „Liebe“ war.“

Bild von McCoy und Ullman / MIT

Im zweiten Test mussten 2.405 Teilnehmer zwischen Wortpaaren wählen und entscheiden, welches der beiden von einem Menschen und einer Maschine gegeben wurde. Wieder punkteten Wörter wie „Liebe“, „Mensch“ und „Bitte“ stark, aber das gewinnende Wort war einfacher und deutlich biologischer: „poop.,“Ja, von allen Wortpaarungen wurde „poop“ am häufigsten ausgewählt, um das Wesen und die Seele der Menschheit zu bezeichnen. Poop.

Im Gespräch mit The Verge betonte McCoy vom Sloan Neuroeconomics Laboratory des MIT, dass es bei dem Test mehr um Sozialpsychologie als um Informatik gehe.

„Wir sehen nicht, dass es als nächstes verwendet wird“, sagt McCoy. „Die praktischen Anwendungen, die es im KI-Computerraum gibt, sind mehr, wenn Sie über das Design der Benutzeroberfläche und solche Dinge nachdenken., In diesen Kontexten ist es vielleicht nützlich zu wissen, wie Menschen über Computer denken und was sie denken, unterscheidet sie.“

Dies ist sinnvoll, da selbst der ursprüngliche Turing-Test bei Informatikern als Test der Maschinenintelligenz längst in Ungnade gefallen ist. Kritiker sagen, dass es die Fähigkeit von Programmierern testet, Konversations-Hacks zu finden, die Menschen mehr als Intelligenz austricksen können.

Zum Beispiel sagte die Berichterstattung in 2014, dass der Turing-Test von einem Chatbot bestanden worden sei., Die Programmierer haben Richter ausgetrickst, indem sie ihren Bot als 13-jährigen ukrainischen Jungen namens Eugene Goostman identifizieren ließen. Dies bot die perfekte Abdeckung für die vielen Fehler des Bots und seine Unfähigkeit, bestimmte Fragen zu beantworten. Wie Kritiker wie der Informatiker Gary Marcus feststellten: „Was Goostmans Sieg wirklich enthüllt … ist nicht das Aufkommen von SkyNet oder Cyborg-Kultur, sondern die Leichtigkeit, mit der wir andere täuschen können.“

Aber das soll nicht heißen, dass der Turing-Test nutzlos ist., Das Erstellen von Computerprogrammen, die überzeugend chatten können, ist eine fruchtbare Herausforderung für KI-Forscher, von der die Menschheit profitieren kann. Der Test ist auch immer noch ein fantastisches Gedankenexperiment, mit dem wir komplexe Fragen rund um unser Verständnis von Intelligenz untersuchen können. Wir können es auch ändern, um seinen Fokus zu schärfen, indem wir Computer auffordern, nicht einfach zu chatten, sondern Fragen zu beantworten, die ein differenziertes und umfassendes Verständnis der Welt erfordern. (Ein Beispiel fragt einen Computer: „Was sind die Plurale von ‚Platch‘ und’snorp‘?,“Ein Mensch würde wahrscheinlich“ Platches „und“ Snorps “ beantworten, obwohl diese Wörter Unsinn sind und nicht in einem Wörterbuch zu finden sind.)

In diesem Rahmen wird der minimale Turing-Test am besten als Gedankenexperiment geschätzt, nicht als Maßstab für den KI-Fortschritt. McCoy sagt, was ihn an der Forschung am meisten überraschte, war, wie viel Kreativität in den Antworten war. „Die Leute kamen mit allen möglichen interessanten Shibboleths und Wortspielen“, sagt er, mit Worten wie „bootylicious“ „supercalifragilisticexpialidocious.“(Versuchen Sie, das ohne Google zu schreiben.,)

„Es sagt Ihnen etwas über die Kluft zwischen Menschen und intelligenten Robotern“, sagt McCoy, „dass Menschen, die noch nie über diese Situation nachgedacht haben, viele kluge und lustige Ergebnisse erzielt haben.“Es ist etwas, mit anderen Worten, dass ein Computer kämpfen würde mit.

Ein Turing-Test mit einem Wort legt nahe, dass „Poop“ uns von den Maschinen unterscheidet

Schreibe einen Kommentar Antworten abbrechen