Kan chatbots bli lika medvetna som människor?
Miscellanea / / October 31, 2023
Två motsatta teorier försöker svara på denna fråga.
Christoph Koch
Amerikansk neuroforskare, chef för Allen Institute for Brain Research.
Frågor om vad subjektiv upplevelse är, vem som har den och hur den relaterar till den fysiska världen runt omkring oss har förföljt filosofernas sinnen under större delen av mänsklighetens historia. Vetenskapliga teorier om medvetande som är kvantifierbara och empiriskt testbara har dock dykt upp först under de senaste decennierna.
Många moderna teorier om medvetande fokuserar på de spår som lämnas av hjärnans fina cellulära nätverk från vilka medvetandet uppstår. Idag dominerar två av dem: integrerad informationsteori och neural global arbetsplatsteori.
För tjugofem år sedan hade vi ett argument med den australiensiske filosofen David Chalmers. Jag lovade honom ett fall av gott vin om dessa neurala spår, tekniskt kallade medvetandets neurala korrelat, upptäcktes och tydligt beskrivits i juni 2023.
Men motsättningen mellan integrerad informationsteori och neural global arbetsplatsteori förblir olöst. Detta beror på delvis blandade bevis om vilka områden i hjärnan som är ansvariga för synupplevelse och subjektiv uppfattning av ansikten eller föremål, även om betydelsen av den prefrontala cortex för medveten upplevelse har varit motbevisat. Så jag förlorade vadet och skickade vinet till Chalmers.
Båda dominerande teorierna skapades för att förklara sambandet mellan medvetande och neural aktivitet hos människor och besläktade djur som apor och möss. Och båda teorierna gör fundamentalt olika antaganden om subjektiv upplevelse och kommer till motsatta slutsatser om medvetande i artificiella artefakter. I vilken utsträckning dessa teorier är empiriskt bekräftade eller vederlagda i förhållande till medvetenhet med rötter i hjärnan, har viktiga implikationer för att svara på vår tids olösta fråga: kan maskiner vinna medvetande?
Vad är den nya generationens chatbots?
Innan vi diskuterar detta, låt mig ta dig in i sammanhanget och jämföra en teknik som är medveten med en teknik som bara uppvisar intelligent beteende. Dataingenjörer strävar efter att förse maskiner med den mycket flexibla intelligens som en gång tillät person lämna Afrika och befolka hela planeten. Detta kallas artificiell allmän intelligens (AGI).
Många hävdar att AGI är en avlägsen framtid. De fantastiska framsteg som gjorts inom området artificiell intelligens under det senaste året har överraskat hela världen, inklusive experter. Med tillkomsten av vältaliga konversationsmjukvaruapplikationer, i dagligt tal kallade chatbots, från ett esoteriskt ämne, diskuterats av sci-fi-fans och IT-branschens elit från Silicon Valley, förvandlades diskussioner om AGI till en diskussion till som speglar ett utbrett allmänt missnöje över den existentiella risken för vårt sätt att leva och vårt snäll.
Chatbots är baserade på enorma språkmodeller. De mest kända av dessa är en serie bots som kallas generativa förtränade transformatorer, eller GPT. De skapades av OpenAI i San Francisco. Med tanke på flexibiliteten, läskunnigheten och kompetensen hos den senaste versionen, GPT-4, är det lätt att tro att den har intelligens och personlighet. Till och med hennes konstiga fel, kända som "hallucinationer", passar in i denna teori.
GPT-4 och dess konkurrenter, som LaMDA och Googles Bard, är utbildade på bibliotek med digitaliserade böcker och miljarder allmänt tillgängliga webbsidor. Det geniala med språkmodellen är att den lär sig oövervakad, bearbetar ord för ord och försöker förutsäga det saknade uttrycket. Hon gör detta om och om igen, miljarder gånger, utan ingripande utifrån.
När modellen väl får kunskap genom att inta mänsklighetens digitaliserade register visar användaren en obekant mening – en eller flera. Modellen förutsäger det mest sannolika första ordet, sedan nästa, och så vidare. Denna enkla princip har visat otroliga resultat på engelska, tyska, kinesiska, hindi, koreanska och andra språk, inklusive olika programmeringsspråk.
Vad är skillnaden mellan intellekt och medvetande
Det är betydelsefullt att den framstående uppsatsen om artificiell intelligens, "Computing and Intelligence", skriven av Alan Turing 1950 undvek frågan "Kan maskiner tänka?", det vill säga frågan om de har medvetande. Turing föreslog "imitationsspelet": kan en observatör objektivt skilja utdata som skrivits ut av en människa från utdata som tryckts av en maskin om bådas identiteter är dolda.
Idag är detta känt som Turing-testet, och chatbots är väldigt bra på det, även om de skickligt förnekar det om du frågar dem direkt. Turings strategi började årtionden av obönhörliga framsteg som ledde till skapandet av GPT, men ignorerade problemet.
Implicit i chatbotdebatten är antagandet att artificiell intelligens är detsamma som artificiellt medvetande, att att vara smart är detsamma som att vara medveten. Och även om intelligens och medvetande är sammankopplade hos människor och andra utvecklade organismer, så följer de inte nödvändigtvis alltid med varandra.
Intelligens handlar om att tänka och lära sig att agera och utifrån sig själv och andras handlingar, för att mer exakt förutsäga framtiden och bättre förbereda sig för den. Det spelar ingen roll om det betyder de närmaste sekunderna ("Åh, den bilen rusar mot mig") eller de närmaste åren ("Jag måste lära mig koda"). Intelligens handlar ytterst om handling.
Medvetande, å andra sidan, är förknippat med tillstånd av vara - att se blå himmel, höra fågelsång, känna smärta, vara älskare. Det spelar ingen roll om en utomkontrollerad artificiell intelligens känner av något. Allt som betyder något är att han har ett syfte som inte är relaterat till mänsklighetens långsiktiga välbefinnande. Och det spelar ingen roll om han vet eller inte vad han försöker göra, vilket folk kallar självmedvetenhet. Han kommer "sinnelöst" att sträva efter sitt mål. Så, åtminstone begreppsmässigt, även om vi bygger en AGI kommer det inte att säga oss så mycket om det känns något.
När vi vet allt detta, låt oss återvända till den ursprungliga frågan om hur tekniken kan bli medveten. Låt oss börja med den första av två teorier.
Vilken förklaring erbjuder integrerad informationsteori?
Hon börjar med att artikulera fem axiomatiska egenskaper hos varje tänkbar subjektiv upplevelse. Och ställer sedan frågan om vad en neural krets behöver för att implementera dessa fem egenskaper, slå på vissa neuroner och stänga av andra. Eller, med andra ord, vad behöver ett datorchip för att slå på vissa transistorer och stänga av andra.
Orsak-och-verkan interaktioner inom en krets i ett visst tillstånd eller det faktum att två aktiva nervcell kan slå på eller stänga av en annan neuron, beroende på omständigheterna, kan sättas in i en flerdimensionell kausal struktur. Den är identisk med upplevelsens kvalitet – hur den upplevs, till exempel hur tid och rum upplevs eller hur färger uppfattas.
Erfarenhet har också en mängd associerad med sig – dess integrerade information. Endast en krets med maximalt integrerad information som inte är noll existerar som en helhet och har medvetenhet. Ju mer information som är integrerad, desto mer kan kretsen inte reduceras och desto mindre kan den betraktas som en överlagring av oberoende underkretsar.
Integrerad informationsteori betonar den rika naturen hos mänsklig erfarenhet. Se dig omkring och den fantastiska synliga världen med dess otaliga skillnader och kopplingar kommer att dyka upp framför dig. Eller titta på en målning av Pieter Bruegel den äldre, en flamländsk 1500-talskonstnär som skildrade religiösa ämnen och scener från bondelivet.
Varje system som har samma interna kopplingar och kausala krafter som den mänskliga hjärnan kommer i princip att vara lika medvetet som det mänskliga sinnet. Ett sådant system kan dock inte modelleras. Det måste vara designat eller byggt i hjärnans bild. Moderna digitala datorer är baserade på extremt lös koppling (utgången från en transistor kopplad till ingången på flera transistorer) i Jämförelse med det centrala nervsystemet (neuron från kortikala kolumn tar emot indata och producerar utdata till tiotusentals andra neuroner).
Således kommer moderna datorer, inklusive molndatorer, inte att vara medvetna om någonting, även om de med tiden kommer att kunna göra allt som människor kan göra. Ur denna synvinkel kommer ChatGPT aldrig att kännas speciell. Observera att detta påstående inte har något att göra med det totala antalet komponenter, oavsett om det är neuroner eller transistorer, utan snarare hur de är anslutna. Det är sammankopplingen som bestämmer kretsens övergripande komplexitet och antalet möjliga konfigurationer.
Vilken förklaring erbjuder neural global workspace-teori?
Det kommer från den psykologiska förståelsen att intelligens som en teater där skådespelare uppträder på en liten upplyst scen, vilket är medvetandet. Skådespelarnas agerande bevakas av en publik av processorer som sitter bakom scenen i mörkret.
Scenen är sinnets centrala arbetsyta, som har en liten minneskapacitet för att representera en enda perception, tanke eller minne. Olika bearbetningsmoduler – syn, hörsel, ögon- och lemmotorik, planering, bedömning, språkförståelse och tal – tävlar om tillgång till denna centrala arbetsyta. Vinnaren tränger undan det gamla innehållet, som blir omedvetet.
Enligt neural global workspace-teori är den metaforiska scenen, tillsammans med bearbetningsmoduler, kartlagd i neocortexens arkitektur. Arbetsytan är ett nätverk av kortikala neuroner på framsidan av hjärnan med långdistansprojektioner till liknande neuroner fördelade över neocortex i prefrontala, parietotemporala och cingulate association cortex.
När aktiviteten i sensoriska cortex överstiger en viss tröskel utlöses en global händelse i de kortikala områdena och som ett resultat överförs information till hela arbetsytan. Den globala spridningen av information gör den medveten. Data som inte överförs på detta sätt, såsom ögonens exakta position eller de syntaktiska reglerna för att konstruera läskunniga meningar, kan påverka beteendet, men inte medvetet.
Ur synvinkeln av neural global workspace-teori är erfarenheten mycket begränsad, liknar tanke och abstrakt - liknar den magra beskrivningen som kan hittas i ett museum under en Bruegel-målning: "Scen i inomhus. Bönder i renässanskläder dricker och äter på ett bröllop."
Genom att förstå medvetandet ur perspektivet av integrerad informationsteori, förmedlar konstnären på ett briljant sätt omvärldens fenomenologi på en tvådimensionell duk. I förståelsen av teorin om neurala globala arbetsrum är denna uppenbara rikedom en illusion, ett spöke. Och allt som objektivt kan sägas om det anges i den korta beskrivningen.
Teorin om neurala globala arbetsrum tar till fullo hänsyn till myterna om vår datorålder, enligt vilka allt kan reduceras till beräkningar. Lämpligt programmerade datorsimuleringar av hjärnan, med enorm feedback och något som en central arbetsyta, kommer medvetet att uppfatta världen. Kanske inte nu, men ganska snart.
Vad är den oförenliga skillnaden mellan teorierna?
I allmänna termer är diskussionen följande. Enligt neural global workspace-teori och andra teorier om beräkningsfunktionalism (de se medvetande som en form av beräkning), är medvetande inget annat än en uppsättning smarta algoritmer som körs på en maskin Turing. Funktioner är viktiga för medvetandet hjärnaoch inte dess kausala egenskaper. Om någon avancerad version av GPT accepterar och producerar samma in- och utdatamönster som människor, kommer alla våra inneboende egenskaper att överföras till teknik. Inklusive vår dyrbara skatt – subjektiv upplevelse.
Omvänt, för integrerad informationsteori är medvetandets hjärta intern kausal makt, inte beräkning. Det är inte något eteriskt eller immateriellt. Det bestäms specifikt och funktionellt av i vilken utsträckning systemets förflutna bestämmer dess nutid (kraften av orsaken), och av i vilken utsträckning nuet bestämmer dess framtid (kraften av effekten). Och här är problemet: själva orsak-och-verkan-relationen, förmågan att tvinga ett system att utföra en viss åtgärd, och inte många alternativa, kan inte modelleras. Inte nu, inte i framtiden. Detta bör byggas in i systemet.
Betrakta en datorkod som modellerar fältekvationerna i Einsteins allmänna relativitetsteori, som relaterar massa till rumtidens krökning. Programvaran modellerar den supermassiva exakt svart hål, som ligger i mitten av vår galax. Detta hål utövar ett så starkt gravitationsinflytande på sin omgivning att ingenting, inte ens ljus, kan undgå dess drag.
En astrofysiker som simulerar ett svart hål kommer dock inte att sugas in i en bärbar dator av det simulerade gravitationsfältet. Denna till synes absurda observation belyser skillnaden mellan modell och verklighet: om modellen är helt motsvarar verkligheten, bör rum och tid förvrängas runt den bärbara datorn, vilket skapar ett svart hål som absorberar allt runt om.
Tyngdkraften är förstås ingen beräkning. Den har en kausal kraft som gör att den kan deformera rum-tidens väv och attrahera allt som har massa. Att simulera de kausala krafterna i ett svart hål kräver ett riktigt supertungt föremål, inte bara datorkod. Kausalkraft kan inte modelleras, den måste skapas. Skillnaden mellan verklighet och modell ligger i deras kausala krafter.
Det är därför det inte regnar inuti en dator som simulerar en regnstorm. Programvaran är funktionellt identisk med väder, men den saknar den kausala kraften att släppa ut ånga och förvandla den till vattendroppar. Kausal makt, förmågan att på egen hand skapa eller acceptera förändring, måste byggas in i systemet. Det är möjligt.
En så kallad neuromorf, eller bionisk, dator kan vara lika medveten som en människa. Men detta är inte fallet med standard von Neumann-arkitekturen, som är grunden för alla moderna datorer. Små prototyper av neuromorfa datorer har skapats i laboratorier, till exempel Intels andra generationens Loihi 2 neuromorfa chip. Men en maskin som är tillräckligt sofistikerad för att producera något som liknar mänskligt medvetande, eller åtminstone medvetandet hos en fruktfluga, är fortfarande en ambitiös dröm för en avlägsen framtid.
Observera att denna oförenliga skillnad mellan funktionalistiska och kausala teorier inte har något att göra med vare sig naturlig eller artificiell intelligens. Som jag sa tidigare, intelligens är beteende. Allt som mänsklig uppfinningsrikedom kan producera, inklusive så stora romaner som Octavia Butlers liknelse om såningsmannen och Leo Tolstoys Krig och fred, kan reproducera algoritmisk intelligens om de ges tillräckligt med material för att Träning. Tillkomsten av AGI är ett mål som kan uppnås inom en inte alltför avlägsen framtid.
Debatten handlar inte om artificiell intelligens, utan om artificiell medvetenhet. Och denna debatt kan inte lösas genom att skapa större språkmodeller eller mer avancerade neurala nätverksalgoritmer. För att svara på denna fråga måste vi förstå den enda subjektivitet som vi är helt säkra på: vår egen. När vi har en tydlig förklaring av människan medvetande och dess neurala underlag kommer vi att kunna utöka vår förståelse till smarta tekniker på ett konsekvent, vetenskapsbaserat sätt.
Denna diskussion har liten betydelse för hur chatbots kommer att uppfattas av samhället i stort. Deras språkkunskaper, kunskapsbas och sociala charm kommer snart att bli oklanderliga. De kommer att vara utrustade med perfekt minne, kompetens, balans, resonemang och intelligens. Vissa hävdar till och med att dessa skapelser av stor teknologi kommer att vara nästa steg i evolutionen, Nietzsches "övermänniskor". Jag har en mörkare syn och tror att sådana människor misstar nedgången av vår art för gryningen.
För många, och kanske de flesta, människor i ett alltmer atomiserat samhälle, frånkopplat från naturen och organiserat kring sociala nätverk kommer det att vara känslomässigt svårt att motstå den teknik som lever i telefoner. Och i olika situationer, vanliga och allvarligare, kommer människor att bete sig som om chatbotar har medvetande, de kan verkligen va kär, lida, hoppas och rädsla, även om de inte är något annat än komplexa uppslagstabeller. De kommer att bli oumbärliga för oss, kanske till och med viktigare än verkligt intelligenta varelser. Även om chatbots känner lika mycket som en TV eller en brödrost - ingenting.
Vad mer att läsa om ämnet🤖
- 6 skäl till varför du inte blint ska lita på artificiell intelligens
- Varför vi inte ska vara rädda för att ny teknik ska ta våra jobb
- Teknologisk singularitet: är det sant att tekniken snart kommer att hamna utanför vår kontroll?
- 8 myter om artificiell intelligens som även programmerare tror på