Dirbtinis bendrasis intelektas — trumpas įvadas
Originalus straipsnis: https://cis.temple.edu/~pwang/AGI-Intro.html
[Internete paskelbtas 2007 m., paskutinis atnaujinimas – 2026 m. kovo mėn.]
[Šiame puslapyje pateikiama informacija apie bendrąjį dirbtinį intelektą (AGI), surinkta ir susisteminta mano nuožiūra, nors stengiamasi išvengti asmeninių šališkumų.]
Turinys
1 Nuo AI iki AGI
2 Pagrindiniai AGI klausimai
3 Tipiniai AGI projektai
4 AGI literatūra ir ištekliai
Nuo AI iki AGI
AI: įvairiomis kryptimis ir per sezoninius ciklus
Dirbtinis intelektas (DI) prasidėjo nuo „mąstančios mašinos“ arba „žmogaus protui prilygstančio intelekto“ kaip galutinio tikslo, kaip liudija ši literatūra:
„Proposal of the Dartmouth Meeting“, 1955 m.
„Computers and Thought“, 1963 m.
Praeityje buvo keletas ambicingų projektų, siekusių šio tikslo, tačiau nė vienam iš jų nepavyko jo pasiekti. Geriausiai žinomi pavyzdžiai yra šie:
Iš dalies dėl pripažintos problemos sudėtingumo 1970–1980 m. pagrindinė dirbtinio intelekto kryptis palaipsniui nutolo nuo universalių intelektualiųjų sistemų ir nukreipė dėmesį į konkrečių sričių problemas bei specializuotus sprendimus. Šiam pokyčiui vertinimai yra prieštaringi:
Todėl sritis, šiuo metu vadinama „AI“, susideda iš daugelio laisvai susijusių pakraipų be bendro pagrindo ar struktūros ir kenčia nuo tapatybės krizės:
Naujas pavasaris
Maždaug 2004–2007 m. laikotarpiu vėl ėmė skambėti raginimai tirti universalias sistemas tiek pagrindinės AI srities viduje, tiek už jos ribų. Jubiliejai – puiki proga apžvelgti bendrą šios srities vaizdą:
„AI Magazine“ 26(4), 2005 m. žiema: skirta AAAI ir „AI Magazine“ 25-mečiui
„AI Magazine“ 27(4), 2006 m. žiema: skirtas AI 50-mečiui
„AI@50“: 2006 m. Dartmouth dirbtinio intelekto konferencija: „Kiti penkiasdešimt metų“
Per šias kolekcijas ir renginius daugybė gerbiamų AI tyrėjų pasisakė už grįžimą prie srities pradinio tikslo – „viršūnė vis dar ten!“
Gana atsitiktinai, už pagrindinės dirbtinio intelekto srovės ribų pasirodė keletas knygų su drąsiais pavadinimais ir naujoviškais techniniais metodais, skirtais sukurti visapusišką kompiuterinį intelektą:
Eric Baum, „What is Thought?“ (Kas yra mintis?), 2004 m.
Jeff Hawkins, „On Intelligence“ (Apie intelektą), 2004 m.
Marcus Hutter, „Universal Artificial Intelligence“ (Visuotinis dirbtinis intelektas), 2005 m.
Pei Wang, „Rigid Flexibility: The Logic of Intelligence“ (Kietasis lankstumas: intelekto logika), 2006 m.
Be to, pasirodė keletas mažiau techninių, bet įtakingesnių knygų, kuriose taip pat buvo išreikštas optimizmas dėl galimybės sukurti universalią dirbtinę protą:
Ray Kurzweil, „Singuliarumas artėja: kai žmonės pranoksta biologiją“, 2005 m.
Marvin Minsky, „Jausmų mašina: sveiko proto mąstymas, dirbtinis intelektas ir žmogaus proto ateitis“, 2006 m.
Ben Goertzel, „Paslėptas modelis: modelistinė proto filosofija“, 2006 m.
J. Storrs Hall, „Už AI ribų: mašinos sąžinės kūrimas“, 2007 m.
Taigi po kelių dešimtmečių „universali sistema“, „integruotas AI“ ir „žmogaus lygio AI“ tapo mažiau tabu (nors vis dar toli gražu ne populiariomis) temomis, kaip rodo keli susiję susitikimai:
AGI kaip mokslinių tyrimų sritis
„Bendrojo dirbtinio intelekto“ (AGI) sąvoka buvo įkvėpta psichologine „bendrojo intelekto“ („g faktoriaus“) sąvoka. Nors šis terminas galėjo būti vartojamas ir anksčiau, AGI skirta mokslinių tyrimų sritis prasidėjo nuo knygos „Artificial General Intelligence“, kurią redagavo Ben Goertzel ir Cassio Pennachin. Rinkinio sudarymas prasidėjo 2001 m., o knyga buvo išleista 2006 m. Tais pačiais metais buvo surengtas dirbtinio bendrojo intelekto seminaras, kuriame dalyvavo apie 40 tyrėjų. Nepaisant to, kad šių veiklų dalyviai nesutarė dėl AGI apibrėžimo ir to, kaip jį pasiekti, jie sutiko, kad „intelektas“ turėtų būti tiriamas kaip daugialypė visuma, pritaikoma įvairioms situacijoms. Daugeliui AGI tyrėjų „AGI“ yra tiesiog originalus „AI“, prie kurio pridėta „G“, siekiant jį atskirti nuo konkrečioms problemoms skirtų darbų, kurie nepageidaujamu būdu pasisavino „AI“ etiketę. „AGI“ yra panaši arba susijusi su sąvokomis, tokiomis kaip „stipri AI“, „žmogaus lygio AI“, „visiška AI“, „mąstanti mašina“, „kognityvinė kompiuterija“ ir kai kuriomis kitomis, nors vis dar yra svarbių skirtumų.
Kadangi tuo metu ši perspektyva nebuvo plačiai pripažinta pagrindinėje dirbtinio intelekto bendruomenėje, šie mokslininkai ėmė rengti savo konferencijas (nuo 2008 m.) ir 2009 m. išleido žurnalą. Be to, jie įkūrė specializuotą draugiją. Be konferencijų pranešimų ir žurnalo straipsnių, šio tyrimo dalyviai išleido ir daugiau mokslinių knygų:
Joscha Bach, „Sintetinio intelekto principai (PSI): motyvuoto pažinimo architektūra“, 2009 m.
John Laird, „Soar pažinimo architektūra“, 2012 m.
Pei Wang ir Ben Goertzel (redaktoriai), „Bendrojo dirbtinio intelekto teoriniai pagrindai“, 2012 m.
Pei Wang, „Neaksiominė logika: protingo mąstymo modelis“, 2013 m.
Ben Goertzel ir kt., „Bendrojo intelekto inžinerija“, 1 dalis ir 2 dalis, 2014 m.
Nors ši tyrimų bendruomenė dar nėra susitarusi dėl bendro tikslo ar technologijos, jos skirtumas nuo pagrindinės AI (arba mašininio mokymosi) krypties yra akivaizdus.
Atėjo vasara
Nuo 2012 m. giluminis mokymasis pastaraisiais metais padarė įspūdingą pažangą, o tai vėl žadina daugelio žmonių viltis dėl „žmogaus lygio“ dirbtinio intelekto. Tvirtinimas, kad „Turingo testas buvo išlaikytas“, ir „AlphaGo“ sėkmė stalo žaidime „Go“ vėl atnaujino diskusijas apie tai, kas iš tiesų yra „dirbtinis intelektas“ ir kaip jį pasiekti. Keletas didelių įmonių savo rezultatus pavadino „žingsniais link AGI“, o jų metodai yra arba giluminio mokymosi išplėtimai, arba esamų AI technikų integracijos. Pradedant „ChatGPT“, didieji kalbos modeliai (LLM) rodo stebinančius gebėjimus daugelyje sričių, o kai kurie žmonės tai vadina bendrojo dirbtinio intelekto užuomazgomis. Įtakoti žiniasklaidos ir didžiųjų įmonių, daugelis žmonių laiko „AGI“ ir „LLM“ vienu ir tuo pačiu dalyku, nežinodami kitų AGI interpretacijų, jau nekalbant apie alternatyvius metodus.
Pagrindiniai AGI klausimai
Bendriausi klausimai, į kuriuos turi atsakyti kiekvienas AGI tyrinėtojas, yra šie:
Kas tiksliai yra AGI?
Ar įmanoma sukurti AGI pagal šį apibrėžimą?
Jei AGI yra įmanoma, koks yra labiausiai tikėtinas būdas ją pasiekti?
Net jei žinome, kaip pasiekti AGI, ar tikrai turėtume tai daryti?
[Mano atsakymai į šiuos klausimus pateikti čia, kur terminą „AI“ vartoju jo pirminėje reikšmėje.] Toliau apibendrinami tipiniai atsakymai.
Kas yra AGI
Apskritai tariant, bendrojo dirbtinio intelekto (AGI) tyrimai pasižymi šiomis savybėmis, kurios juos skiria nuo įprastų „AI“ tyrimų:
Akcentuojamas intelekto universalumas, todėl AGI turėtų veikti įvairiose srityse,
Taikomas holistinis arba integruotas požiūris į intelektą, todėl AGI turėtų turėti daug kognityvinių funkcijų (pavyzdžiui, mokymąsi, mąstymą, sprendimų priėmimą, problemų sprendimą, suvokimą, veikimą, bendravimą ir pan.).
AGI projektą paprastai sudaro
Intelekto teorija (aprašyta žmogaus kalba),
Teorijos modelis (aprašytas simboline/matematine kalba),
Modelio kompiuterinis įgyvendinimas (įgyvendintas programine/aparatine įranga).
Nors ir vyrauja bendras sutarimas dėl tikslo kompiuteriuose atkurti „intelektą“ kaip visumą, dabartiniai AGI projektai nėra nukreipti į visiškai tą patį tikslą. Nors kiekvienas AGI metodas semiasi įkvėpimo iš to paties šaltinio, t. y. žmogaus intelekto, „intelekto“ sąvoka yra apibrėžiama skirtingais lygmenimis. Todėl esami AGI projektai, kaip ir AI projektai, siekia atkurti žmogaus intelektą skirtingais aspektais:
Struktūra
Pagrindimas: Intelektą sukuria žmogaus smegenys. Todėl sukurti protingą kompiuterį reiškia kuo tiksliau imituoti smegenų struktūrą. Pagrindas: Neurologija, biologija ir kt. Pavyzdžiai: Hierarchinė laikinė atmintis, aktyvi išvada Iššūkis: Gali būti biologinių detalių, kurių atkurti dirbtinio intelekto sistemose nėra nei įmanoma, nei būtina.
Elgsena
Pagrindimas: Intelektas pasireiškia žmonių elgesyje. Todėl tikslas turėtų būti sukurti kompiuterį, kuris elgtųsi lygiai taip pat kaip žmogus. Pagrindas: psichologija, lingvistika ir kt. Pavyzdžiai: Turingo testas, ChatGPT Iššūkis: gali būti psichologinių ar socialinių veiksnių, kurių neįmanoma ar nebūtina atkurti AI sistemose.
Gebėjimai
Pagrindimas: Intelektas vertinamas pagal gebėjimą spręsti problemas. Todėl intelektuali sistema turėtų gebėti išspręsti tam tikras praktines problemas, kurias šiuo metu gali išspręsti tik žmonės. Pagrindas: Kompiuterinė programa, vadovaujama srities žiniomis Pavyzdžiai: IBM Watson, AlphaGo Iššūkis: Nėra apibrėžiančių intelektą problemų, o specialios paskirties sprendimai neturi bendrumo ir lankstumo.
Funkcija
Pagrindimas: Intelektas siejamas su kognityvinių funkcijų visuma. Todėl siekiama šias funkcijas atkurti kompiuteriuose. Pagrindas: Kompiuterių mokslas Pavyzdžiai: kognityvinė architektūra, Soar Iššūkis: Iki šiol sukurtos AI technologijos yra labai suskaidytos ir nelanksčios, todėl jas sunku suderinti tarpusavyje.
Principas
Pagrindimas: Intelektas yra racionalumo arba optimalumo forma. Todėl intelektuali sistema visada turėtų „elgtis teisingai“ pagal tam tikrus bendruosius principus. Pagrindas: Logika, matematika ir kt. Pavyzdžiai: AIXI, NARS Iššūkis: Intelekte ir pažinime yra per daug aspektų, kad juos būtų galima paaiškinti ir atkurti vienu teoriniu modeliu.
Nuo viršaus iki apačios jie atitinka vis bendresnio lygio žmogaus intelekto apibūdinimus ir siekį atkurti šį apibūdinimą kompiuterinėse sistemose. Kadangi skirtingi apibūdinimai skiriasi detalumu ir aprėptimi, minėti tikslai yra susiję, tačiau vis dėlto labai skiriasi ir vienas kito neapima. Geriausias būdas pasiekti vieną iš jų paprastai nėra tinkamas pasirinkimas kitiems. [Išsamesnę šio klausimo analizę galite rasti čia.]
Ne tik „I“ (angl. „I“) sąvoka AGI kontekste suprantama skirtingai, bet ir „G“ (angl. „G“) yra aiškinama įvairiai, kaip nuoroda į AI sistemas, kurios
„gali išspręsti visas problemas“ — Toks naivus aiškinimas buvo naudojamas kritikuojant šiuos mokslinius tyrimus, nors nė viename AGI tyrime nebuvo siūlomas toks tikslas, o knygoje „Aspects of Artificial General Intelligence“ (Pei Wang ir Ben Goertzel, 2007) aiškiai nurodoma, kad AGI „nereiškia, jog ji gali išspręsti visų rūšių problemas visose srityse, bet kad ji turi potencialą išspręsti bet kokią problemą bet kurioje srityje, turėdama tinkamą patirtį“.
„Gali išspręsti visas žmogaus išsprendžiamas problemas“ — tokia AGI apibrėžtis laiko didelius kalbos modelius (LLM) tinkamu keliu šiam tikslui pasiekti. Šis vartojimas yra intuityvus ir plačiai priimtas, tačiau buvo kritikuojamas kaip antropocentrinis ir bihevioristinis. Net Turingas iškėlė klausimą: „Ar mašinos negali atlikti kažko, kas turėtų būti apibūdinta kaip mąstymas, bet kas labai skiriasi nuo to, ką daro žmogus?“ ir laiko jį „labai rimtu“, nors „jei galima sukonstruoti mašiną, kuri patenkinamai žaistų imitacijos žaidimą, mums nereikėtų jaudintis dėl šio prieštaravimo“. Tačiau dabar yra priežasčių teigti, kad daugelis dabartinių diskusijų apie LLM yra įsišaknijusios būtent šioje AGI interpretacijoje.
„Gali išspręsti visas apskaičiuojamas problemas“ — būtent dėl to tokie modeliai kaip AIXI laikomi bendrąja dirbtine intelekto forma (AGI). Tokios interpretacijos privalumas yra jos tikslumas (visiškai formalizuota), tačiau ji kritikuojama kaip nereali (pavyzdžiui, AIXI nėra apskaičiuojamas).
„Gali bandyti išspręsti visas pavaizduojamas problemas“ — būtent dėl to modeliai, tokie kaip NARS, laikomi AGI. Tokią interpretaciją patvirtina kognityvinės mokslo įrodymai, tačiau ji kritikuojama kaip neaiški (ne visiškai formalizuota) ir neintuityvi (skiriasi nuo žmogaus elgesio ir gebėjimų).
Kadangi kiekvienas „AGI“ aiškinimas (išskyrus naivųjį) turi savo teorinę ir praktinę vertę, jie negali vienas kito pakeisti, nors tam tikromis aplinkybėmis juos galima lyginti ir derinti. Priešingai nei visuomenėje vyrauja nuomonė, AGI nėra sinonimas LLM, kaip matyti iš publikacijų kasmetinėse AGI konferencijose ir žurnale „Journal of AGI“, taip pat iš naujausių žurnalistinių straipsnių (1, 2). Kita vertus, kai kurie mokslininkai mano, kad „neapibrėžtumas yra bruožas, o ne trūkumas“, ir teigia, kad AGI jau pasiekta.
Apribojimai ir vertinimai
Nuo pat dirbtinio intelekto arba „mąstančios mašinos“ idėjos atsiradimo buvo išsakyta įvairių prieštaravimų dėl jos įgyvendinamumo. Kai kurie teigė įrodę, kad „žmogiškajam protui“ – ar kaip jį dar vadintume – dėl tam tikrų esminių apribojimų kompiuteriuose atsirasti teoriškai neįmanoma. Daugelis tyrėjų prieštaravo šiems teiginiams, o tipiškus argumentus galima rasti šiose knygose:
„Kompiuterinė technika ir intelektas“, Alan M. Turing
„Gödel, Escher, Bach: Amžina auksinė pynė“, Douglas R. Hofstadter
Akivaizdu, kad visi AGI tyrėjai tiki, jog AGI galima sukurti (nors jie skirtingai interpretuoja šį terminą). „AGI 2006 Workshop Proceedings“ įvadiniame skyriuje Pei Wang ir Ben Goertzel atsakė į šias dažnai kylančias abejones ir prieštaravimus dėl šių tyrimų:
AGI neįmanoma.
Nėra tokio dalyko kaip bendrasis intelektas.
Bendrosios paskirties sistemos nėra tokios geros kaip specialiosios paskirties sistemos.
AGI jau yra įtraukta į dabartinę AI.
Dar per anksti dirbti su AGI.
AGI yra tik reklaminis triukas.
AGI tyrimai nėra vaisingi.
AGI yra pavojinga.
Kai kurios abejonės dėl AGI įgyvendinamumo kyla dėl klaidingų įsivaizdavimų apie tai, ko siekiama kuriant AGI arba ką gali kompiuteriai. Ankstesniame poskyryje buvo išaiškintas pirmasis klausimas, o antrojo klausimo analizę galima rasti čia.
Daugelis tyrėjų „intelektą“ laiko laipsnio klausimu. Todėl reikšmingas klausimas tyrimams yra ne „Ar AGI įmanoma?“, o „Kaip reikėtų matuoti kompiuterinės sistemos intelektą?“. Akivaizdu, kad skirtingi AGI apibrėžimai lems skirtingus vertinimo kriterijus ir matavimus, o keletą tipiškų pasiūlymų galima rasti šiuose šaltiniuose:
Specialiosios sesijos apie vertinimą konferencijose AGI-2009 ir AGI-2010
I-athlon: Toward a Multidimensional Turing Test, Sam S. Adams et al., 2016
The Measure of All Minds: Evaluating Natural and Artificial Intelligence, José Hernández-Orallo, 2017
On the Measure of Intelligence, François Chollet, 2019
Kadangi šiuo klausimu nėra bendro sutarimo, teiginiai, pavyzdžiui, „AGI pasiekta“ (arba tai įvyks tam tikrais metais), yra tik asmeninės nuomonės. Tvirtinimas „AGI sistema S turi X gebėjimą“ dažnai reiškia konkretaus X atvejo demonstravimą, o ne visuotinį įgūdžių įsisavinimą daugumoje ar visuose X atvejais.
Strategijos ir metodai
Skirtingi tikslai, kuriuos vienija pavadinimas „AGI“, reikalauja skirtingų tyrimų strategijų ir remiasi skirtingais metodais. Pavyzdžiui, šie planai sutampa tik iš dalies:
„Nuo NARS iki mąstančios mašinos“ (2006 m.)
„Alberta AI tyrimų planas“ (2023 m.)
Kaip bendra strategija, buvo pasirinkti trys keliai:
Hibridinis
požiūris: pirmiausia sukurti atskiras funkcijas (naudojant skirtingas teorijas ir metodus), o tada jas sujungti. Argumentas: (AA)AI: Daugiau nei dalių suma, Ronald Brachman Sunkumas: teorijų ir metodų suderinamumas
Integruotas
požiūris: pirmiausia suprojektuoti architektūrą, o tada atitinkamai suprojektuoti jos modulius (naudojant įvairius metodus). Argumentas: „You can't play 20 questions with nature and win“, Allen Newell Sunkumas: kognityvinių funkcijų izoliacija, specifikacija ir koordinavimas
Vieningas
požiūris: naudoti vieną techniką, pradedant nuo pagrindinės sistemos, o vėliau ją palaipsniui plėsti ir papildyti. Argumentas: „Toward a Unified Artificial Intelligence“, Pei Wang Sunkumas: pagrindinės technikos universalumas ir išplėtimo galimybės
Kūrimo strategijos pasirinkimas iš dalies priklauso nuo tyrimo tikslo pasirinkimo ir taip pat daro įtaką konkrečioms naudojamoms technikoms. Šiuo metu pagrindinės AGI projektuose naudojamos technikos apima, bet neapsiriboja:
dirbtinį neuroninį tinklą
kognityvinę architektūrą
evoliucinę kompiuteriją
grafų algoritmus
euristinę paiešką
žinių bazę
mokymosi algoritmą
loginį mąstymą
daugiaagentę sistemą
gamybos sistemą
robotiką
stochastinį modelį
Nors kiekviena iš šių technikų taip pat tiriamas ir tradicinėje AI, jos naudojimas universaliose sistemose lemia labai skirtingus projektavimo sprendimus techninių detalių atžvilgiu.
Bendrosios dirbtinio intelekto (AGI) etika
Net jei sužinojome, kaip sukurti AGI, tai nebūtinai reiškia, kad tikrai norime tai padaryti. Kaip ir visi svarbiausi moksliniai atradimai bei techniniai proveržiai, AGI gali iš esmės pakeisti mūsų gyvenimą ir netgi žmonijos likimą – tiek pageidaujamu, tiek nepageidaujamu būdu, arba, kaip dažniausiai būna, abiejų šių aspektų deriniu.
Iš dalies dėl giluminio mokymosi pažangos vis daugiau žmonių susirūpinę dėl AGI (ar kaip ji bebūtų vadinama) keliamos rizikos ir saugumo, kaip matyti iš šių šaltinių:
„Superintelekto keliai, pavojai ir strategijos“, Nick Bostrom, 2014 m.
„Sustabdykite didžiųjų AI eksperimentų vykdymą: atviras laiškas“, „Future of Life Institute“, 2023 m.
AGI tyrėjai supranta savo atsakomybę šiuo klausimu, nors dauguma jų mano, kad, remiantis šiuo metu turimais įrodymais, pažanga AGI tyrimų srityje bus naudinga žmonijai, o ne ją sunaikins. Diskusijos apie tai, kaip padaryti AGI „saugią“, vyko AGI susitikimuose nuo pat pradžių. Pavyzdinės diskusijos apima
AGI-08 surengė seminarą tema „Dirbtinio bendrojo intelekto sociokultūrinės, etinės ir futurologinės pasekmės“
AGI-12 renginį bendrai rėmė Oksfordo Žmogaus ateities institutas. Šioje konferencijoje daugelyje pranešimų buvo nagrinėjami etiniai ir moraliniai klausimai
Žinoma, daug svarbių problemų lieka neišspręstų, tačiau norint rasti jų sprendimus, AGI tyrimai turėtų būti spartinami, o ne lėtinami. Kartoju, kai kurios plačiai paplitusios nuogąstavimai ir baimės dėl AGI yra pagrįstos klaidingais įsitikinimais apie AGI pobūdį.
Tipiniai AGI projektai
Toliau pateikiami projektai atrinkti kaip dabartinių AGI tyrimų pavyzdžiai, nes apie kiekvieną iš jų galima pasakyti, kad
Jis aiškiai orientuotas į AGI (todėl IBM „Watson“ ir „DeepMind“ „AlphaGo“ neįtraukti),
Jis vis dar labai aktyvus (todėl Brooks „Cog“ ir Pollock „OSCAR“ nebeįtraukti),
Apie jo technines detales yra daug publikacijų (todėl daugelis naujausių AGI projektų dar neįtraukti).
Įvairūs dideli kalbos modeliai yra pakankamai panašūs šiame aprašymo lygmenyje, todėl juos atstovauja „ChatGPT“. Projektai išvardyti abėcėlės tvarka. Kiekvieno projekto pavadinimas yra susietas su projekto tinklalapiu, iš kurio paimtos šios citatos. Citatos daugiausia dėmesio skiria mokslinių tyrimų tikslui (1-asis klausimas) ir techniniam keliui (3-iasis klausimas). Pasirinkta po dvi publikacijas apie projektą, paprastai viena trumpa įžanga ir vienas išsamus aprašymas.
ACT-R [Integruota proto teorija; Minties atominiai komponentai] ACT-R yra kognityvinė architektūra: teorija, skirta žmogaus pažinimo procesams imituoti ir suprasti. Mokslininkai, dirbantys su ACT-R, siekia suprasti, kaip žmonės organizuoja žinias ir elgiasi protingai. Tyrimams tęsiantis, ACT-R vis labiau artėja prie sistemos, galinčios atlikti visą spektrą žmogaus pažinimo užduočių: labai detaliai atspindėti, kaip mes suvokiame pasaulį, apie jį mąstome ir jame elgiamės.
Iš išorės ACT-R atrodo kaip programavimo kalba; tačiau jos konstrukcijos atspindi prielaidas apie žmogaus pažinimą. Šios prielaidos pagrįstos daugybe faktų, gautų iš psichologinių eksperimentų. Kaip ir programavimo kalba, ACT-R yra struktūra: skirtingoms užduotims (pvz., Hanojaus bokštas, teksto ar žodžių sąrašo atmintis, kalbos supratimas, komunikacija, orlaivių valdymas) mokslininkai kuria modelius (dar vadinamus programomis), kurie yra parašyti ACT-R ir kurie, be ACT-R požiūrio į pažinimą, įtraukia savo prielaidas apie konkrečią užduotį. Šias prielaidas galima patikrinti lyginant modelio rezultatus su žmonių, atliekančių tas pačias užduotis, rezultatais.
ACT-R yra hibridinė kognityvinė architektūra. Jos simbolinė struktūra yra gamybos sistema; subsimbolinę struktūrą sudaro daugybės lygiagrečių procesų rinkinys, kurį galima apibendrinti keletu matematinių lygčių. Subsimbolinės lygčių valdo daugelį simbolinių procesų. Pavyzdžiui, jei keli gamybos procesai atitinka buferių būseną, subsimbolinė naudingumo lygtis įvertina su kiekvienu gamybos procesu susijusias santykines sąnaudas ir naudą ir nusprendžia vykdyti gamybos procesą, kurio naudingumas yra didžiausias. Panašiai, ar (ir kaip greitai) faktas gali būti išgautas iš deklaratyviosios atminties, priklauso nuo subsimbolinių išgavimo lygčių, kurios atsižvelgia į kontekstą ir to fakto naudojimo istoriją. Subsimboliniai mechanizmai taip pat yra atsakingi už daugumą mokymosi procesų ACT-R.
AERA [Anytime Bounded Rationality; Autocatalytic Endogenous Reflective Architecture] AERA – tai kognityvinė architektūra ir projektas, skirtas kurti agentus, pasižyminčius aukštu veiklos autonomijos lygiu, pradedant tik nuo nedidelio kiekio kūrėjo nurodyto kodo – sėklos. Naudodama vertybėmis grindžiamą dinaminį prioritetų planavimą, skirtą kontroliuoti didelio skaičiaus samprotavimų lygiagretų vykdymą, sistema kaupia vis naudingesnius savo patirties modelius, o tai lemia rekursyvų savęs tobulinimą, kuris gali būti savarankiškai palaikomas po to, kai mašina palieka laboratoriją, neperžengiant jos kūrėjų nustatytų ribų.
AERA demonstruoja nuo srities nepriklausomą, savarankiškai prižiūrimą sudėtingų užduočių kaupiamąjį mokymąsi. Skirtingai nuo šiuolaikinių AI sistemų, AERA pagrįsti agentai puikiai susidoroja su naujovėmis – situacijomis, informacija, duomenimis, užduotimis – kurių jų programuotojai negalėjo numatyti. Tai vienintelė egzistuojanti įgyvendinama / įgyvendinta sistema, skirta ribotam rekursyviam savęs tobulinimui pasiekti.
AERA pagrįsti agentai kaupiasi patirtį, sąveikaujant su pasauliu ir generuodami kompozicinius priežastinių ryšių mikro-modelius savo patirties. Naudodami neaksiomatinę abdukciją ir dedukciją, jie nuolat prognozuoja, kaip pasiekti savo aktyvius tikslus ir kas gali nutikti ateityje, generuodami lanksčią, oportunistiškai pertraukiamą veiksmų planą.
AIXI [Visuotinis algoritminis intelektas: matematinis „iš viršaus į apačią“ metodas; visuotinis dirbtinis intelektas] Svarbi išvada yra ta, kad daugumą, jei ne visus žinomus intelekto aspektus galima apibūdinti kaip orientuotus į tikslą arba, tiksliau sakant, kaip tam tikros naudingumo funkcijos maksimizavimą.
Sekcinė sprendimų teorija formaliai išsprendžia racionalių agentų problemą neapibrėžtame pasaulyje, jei žinomas tikrasis aplinkos a priori tikimybių pasiskirstymas. Solomonoffo visuotinės indukcijos teorija formaliai išsprendžia sekos prognozavimo problemą, kai nežinomas a priori pasiskirstymas. Mes sujungiame abi idėjas ir gauname parametrų neturinčią visuotinio dirbtinio intelekto teoriją. Mes pateikiame tvirtus argumentus, kad gautas AIXI modelis yra protingiausias įmanomas nešališkas agentas.
Pagrindinis AIXI modelio trūkumas yra tai, kad jis yra neapskaičiuojamas, ... o tai daro jo įgyvendinimą neįmanomu. Siekdami įveikti šią problemą, sukūrėme modifikuotą modelį AIXItl, kuris vis dar yra efektyviai protingesnis už bet kurį kitą laiko t ir ilgio l ribotą algoritmą.
ChatGPT [GPT-4 techninė ataskaita; Bendrosios dirbtinio intelekto užuomazgos] Mes sukūrėme GPT-4 – naujausią „OpenAI“ žingsnį giluminio mokymosi plėtros srityje. GPT-4 yra didelio masto multimodalinis modelis (priimantis vaizdų ir teksto įvestis bei generuojantis teksto išvestis), kuris, nors daugelyje realių situacijų ir yra mažiau pajėgus nei žmogus, įvairiuose profesiniuose ir akademiniuose testuose pasiekia žmogaus lygio rezultatus.
Atsižvelgdami į GPT-4 gebėjimų universalumą, daugybę įvairiose srityse pasireiškiančių sugebėjimų ir jo našumą atliekant įvairias užduotis, prilygstantį žmogaus lygiui ar jį viršijantį, drąsiai galime teigti, kad GPT-4 yra svarbus žingsnis link AGI.
Cyc [Cyc: didelio masto investicija į žinių infrastruktūrą; didelių žiniomis pagrįstų sistemų kūrimas] Norint sukurti bendrąją dirbtinio intelekto sistemą, reikėtų užkoduoti milžinišką kiekį bendrojo žinojimo, atspindinčio žmonių bendrą realybės suvokimą. Siekdamas imituoti žmogaus mąstymą, Cyc turėtų turėti žinių apie mokslą, visuomenę ir kultūrą, klimatą ir orą, pinigus ir finansų sistemas, sveikatos priežiūrą, istoriją, politiką bei daugelį kitų žmogaus patirties sričių. Cyc projekto komanda planavo užkoduoti mažiausiai milijoną faktų, apimančių šias ir daugelį kitų temų sričių.
„Cyc“ žinių bazė (KB) yra formalizuotas milžiniško kiekio pagrindinių žmogiškųjų žinių atvaizdavimas: faktai, praktinės taisyklės ir euristika, skirta mąstyti apie kasdienio gyvenimo objektus ir įvykius. Atvaizdavimo priemonė yra formalioji kalba „CycL“. Žinių bazę sudaro terminai, kurie sudaro „CycL“ žodyną, ir teiginiai, siejantys tuos terminus. Šie teiginiai apima tiek paprastus pagrindinius teiginius, tiek taisykles.
HTM [Hierarchinė laiko atmintis; „Apie intelektą“] Kiekvieno „Grok“ modelio šerdį sudaro „Cortical Learning Algorithm“ (CLA) – išsamus ir realistiškas neokorteksą sudarančių ląstelių sluoksnio modelis. Priešingai nei paprastai manoma, neokorteksas nėra skaičiavimo sistema, o atminties sistema. Gimimo metu neokorteksas turi struktūrą, bet praktiškai neturi jokios žinių. Jūs pažįstate pasaulį, kurdami jo modelius iš jutiminės informacijos srautų. Remdamiesi šiais modeliais, mes darome prognozes, aptinkame anomalijas ir imamės veiksmų.
Kitaip tariant, smegenis geriausiai galima apibūdinti kaip prognozavimo modeliavimo sistemą, kuri prognozes paverčia veiksmais. Toliau aprašomi trys pagrindiniai neokorteksų veikimo principai: retos paskirstytos reprezentacijos, sekos atmintis ir mokymasis realiuoju laiku.
LIDA [LIDA architektūra; LIDA vadovas] Įgyvendindamas ir išplėtojant daugelį psichologinių ir neurobiologinių pažinimo teorijų, LIDA konceptualusis modelis siekia tapti kognityvine „visko teorija“. Turėdamas modulius ar procesus, skirtus suvokimui, darbiniai atminties, epizodiniams prisiminimams, „sąmonei“, procedūrinei atminties, veiksmų pasirinkimui, suvokimo mokymuisi, epizodiniam mokymuisi, apmąstymui, valiai ir nekasdienio problemų sprendimo, LIDA modelis idealiai tinka sukurti veikiančią ontologiją, kuri leistų aptarti, kurti ir lyginti AGI sistemas. LIDA technologija pagrįsta LIDA pažinimo ciklu, savotišku „pažinimo atomu“. Kiekviename pažinimo cikle vaidmenį atlieka elementaresni pažinimo moduliai. Aukštesnio lygio procesai vykdomi per kelis ciklus.
LIDA architektūra vaizduoja suvokimo vienetus, objektus, kategorijas, santykius ir pan., naudodama mazgus ir sąsajas.... Tai suvokimo simboliai, veikiantys kaip bendra informacijos valiuta įvairiuose LIDA architektūros moduliuose.
MicroPsi [„MicroPsi“ agentų architektūra; sintetinės inteligencijos principai] „MicroPsi“ agentų architektūra apibūdina situacinių agentų emocijų, motyvacijos ir pažinimo sąveiką, daugiausia remiantis Dietricho Dornerio „Psi“ teorija. „Psi“ teorija nagrinėja emocijas, suvokimą, reprezentaciją ir ribotą racionalumą, tačiau, kadangi ji suformuluota psichologijos srityje, ji turėjo palyginti mažą įtaką diskusijoms apie agentus informatikos srityje. MicroPsi yra originalios teorijos suformulavimas abstrakčiau ir formaliau, tuo pačiu ją papildant papildomomis sąvokomis, susijusiomis su atmintimi, ontologinių kategorijų kūrimu ir dėmesiu.
Agentų sistema naudoja semantinius tinklus, vadinamus mazgų tinklais, kurie yra vieningas valdymo struktūrų, planų, jutimo ir veiksmų schemų, Bayeso tinklų ir neuroninių tinklų atvaizdavimas. Taigi toje pačioje sistemoje galima sukurti įvairių tipų agentus.
NARS [Intelektas: nuo apibrėžimo iki projektavimo; „Kietasis lankstumas“: intelekto logika] NARS nuo įprastų mąstymo sistemų skiria gebėjimas mokytis iš patirties ir veikti turint nepakankamai žinių bei išteklių. NARS siekia vienodai paaiškinti ir atkurti daugelį pažinimo procesų, įskaitant mąstymą, mokymąsi, planavimą ir kt., kad būtų sukurta vieninga teorija, modelis ir sistema visai dirbtiniam intelektui. Galutinis šio tyrimo tikslas – sukurti mąstančią mašiną.
NARS kūrimas vyksta laipsniškai, susidedant iš keturių pagrindinių etapų. Kiekviename etape logika plečiama, kad sistema įgytų išraiškingesnę kalbą, turtingesnę semantiką ir didesnį išvadų darymo taisyklių rinkinį; tada atitinkamai pritaikoma atmintis ir valdymo mechanizmas, kad palaikytų naują logiką.
NARS sistemoje „mąstymo“ sąvoka išplečiama, kad atspindėtų sistemos gebėjimą prognozuoti ateitį remiantis praeitimi ir patenkinti neribotus išteklių poreikius naudojant ribotą išteklių pasiūlą, lanksčiai derinant pagrįstus mikrožingsnius į makroelgesį nepriklausomai nuo srities.
OpenCog [Bendroji bendrojo intelekto teorija: pragmatiška modelių teorijos perspektyva; Bendrojo intelekto kūrimas, 1 dalis ir 2 dalis] „OpenCog“, kaip programinės įrangos platforma, siekia suteikti mokslininkams ir programinės įrangos kūrėjams bendrą platformą, skirtą dirbtinio intelekto programų kūrimui ir dalijimuisi jomis. Ilgalaikis „OpenCog“ tikslas – paspartinti naudingo bendrojo dirbtinio intelekto (AGI) kūrimą.
OpenCogPrime yra konkretus AGI projektas, kuriamas OpenCog platformoje. Jis turi gana detalų, išsamų projektą, apimantį visus intelekto aspektus. Hipotezė yra tokia: jei šis projektas bus visiškai įgyvendintas ir išbandytas pakankamo dydžio paskirstytame tinkle, rezultatas bus AGI sistema su bendruoju intelektu, prilygstančiu žmogaus lygiui, o galiausiai ir jį pranokstančiu.
Nors „OpenCogPrime“ pagrįsta AGI sistema galėtų atlikti daugybę užduočių, iš pradžių mes sutelkiame dėmesį į „OpenCogPrime“ naudojimą paprastų virtualių agentų valdymui virtualiuose pasauliuose. Taip pat eksperimentuojame su jos naudojimu humanoidinio roboto „Nao“ valdymui. Pavyzdinius vaizdo įrašus galite rasti adresu http://novamente.net/example.
Sigma [Išvados, gautos pritaikius Sigma prie standartinio proto modelio; Sigma kognityvinė architektūra ir sistema] Šio projekto tikslas – sukurti pakankamai veiksmingą, funkcionaliai elegantišką, bendro pobūdžio kognityvinę, didžiąją suvienodintą kognityvinę architektūrą, skirtą virtualių žmonių (ir, tikimasi, protingų agentų bei robotų – o galbūt net ir naujos formos suvienodintos žmogaus pažinimo teorijos) palaikymui.
Mūsų dėmesys sutelktas į Sigma (∑) architektūros kūrimą, kuri tiria grafinės architektūros hipotezę, kad pažanga šiuo metu priklauso nuo to, kaip suderinti tai, kas buvo išmoko per tris dešimtmečius nepriklausomo kognityvinių architektūrų ir grafinių modelių kūrimo, plačiai taikomo moderniausio formalizmo, skirto protingų mechanizmų konstravimui. Rezultatas – hibridinis (diskretinis + nuolatinis) mišrus (simbolinis + tikimybinis) požiūris, kuris davė pirmuosius rezultatus atminties ir mokymosi, problemų sprendimo ir sprendimų priėmimo, vaizduotės ir suvokimo, kalbos ir natūralios kalbos, emocijų ir dėmesio srityse.
SNePS [GLAIR kognityvinė architektūra; SNePS vadovas] Ilgalaikis SNePS tyrimų grupės tikslas – suprasti pažangių kognityvinių procesų prigimtį, kuriant ir eksperimentuojant su kompiuteriniais kognityviniais agentais, kurie sugeba naudoti ir suprasti natūralią kalbą, mąstyti, veikti ir spręsti problemas įvairiose srityse.
SNePS žinių pateikimo, mąstymo ir veikimo sistema turi keletą savybių, kurios palengvina metakogniciją SNePS pagrindu veikiančiuose agentuose. Labiausiai išsiskirianti yra tai, kad teiginiai SNePS pateikiami kaip terminai, o ne kaip loginiai sakiniai. Dėl to teiginiai gali be apribojimų pasirodyti kaip teiginių, veiksmų ir politikos argumentai, neišeinant iš pirmosios eilės logikos.
Soar [Įvadas į „Soar“; „Soar“ pažinimo architektūra]
Aukščiausias intelekto lygis būtų visiškas racionalumas, kuris reikštų gebėjimą panaudoti visas turimas žinias kiekvienai užduočiai, su kuria susiduria sistema. Deja, atitinkamų žinių paieškos sudėtingumas daro šį tikslą nepasiekiamą, nes žinių kiekis didėja, užduotys tampa vis įvairesnės, o reikalavimai sistemos reakcijos laikui – vis griežtesni. Geriausia, ką šiuo metu galima pasiekti, yra visiško racionalumo apytikslė versija. „Soar“ dizainą galima laikyti vienos tokios apytikslės versijos tyrimu.
Daugelį metų antrinis principas buvo tas, kad skirtingų architektūrinių mechanizmų skaičius turėtų būti sumažintas iki minimumo. „Soar 8“ sistemoje buvo naudojamas vienas bendras visų užduočių ir užduočių dalių (problemų erdvių) modelis, vienas nuolatinės žinios (produkcijų) atvaizdavimas, vienas laikinos žinios (objektų su atributais ir reikšmėmis) atvaizdavimas, vienas tikslų generavimo mechanizmas (automatinis dalinių tikslų nustatymas) ir vienas mokymosi mechanizmas (fragmentavimas). Mes persvarstėme šią prielaidą, nes siekiame užtikrinti, kad visos turimos žinios būtų užfiksuotos vykdymo metu, netrikdant užduočių vykdymo. Tai veda prie kelių mokymosi mechanizmų (fragmentavimo, stiprinamojo mokymosi, epizodinio mokymosi ir semantinio mokymosi) ir kelių ilgalaikių žinių atvaizdų (procedūrinių žinių produkcijos, semantinės atminties ir epizodinės atminties).
Dar du principai, kuriais vadovaujamasi kuriant „Soar“, yra funkcionalumas ir našumas. Funkcionalumas reiškia, kad „Soar“ turi visas pagrindines galimybes, reikalingas visam žmonių naudojamų kognityvinių gebėjimų rinkiniui realizuoti, įskaitant, bet neapsiribojant, reaktyvų sprendimų priėmimą, situacijos suvokimą, apgalvotą mąstymą ir supratimą, planavimą bei visas mokymosi formas. Našumas reiškia, kad „Soar“ turi skaičiavimo požiūriu efektyvius algoritmus, skirtus pagrindinėms operacijoms atlikti – nuo žinių paieškos ilgalaikėje atmintyje iki sprendimų priėmimo, naujų žinių įgijimo ir saugojimo.
Apytikslė klasifikacija
Pirmiau minėti AGI projektai apytikriai suskirstyti į kategorijas toliau pateiktoje lentelėje, atsižvelgiant į jų atsakymų pobūdį į anksčiau išvardytus 1-ąjį klausimą (dėl mokslinių tyrimų tikslo) ir 3-ąjį klausimą (dėl techninio kelio).
tikslas \ kelias | hibridinis | integruotas | vieningas |
principas | AERA, AIXI, NARS | ||
funkcija | OpenCog, Sigma, Soar | SNePS | |
galimybė | Cyc | ||
elgesys | ACT-R, LIDA, MicroPsi | ChatGPT | |
struktūra | HTM |
Kadangi šis suskirstymas yra bendro pobūdžio, toje pačioje lentelės eilutėje nurodyti projektai vis dėlto gerokai skiriasi savo mokslinių tikslų ir techninių sprendimų detalėmis.
Apibendrinant galima pasakyti, kad dabartiniai AGI projektai remiasi labai skirtingomis teorijomis ir metodais.
AGI literatūra ir ištekliai
[Toliau pateikiama informacija daugiausia susijusi su 2006–2008 m. susiformavusia AGI bendruomene, kurią koordinavo Bendrojo dirbtinio intelekto draugija (AGIS).] AGI tyrimų rinkiniai:
Pirmasis AGI darbų rinkinys yra „Bendrasis dirbtinis intelektas“ (Artificial General Intelligence). Nors ši knyga buvo išleista 2006 m., rankraštis buvo baigtas 2003 m.
„Advances in Artificial General Intelligence: Concepts, Architectures and Algorithms“ yra 2006 m. AGI dirbtuvės konferencijos medžiaga. Įvadiniame skyriuje „Aspects of Artificial General Intelligence“ paaiškinta AGI sąvoka ir apibendrinti kiti skyriai.
„Theoretical Foundations of Artificial General Intelligence“ yra rinkinys, kurį kartu parašė aktyvūs AGI tyrėjai. Kiekviename skyriuje nagrinėjama AGI teorinė tema, o tekstas parašytas ne techniniu stiliumi, kad informacija būtų prieinama ir skaitytojams, kurie nėra AGI tyrėjai.
„Between Ape and Artilect: Conversations with Pioneers of Artificial General Intelligence and Other Transformative Technologies“ yra keletas interviu su AGI tyrėjais.
Kasmetinė tarptautinė AGI konferencijų serija pradėta rengti 2008 m. Konferencijų tinklalapiuose pateikiamos nuorodos į visus priimtus straipsnius, taip pat į papildomą medžiagą, pavyzdžiui, pristatymų failus ir vaizdo įrašus.
„Journal of Artificial General Intelligence“ (JAGI) – tai recenzuojamas atviros prieigos žurnalas, leidžiamas nuo 2009 m.
AGI ar susijusiems tyrimams skirti komunikacijos kanalai ir socialiniai tinklai:
„Facebook“: „Artificial General Intelligence (AGI/ASI)“, „Real AGI“, „Artificial General Intelligence“, „Artificial Cognition“
„LinkedIn“: „Cognitive Computation“
„Google Group“: „AGI group“
„Listbox“: AGI pašto sąrašas
Mokymo medžiaga studentams:
„Rekomenduojamas išsilavinimas būsimiems AGI tyrėjams“, autorius Pei Wang
„AGI mokymo programos apžvalga“, autorius Ben Goertzel
„Rekomendacijos dėl dirbtinio intelekto“, autorius Marcus Hutter
Kiti AGI ištekliai:
AGIS išteklių puslapis
„Dirbtinis bendrasis intelektas“ Vikipedijoje
„Dirbtinis bendrasis intelektas“ Scholarpedia