Kaip toli mes nuo bendro dirbtinio intelekto

Šiandien dirbtinis bendrasis intelektas (AGI) tapo pagrindiniu raktiniu žodžiu tiek mokslo, tiek pramonės bendruomenėse. Vos prieš kelerius metus daugelis manė, kad AGI pasiekti prireiks mažiausiai 10–50 metų, arba net manė, kad tai neįmanoma. Šiais laikais tokių pesimistinių požiūrių pasitaiko retai. Tačiau, palyginti su visuomenės susijaudinimu dėl šios technologinių pokyčių bangos, daugelis pirmaujančių AI srities mokslininkų ir pramonės lyderių mano, kad dar reikia daug nuveikti, kad dabartinis AI išsivystytų į AGI.

Pasak Qi Yuano, žymaus Fudano universiteto profesoriaus, Šanchajaus dirbtinio intelekto tyrimų instituto (SAIRI) direktoriaus ir patikimos didelių modelių kompanijos „Infinite Lightyear“ įkūrėjo, „Viena iš aukščiausių AGI apraiškų yra nežinomo atradimas. Paprasčiau tariant, tai turėtų būti „AI Einšteinas“. Tam reikia sukurti „pilkosios dėžės“ patikimus didelius modelius, kuriuose „juodosios dėžės“ tikimybinės prognozės būtų derinamos su „baltosios dėžės“ loginiais samprotavimais, ir tokiu būdu giliai integruojant technologijas ir pramonę skatinti fundamentinius tyrimus, talentų ugdymą ir praktinį pritaikymą kuriant naujovišką mokslinės žvalgybos ekosistemą.

Neseniai vykusioje 2024 m. Pasaulinėje dirbtinio intelekto konferencijoje (WAIC) ir Pasauliniame dirbtinio intelekto valdymo aukšto lygio susitikime SAIRI sėkmingai surengė teminį forumą pavadinimu „Dirbtinis intelektas: mokslo tyrimų ir pramonės plėtros paradigmos pokytis“. Tai buvo pirmasis šios naujos tyrimų institucijos pasirodymas WAIC. SAIRI galima laikyti pavyzdžiu Šanchajuje tyrinėjant naujovėmis pagrįstą „1+1+N“ mokslinės žvalgybos ekosistemą. Šis modelis apima SAIRI kaip centrinį centrą, atsakingą už bendrą strateginį planavimą, išteklių integravimą ir pagrindinius technologijų tyrimus bei inovacijas, bendradarbiaujant su kitu „1“ Fudano universitetu ir keliais „N“ universitetais, mokslinių tyrimų institucijomis, technologijų įmonėmis, inovacijų komandomis, ir investicines institucijas, bendrai skatinti mokslinius tyrimus, talentų ugdymą, technologijų perdavimą ir pramonės naujoves bei modernizavimą.

AGI standartas turėtų būti sukurti „AI Einšteiną“.

Žvelgiant iš techninės perspektyvos, ar vis didesni modeliai su daugiau parametrų sukurs AGI? Iki šiol, nei iš pačios AI technologijos, nei iš energijos suvartojimo perspektyvos, didelių modelių, pagrįstų autoregresine transformatoriaus architektūra, nepakanka, kad būtų galima sukurti AGI. AI turi sukurti naujus „pilkosios dėžutės“ patikimus didelius modelius. Ši išvada pagrįsta Qi Yuan ilgamete praktine patirtimi tiek akademinėje, tiek pramonėje.

Prieš dešimt metų, turėdamas idėją „padaryti AI naudingą“, Qi Yuan vadovavo komandai, kuri pirmą kartą padidino pagrindinę „Alibaba“ mašininio mokymosi sistemą nuo 2 milijonų parametrų iki kelių šimtų milijonų parametrų, taip žymiai pagerindama verslo veiklą ir demonstruojant integruotą duomenų transformavimą, algoritmus ir inžinerines galimybes. Būtent tai yra mastelio keitimo įstatymo, apie kurį šiandien plačiai diskutuojama AI bendruomenėje, apraiška.

Qi Yuan primena, kad komanda tikrai paragavo mastelio keitimo įstatymo saldumo: šimteriopai padidinus modelio parametrus, bendras efektas smarkiai pagerėjo. "Tačiau dabar galvoju: kodėl tada AI modelių nepadarėme dar didesnių? Kodėl sustojome, kai galėjome žengti žingsnį toliau?" pasakė jis. „Net milijardų parametrų dideliuose modeliuose neužtenka, reikia eiti link šimtų milijardų, trilijonų ar net daugiau. Tuo metu tiek akademinei bendruomenei, tiek pramonei trūko skaičiavimo galios, o net pramonės sektoriuje pasiekti tokį aukštą. skaičiavimo galia pareikalavo labai didelių išlaidų, jau nekalbant apie akademinę bendruomenę“.

Priežastis, kodėl AGI standartas turėtų būti sukurti „AI Einšteiną“, – aiškina Qi Yuanas, todėl, kad jis turi būti efektyvus ir protingas. Pirma, Einšteinas atrado „XX amžiaus pradžios fizikos debesis“ per kelis pagrindinius duomenų taškus. AGI taip pat turėtų sugebėti atrasti ir suprasti nežinomus sudėtingo pasaulio dėsnius. Tačiau dabartiniai dideli modeliai negali to pasiekti. Pavyzdžiui, nors vizualinis didelis modelis SORA modeliuoja fizinį pasaulį precedento neturinčiu laipsniu, jis vis tiek kuria trimatį pasaulį remdamasis dvimačio pasaulio modeliavimu ir toli gražu ne iki galo supranta fizinį pasaulį. Antra, kyla energijos suvartojimo klausimas. Žmogaus smegenys veikia apie 15 vatų, o vienas GPU gali pasiekti kelis šimtus vatų, jau nekalbant apie tūkstančių ar dešimčių tūkstančių GPU grupes, kurių reikia bendriems dideliems modeliams apmokyti. Šiuo metu, jei ir toliau naudosime esamas architektūras, reikalingos energijos sąnaudos būtų astronominės, todėl būtų sunku pasiekti tikslą būti efektyviems ir protingiems.

„AI Einšteinas“ taip pat yra pagrindinis AI for Science (AI4S) tikslas. Mokslinis intelektas atliko svarbų vaidmenį spartinant žinomų fizikinių lygčių sprendimą, tačiau jis taip pat turi derinti žinomas taisykles su duomenimis, kad sumažintų didelę priklausomybę nuo duomenų ir skaičiavimo galios, pagerintų samprotavimų ir numatymo tikslumą ir pasiūlytų naujas mokslines teorijas. remiantis duomenimis pakoreguotų žinių taisyklėmis. Tai atitinka ilgalaikį Qi Yuan tikslą Fudano universitete ir SAIRI – naudoti dirbtinį intelektą siekiant suprasti sudėtingą pasaulį ir atrasti nežinomus dėsnius.

„Pilkosios dėžės“ patikimi vertikalaus domeno dideli modeliai įgalina įvairias pramonės šakas.

Kokias problemas reikia išspręsti, kad dideli modeliai taptų naujomis produktyviomis jėgomis iš AI įrankių? Pasak Qi Yuan, didelių modelių pramonė susiduria su daugybe bendrų iššūkių, todėl sunku suderinti technologijas, gaminius ir rinkos poreikius.

„Didžiausia šiandieninio didelio modelio diegimo problema yra ta, kad iš pirmo žvilgsnio jis atrodo naudingas, tačiau praktiškai nepavyksta“, – aiškina Qi Yuanas. Šiandieniniai dideli kalbos modeliai pirmiausia numato kitą žodį, remdamiesi keliais ankstesniais žodžiais, tačiau šis metodas netinka griežtam kelių žingsnių samprotavimui. „Kalba yra bendravimo, o ne mąstymo įrankis“. Neseniai institucijų, įskaitant MIT, paskelbtas dokumentas aukščiausiame akademiniame žurnaleGamtapažymėjo, kad kalba yra galingas kultūros žinių perdavimo įrankis ir galėjo vystytis kartu su mūsų mąstymo ir protavimo gebėjimais, atspindėdama žmogaus pažinimo sudėtingumą. Tačiau kalba nesukuria samprotavimo sudėtingumo.

Siekiant išspręsti esamų didelių modelių nepatikimumo, mažo aiškinimo ir didelių sąnaudų problemą, veiksmingas sprendimas yra sujungti tikimybinį neuroninio tinklo samprotavimą su loginiu simboliniu skaičiavimu, panašiu į greito mąstymo, pagrįsto instinktu, ir lėto mąstymo, pagrįsto loginiu samprotavimu, derinį, aprašytą Nobelio premijos laureato Danielio Kahnemano knygaMąstymas, greitas ir lėtas. „Tai galima pavadinti „pilkosios dėžutės“ dideliu modeliu“, – mano Qi Yuanas. Sujungus simbolinį skaičiavimą su neuroniniais tinklais „pilkoje dėžutėje“ patikimame dideliame modelyje, galima sumažinti AI „haliucinacijas“ ir išspręsti profesines problemas vertikaliose srityse, taip įgalinant įvairias pramonės šakas ir išlaisvinant didelių modelių produktyvumą.

Kas yra „pilkos dėžutės“ patikimas didelis modelis? „Iš pradžių gilus mokymasis buvo laikomas „juodąja dėže“. Dabar, derindami loginį samprotavimą su giliu mokymusi, turime „pilkąją dėžutę“, – aiškina Qi Yuanas. „Pirminė „juodoji dėžė“ leido žmonėms nežinoti apie procesą, kurio metu duomenys sukuria rezultatus, o „pilkosios dėžės“ didelis modelis, padedamas loginio samprotavimo, leidžia žmonėms „žinoti rezultatus ir priežastis“. Žvelgiant iš kitos perspektyvos, dideli „pilkosios dėžės“ modeliai gali naudoti gilų mokymąsi, kad sumažintų taisykles, kurios neatitinka realaus pasaulio stebimų duomenų.

Qi Yuan teigia, kad norint, kad dirbtinis intelektas vaidintų pagrindinį vaidmenį sudėtinguose scenarijuose įvairiose pramonės šakose – finansų ir draudimo, vėjo energijos ir energijos, jūrų laivybos ir farmacijos srityse – būtina derinti sistemingas pramonės žinias, argumentavimo logiką ir sprendimus. -mechanizmų su dideliais modeliais gamyba. „Pilkos dėžutės“ didelis modelis yra ne tik AGI kryptis, bet ir galingas įrankis, leidžiantis giliai įsiskverbti į vertikalius laukus ir iš tikrųjų išspręsti realaus pasaulio problemas. „Žvelgiant iš pramonės perspektyvos, šis supratimas yra labai intuityvus“, - iliustruoja Qi Yuan. Gydytojai neturi tapti teisininkais, teisininkai neturi tapti investicijų ekspertais. Kiekvienas profesinis vaidmuo turėtų sutelkti dėmesį į savo sritį ir pagerinti savo produktyvumo įrankius. Techniniu požiūriu, jei didelis modelis per daug mokosi nereikšmingų užduočių, jis gali patirti „katastrofišką pamiršimą“. Pavyzdžiui, jei Li Bai visą savo laiką skirtų apskaitai, o ne rašytų poeziją, jo poetinis įkvėpimas pamažu išblėstų. "Jau pastebėjome, kad treniruojant didelius vertikalių domenų modelius, jei modelis išmoksta per daug nesusijusių funkcijų, jis gali trukdyti jo pirminėms galimybėms. Todėl efektyvių "pilkosios dėžės" didelių modelių kūrimas vertikaliems domenams yra labai vertingas pramonėje. įgyvendinimas“.

„Manau, kad „pilkosios dėžės“ dideli modeliai vaidins vis svarbesnį vaidmenį kelyje į AGI ir diegiant vertikalias sritis. Žvelgiant iš Bajeso metodologinės perspektyvos, jis sujungia mūsų žinomas žinias su paslėpta informacija, kad atrastų naujus įstatymus. ir išspręsti mokslo bei pramonės problemas“, – teigia Qi Yuanas. Ateityje „AI Einstein“ taip pat galėtų būti „AI Buffett“.

Inovacijų grandinės sujungimas ir mokslinės žvalgybos inovacijų ekosistemos kūrimas.

Šių metų pasaulinėje dirbtinio intelekto konferencijoje Qi Yuan komanda pristatė patikimus finansinius ir medicininius modelius su šimtais milijardų parametrų. Šie vertikalaus domeno dideli modeliai bandymų metu pranoko OpenAI trilijono parametrų modelį GPT{1}} Turbo, dar kartą atkreipdami pramonės dėmesį į didelių modelių diegimą.

"Šiandieninius AI proveržius lemia ne tik pagrindinių principų naujovės, bet ir produktais pagrįsti metodai, atitinkantys visuomenės poreikius. Visuomenė reikalauja ne tik teorinių straipsnių ar verslo modelių naujovių publikavimo, bet ir gilios technologinių ir pramonės inovacijų, pagrįstų Pirmieji principai Sujungę šiuos du elementus, galime pasiekti mėlynesnius vandenis“, – sako Qi Yuanas.

Akademinė bendruomenė ir pramonė turi skirtingas misijas. Akademija tyrinėja naujus reiškinius, o pramonė pirmiausia sprendžia praktines problemas. Visame pasaulyje paplitusi problema yra ta, kad mokslinių tyrimų institucijos turi spręsti daugelį technologinių inovacijų problemų, tačiau jei jos nepaiso produkcijos gamybos ir visuomenės poreikių, jos susiduria su dviem trūkumais: realaus konkurencinio spaudimo, kuris trukdo tobulinti naujoviškas technologijas, ir veiksmingų technologijų nebuvimu. rinkos grįžtamąjį ryšį, kad būtų galima vadovautis technologiniais tyrimais.

Šiuo tikslu Qi Yuan jau seniai siekė sujungti „universitetų-mokslinių tyrimų institutų-startuolių“ inovacijų grandinę, kad būtų sukurta gera inovacijų ekosistema, kurioje atsižvelgiama ir į pagrindines technologijas, ir į rinkos poreikius. Produkto kryptis turėtų būti grindžiama rinkos paklausa ir scenarijais, kuriant pagrindinį produkto konkurencingumą pasitelkiant pagrindines naujoves.

Įkurta 2023 m., SAIRI yra įsipareigojusi kurti originalias AI for Science naujoves, kurios sujungia žinias ir duomenis. Neseniai SAIRI pristatė „Fuxi“ didelių meteorologinių modelių 2.0 seriją, skirtą naujoms energetikos, draudimo, miestų valdymo reikmėms, ir inicijavo „Smart Meteorological Innovation Ecosystem Alliance“. Šiuo aljansu siekiama palaipsniui skatinti pramoninį Fuxi serijos meteorologinių didelių modelių 2.0 pritaikymą. „Pilkos dėžutės“ patikimi dideli modeliai taip pat tobulėja diegiant gaminius, o „Infinite Lightyear“, patikima didelė modelių įmonė, kurią įkūrė Qi Yuan, jau įsteigta.

Siekiant toliau skatinti mokslinės žvalgybos naujovių ekosistemą, antrasis pasaulinis mokslinio žvalgybos konkursas, kurį kartu organizuoja SAIRI ir Fudano universitetas ir kuriam vadovauja keli departamentai, įskaitant Šanchajaus mokslo ir technologijų komitetą, Šanchajaus plėtros ir reformų komisiją, Šanchajaus ekonomikos ir informacinių technologijų komitetą, ir Šanchajaus švietimo komitetas. Konkurse siūlomi milijonai prizų, siekiant įdarbinti pasaulinius dalyvius tyrinėti pažangias mokslinės žvalgybos sritis. Be to, SAIRI sukūrė mokslinių duomenų platformą, apimančią multimodalinius mokslinius duomenis, kuri palaiko visą grandinę nuo duomenų rinkimo ir apdorojimo iki valdymo ir modeliavimo, užtikrindama veiksmingą duomenų apdorojimą, patikimumą ir saugų ryšį. Remdamiesi šia platforma, SAIRI ir jos partneriai sukūrė keletą aukštos kokybės gyvosios gamtos mokslų, medžiagų mokslų, atmosferos mokslų ir kitų sričių mokslinių duomenų rinkinių, suteikdami vertingų išteklių mokslinės žvalgybos tyrimams. Be to, SAIRI inicijavo Pasaulinį mokslinių duomenų ekosistemų aljansą, kurio pradiniai nariai yra „China Telecom Corporation“, „COSCO Shipping Insurance Captive“, „Shanghai Lingang New Area Cross-Border Data Technology“ ir daugiau nei dešimt kitų subjektų. Aljanso tikslas – bendradarbiaujant vyriausybei, įmonėms, universitetams ir mokslinių tyrimų institucijoms sukurti pasaulinę, kelių sričių mokslinių tyrimų didžiųjų duomenų išteklių atviro ir dalijimosi platformą.

"Nesvarbu, ar tai būtų moksliniai tyrimai, ar pramonė, neturėtume diegti naujovių vardan naujovių. Tikimės, kad ateityje sukursime AGI ir programas, kurios išspręstų realias problemas", - sako Qi Yuanas.

Kaip toli esame nuo bendrojo dirbtinio intelekto