De nieuwste AI van DeepMind kan technische problemen oplossen

De nieuwste AI van DeepMind kan technische problemen oplossen

Afbeeldingscredits: Google Deepmind

DeepMind, het AI-onderzoeks- en ontwikkelingslaboratorium van Google, gelooft dat de sleutel tot capabelere AI-systemen kan liggen in het blootleggen van nieuwe manieren om moeilijke technische problemen op te lossen.

Daartoe heeft DeepMind vandaag AlphaGeometry onthuld, een systeem waarvan het laboratorium beweert dat het evenveel geometrieproblemen kan oplossen als de gemiddelde gouden medaillewinnaar van de Internationale Wiskunde Olympiade. AlphaGeometry, waarvan de code vanochtend open source was, lost 25 Olympiade-geometrieproblemen op binnen de recordtijd en verslaat daarmee 10 problemen in het vorige, geavanceerde systeem.

“Het oplossen van technische problemen op Olympisch niveau is een belangrijke mijlpaal in de ontwikkeling van diep wiskundig denken op weg naar meer geavanceerde en algemene AI-systemen”, schreven Trieu Trinh en Tang Luong, AI-onderzoekers bij Google, in een artikel. Bloggen Bericht vanochtend gepubliceerd. “[We] Ik hoop dat… AlphaGeometry-technologie zal helpen nieuwe mogelijkheden te openen op het gebied van wiskunde, wetenschap en kunstmatige intelligentie.

Waarom focussen op techniek? DeepMind beweert dat het bewijzen van wiskundige stellingen, of het logisch uitleggen waarom een ​​stelling waar is (zoals de stelling van Pythagoras), zowel redenering als het vermogen vereist om uit een reeks mogelijke stappen naar een oplossing te kiezen. Deze probleemoplossende aanpak zou – als DeepMind gelijk heeft – op een dag nuttig kunnen zijn in AI-systemen voor algemene doeleinden.

“Door te bewijzen dat een gegeven gok goed of fout is, worden de mogelijkheden van zelfs de meest geavanceerde AI-systemen van vandaag vergroot”, aldus het persmateriaal van DeepMind dat met TechCrunch werd gedeeld. “Om dit doel te bereiken is het vermogen om wiskundige stellingen te bewijzen… een belangrijke mijlpaal, omdat het blijk geeft van beheersing van logisch denken en het vermogen om nieuwe kennis te ontdekken.”

Maar het trainen van een AI-systeem om technische problemen op te lossen brengt unieke uitdagingen met zich mee.

Vanwege de complexiteit van het vertalen van proefdrukken naar een formaat dat machines kunnen begrijpen, is er een schaarste aan bruikbare technische trainingsgegevens. Veel van de hedendaagse geavanceerde generatieve AI-modellen zijn weliswaar uitzonderlijk in het identificeren van patronen en relaties in data, maar missen het vermogen om door theorieën te redeneren.

De oplossing van DeepMind was tweeledig.

Alpha DeepMind-techniek

Afbeeldingscredits: Diepe geest

Bij het ontwerpen van AlphaGeometry combineerde het laboratorium een ​​‘neuraal taal’-model – een architectonisch model gemodelleerd naar ChatGPT – met een ‘symbolische inferentie-engine’, een engine die gebruik maakt van regels (zoals wiskundige regels) om oplossingen voor problemen af ​​te leiden. Symbolische motoren kunnen inflexibel en traag zijn, vooral als het om grote of complexe datasets gaat. Maar DeepMind verlicht deze problemen door het neurale model de deductiemotor te laten ‘begeleiden’ door mogelijke antwoorden op specifieke technische problemen.

In plaats van trainingsgegevens genereerde DeepMind zijn eigen gegevens Kunstmatig gegevens, die 100 miljoen ‘synthetische theorieën’ en bewijsmateriaal van verschillende complexiteit genereren. Het laboratorium trainde AlphaGeometry vervolgens helemaal opnieuw op basis van synthetische gegevens en evalueerde deze aan de hand van Olympische geometrieproblemen

Olympiade Geometrie-problemen zijn gebaseerd op diagrammen waaraan ‘structuren’ moeten worden toegevoegd voordat ze kunnen worden opgelost, zoals punten, lijnen of cirkels. Toegepast op deze problemen voorspelt het neurale model van AlphaGeometry structuren die nuttig kunnen zijn om toe te voegen: voorspellingen die de symbolische engine van AlphaGeometry gebruikt om gevolgtrekkingen te maken over grafieken om vergelijkbare oplossingen te identificeren.

“Met veel voorbeelden van hoe deze structuren tot bewijzen hebben geleid, kan het taalmodel van AlphaGeometry goede suggesties geven voor nieuwe structuren wanneer ze worden gepresenteerd met Olympische meetkundeproblemen”, schreven Trinh en Luong. “Het ene systeem levert snelle, 'intuïtieve' ideeën op, terwijl het andere een meer weloverwogen en rationeel besluitvormingsproces biedt.

De resultaten van het oplossen van AlphaGeometry-problemen, die waren gepubliceerd In een studie die deze week in Nature werd gepubliceerd, zal dit waarschijnlijk het langlopende debat over de vraag of kunstmatige-intelligentiesystemen moeten worden gebouwd op symboolmanipulatie – dat wil zeggen het manipuleren van symbolen die kennis vertegenwoordigen met behulp van regels – of op oppervlakkig hersenachtige neurale netwerken opnieuw moeten aanwakkeren. .

Voorstanders van de neurale netwerkbenadering zeggen dat intelligent gedrag – van spraakherkenning tot het genereren van beelden – kan voortkomen uit niets anders dan enorme hoeveelheden gegevens en berekeningen. versus Symbolische systemen, die taken oplossen door reeksen symboolverwerkingsregels te definiëren die aan bepaalde functies zijn toegewezen (zoals het bewerken van een regel in een tekstverwerkerprogramma), en neurale netwerken proberen taken op te lossen door middel van statistische benadering en het leren van voorbeelden.

Neurale netwerken vormen de hoeksteen van krachtige AI-systemen zoals DALL-E 3 en GPT-4 van OpenAI. Maar zoals voorstanders van symbolische AI ​​beweren, zijn ze niet het einde; Deze voorstanders zeggen dat symbolische AI ​​wellicht beter geplaatst is om mondiale kennis efficiënt te coderen, door complexe scenario’s te redeneren en te “verklaren” hoe ze tot het antwoord zijn gekomen.

Als een hybride symbolisch neuraal netwerksysteem vergelijkbaar met DeepMind's AlphaFold 2 en AlphaGo, toont AlphaGeometry misschien aan dat de twee benaderingen – symboolmanipulatie en neurale netwerken – som Het is de beste weg vooruit in de zoektocht naar generaliseerbare AI. misschien.

“Ons langetermijndoel blijft het bouwen van AI-systemen die kunnen generaliseren over wiskundige domeinen, het ontwikkelen van de geavanceerde probleemoplossing en redenering waarop algemene AI-systemen zullen vertrouwen, en tegelijkertijd de grenzen van de menselijke kennis verleggen”, schreven Trinh en Luong. . “Deze aanpak zou vorm kunnen geven aan de manier waarop toekomstige AI-systemen nieuwe kennis ontdekken, in de wiskunde en daarbuiten.”

You May Also Like

About the Author: Ebert Brink

'Reader. Furious humble travel enthusiast. Extreme food scientist. Writer. Communicator.'

Geef een reactie

Uw e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *