title: "La Dècada d'AlphaGo: Dels Jocs a l'AGI i el Descobriment Científic" slug: "10-years-of-alphago" date: "2026-03-12" lang: "ca" source: "https://deepmind.google/blog/10-years-of-alphago/" category: "Recerca en IA" keywords:
- AlphaGo
- DeepMind
- AGI
- Intel·ligència Artificial General
- AlphaFold
- plegament de proteïnes
- descobriment científic
- aprenentatge per reforç
- joc del Go
- Moviment 37
- AlphaZero
- Gemini meta_description: "Celebrant 10 anys des que AlphaGo va vèncer un campió mundial de Go, descobreix el seu profund impacte, des de catalitzar avenços científics com AlphaFold fins a obrir el camí cap a la Intel·ligència Artificial General (AGI)." image: "/images/articles/10-years-of-alphago.png" image_alt: "L'icònic Moviment 37 d'AlphaGo en la històrica partida de Go contra Lee Sedol, que simbolitza un punt d'inflexió en la recerca de la IA." quality_score: 94 content_score: 93 seo_score: 95 companies:
- Google schema_type: "NewsArticle" reading_time: 7 faq:
- question: "Quina va ser la importància de la victòria d'AlphaGo el 2016?" answer: "La victòria d'AlphaGo sobre el campió mundial de Go, Lee Sedol, el 2016 va ser un assoliment monumental que va marcar l'inici de l'era moderna de la IA. Va demostrar que els sistemes d'IA no només podien imitar l'experiència humana, sinó també desenvolupar estratègies noves i creatives que van sorprendre fins i tot els jugadors professionals, com el famós 'Moviment 37'. Aquest avenç va trencar els terminis previs per al desenvolupament de la IA, demostrant el seu potencial per abordar problemes d'immensa complexitat i obrint el camí per a aplicacions en dominis científics del món real més enllà dels jocs, senyalant un canvi profund en les capacitats tecnològiques i les expectatives per a la IA."
- question: "Com va evolucionar la metodologia d'AlphaGo després del seu èxit inicial?" answer: "Després del seu èxit inicial, la metodologia d'AlphaGo va evolucionar ràpidament amb la introducció d'AlphaGo Zero i AlphaZero. AlphaGo Zero va aprendre a jugar a Go des de zero sense dades humanes, basant-se únicament en l'aprenentatge per reforç mitjançant l'auto-joc, convertint-se en el jugador de Go més fort de la història. AlphaZero va generalitzar aquest enfocament, dominant múltiples jocs de dos jugadors amb informació perfecta com els escacs i el Shogi des de zero, demostrant que els principis subjacents de les xarxes neuronals profundes, la cerca avançada i l'aprenentatge per reforç podien aplicar-se a diversos dominis complexos sense coneixement previ específic del joc, provant la robustesa de l'enfocament."
- question: "Què és AlphaFold i com es relaciona amb el llegat d'AlphaGo?" answer: "AlphaFold 2 és un sistema d'IA de DeepMind que va resoldre el gran repte de 50 anys de predir l'estructura 3D de les proteïnes. Es relaciona directament amb el llegat d'AlphaGo aplicant principis fonamentals similars de navegació per grans espais de cerca a un problema científic complex. Així com AlphaGo va dominar les complexes possibilitats en un tauler de Go, AlphaFold navega per l'explosió combinatòria de configuracions de plegament de proteïnes. El seu èxit va portar al plegament dels 200 milions de proteïnes conegudes i va valdre un Premi Nobel als seus creadors, il·lustrant com la recerca en IA de jocs pot catalitzar avenços profunds en camps com la biologia i la medicina."
- question: "Més enllà del plegament de proteïnes, quins altres camps científics ha influenciat l'enfocament d'AlphaGo?" answer: "L'enfocament innovador d'AlphaGo ha influenciat nombrosos camps científics més enllà del plegament de proteïnes. Els seus principis d'aprenentatge per reforç profund i cerca avançada s'han aplicat al raonament matemàtic amb sistemes com AlphaProof, que va aconseguir el nivell de medalla de plata a l'IMO, i el mode Deep Think de Gemini, que va aconseguir l'or. També va inspirar AlphaEvolve, un agent de codificació que descobreix algorismes eficients, i el desenvolupament de co-científics d'IA capaços de debatre hipòtesis i accelerar la recerca en àrees com la resistència antimicrobiana, la comprensió del genoma, la investigació de l'energia de fusió i la millora de la predicció meteorològica."
- question: "Com contribueix el treball d'AlphaGo al desenvolupament de la Intel·ligència Artificial General (AGI)?" answer: "El treball d'AlphaGo contribueix de manera crítica al desenvolupament de la Intel·ligència Artificial General (AGI) proporcionant tècniques fonamentals per a la resolució de problemes complexos, la cerca i l'aprenentatge per reforç. La seva capacitat d'aprendre estratègies noves i generalitzar entre dominis es veu com un model per a l'AGI. Els models Gemini de DeepMind, dissenyats per ser multimodals i entendre diversos tipus de dades, integren les tècniques de cerca i planificació d'AlphaGo. L'objectiu és combinar models del món, cerca avançada i eines d'IA especialitzades per aconseguir una veritable creativitat i capacitats de raonament generals que puguin abordar reptes científics i d'enginyeria desconeguts, anant més enllà dels sistemes d'IA especialitzats."
- question: "Què és el 'Moviment 37' i per què és tan significatiu en la història de la IA?" answer: "'Moviment 37' es refereix a un moviment específic i poc convencional realitzat per AlphaGo durant la seva segona partida contra Lee Sedol el 2016. Els comentaristes professionals de Go van creure inicialment que era un error a causa de la seva desviació de les estratègies humanes establertes. No obstant això, va resultar ser un moviment decisiu i de gran visió que va posicionar AlphaGo per a la victòria. La seva importància rau en demostrar la capacitat de la IA per a la creativitat genuïna i la innovació estratègica, no només imitant experts humans, sinó superant-los amb enfocaments completament nous. Es va convertir en un símbol potent del potencial de la IA per pensar 'fora de la caixa' i va insinuar la futura capacitat de la IA per redefinir la resolució de problemes en diverses disciplines."
El Llegat Perenne d'AlphaGo: Una Dècada de Transformació de la IA i Avenços Científics
Fa deu anys, el món va ser testimoni d'un moment que va remodelar irremeiablement la trajectòria de la intel·ligència artificial. El 12 de març de 2016, el sistema d'IA de DeepMind, AlphaGo, va aconseguir el que molts experts creien que estava a una dècada de distància: vèncer un campió mundial en el joc increïblement complex del Go. Aquest assoliment monumental, destacat pel ja llegendari "Moviment 37", no només va marcar una fita en la IA de jocs; va anunciar l'arribada de l'era moderna de la IA, mostrant una espurna creativa que transcendia la intuïció humana i assenyalava el potencial de la IA per abordar problemes científics del món real.
Avui, mentre commemorem una dècada des d'aquella partida històrica, l'avenç d'AlphaGo continua informant i inspirant la recerca de la Intel·ligència Artificial General (AGI) a DeepMind. El viatge des de dominar un antic joc de taula fins a catalitzar descobriments científics guanyadors del Premi Nobel subratlla l'impacte profund i durador d'AlphaGo, posicionant-lo com un pilar fonamental en la recerca de la humanitat per obtenir les millors eines per avançar en la ciència, la medicina i la productivitat.
La Partida Històrica: El "Moviment 37" i l'Alba d'una Nova Era
El món va observar amb admiració el 2016 com AlphaGo s'enfrontava a la llegenda del Go Lee Sedol a Seül. El Go, amb els seus impressionants 10^170 possibles posicions al tauler —molt superiors al nombre d'àtoms de l'univers observable— havia estat considerat durant molt de temps el repte definitiu per a la IA a causa de la seva immensa complexitat i la seva dependència de la intuïció. La victòria d'AlphaGo va ser un testimoni de la seva arquitectura innovadora, que combinava xarxes neuronals profundes amb algorismes de cerca avançats i aprenentatge per reforç, un enfocament que DeepMind va ser pioner.
El moment decisiu va arribar a la Partida 2 amb el "Moviment 37". Aquesta jugada era tan poc convencional que els comentaristes professionals la van descartar inicialment com un error. No obstant això, la profunda visió d'AlphaGo els va demostrar que estaven equivocats. Cent moviments més tard, la pedra estava exactament on havia de ser perquè AlphaGo s'assegurés la victòria. Aquest moviment creatiu, aparentment contra-intuïtiu, va mostrar un sistema d'IA capaç d'anar més enllà d'imitar experts humans, demostrant la capacitat de descobrir estratègies completament noves i òptimes. Va ser una visió definitiva de la creixent capacitat de la IA per a la veritable innovació.
Més enllà del Tauler: L'Evolució i Generalització d'AlphaGo
L'èxit inicial d'AlphaGo només va ser el principi. DeepMind va evolucionar ràpidament els seus sistemes d'IA de jocs, ampliant els límits del que era possible mitjançant la millora automàtica i la generalització.
Primer va arribar AlphaGo Zero, un sistema que va aprendre el joc del Go purament mitjançant l'auto-joc, començant des de moviments completament aleatoris i sense cap dada d'experts humans. Jugant centenars de milers de partides contra si mateix, AlphaGo Zero no només va superar el seu predecessor sinó que es va convertir, sens dubte, en el jugador de Go més fort de la història, demostrant el poder de l'aprenentatge per reforç pur.
Després, AlphaZero va generalitzar aquest concepte encara més. Dissenyat per dominar qualsevol joc de dos jugadors amb informació perfecta, AlphaZero va aprendre Go, Escacs i Shogi des de zero. Donades només les regles, AlphaZero va ser capaç d'aprendre i vèncer no només els millors jugadors humans sinó també els millors programes especialitzats d'escacs de l'època, com Stockfish, en poques hores. Igual que amb el Go, la perspectiva fresca d'AlphaZero va conduir al descobriment de noves estratègies en aquests jocs llargament estudiats, demostrant l'adaptabilitat i el poder dels seus algorismes d'aprenentatge.
Aquesta ràpida progressió des del domini de jocs específics fins a l'aprenentatge generalitzat va ser un pas crític, demostrant que els principis subjacents de la IA podien aplicar-se àmpliament. La taula següent il·lustra el llinatge i l'impacte d'aquests sistemes d'IA pioners:
| Sistema d'IA | Innovació Clau | Assoliments Clau |
|---|---|---|
| AlphaGo | Xarxes neuronals profundes, Monte Carlo Tree Search (MCTS), aprenentatge per reforç | Primera IA a vèncer un campió mundial de Go; el 'Moviment 37' va demostrar la creativitat de la IA. |
| AlphaGo Zero | Auto-joc des de zero, sense dades humanes | Es va convertir en el jugador de Go més fort; va aprendre estratègies òptimes de manera autònoma. |
| AlphaZero | Algorisme d'auto-joc generalitzat en diversos jocs | Va dominar Go, Escacs i Shogi des de zero; va vèncer els millors programes especialitzats en hores. |
| AlphaFold 2 | IA per a la predicció de l'estructura de proteïnes | Va resoldre el problema del plegament de proteïnes de 50 anys; va conduir al Premi Nobel; va crear una base de dades pública de proteïnes. |
| AlphaProof | Models de llenguatge + RL/cerca d'AlphaZero per a proves formals | Va aconseguir el nivell de medalla de plata a l'Olimpíada Internacional de Matemàtiques (IMO) per al raonament matemàtic. |
| AlphaEvolve | Agent de codificació impulsat per Gemini per al descobriment d'algorismes | Va descobrir un nou algorisme més eficient de multiplicació de matrius; potencial per a l'optimització de centres de dades. |
| Gemini DeepThink | Raonament multimodal, cerca i planificació inspirats en AlphaGo | Va aconseguir el nivell de medalla d'or a l'IMO; aplicat a reptes científics i d'enginyeria complexos i oberts. |
Catalitzant Avenços Científics: De Proteïnes a Demostracions
La veritable visió darrere d'AlphaGo sempre va ser accelerar el descobriment científic. Demostrant la seva capacitat per navegar per l'enorme espai de cerca del Go, va mostrar el potencial de la IA per comprendre les vastes complexitats del món físic. Aquesta filosofia es va traduir ràpidament en avenços científics tangibles.
El 2020, DeepMind va resoldre un dels "grans reptes" de la biologia: el problema del plegament de proteïnes. Durant 50 anys, els científics havien lluitat per predir les estructures 3D de les proteïnes, essencials per entendre malalties i desenvolupar nous medicaments. AlphaFold 2, un descendent directe dels principis d'AlphaGo, va predir amb èxit aquestes estructures intricades. Aquest assoliment monumental va portar al plegament dels 200 milions de proteïnes conegudes per la ciència, posades a disposició gratuïta en una base de dades de codi obert utilitzada per més de 3 milions d'investigadors a tot el món. Aquest treball innovador va valdre a John Jumper i Demis Hassabis el Premi Nobel de Química el 2024, en nom de l'equip d'AlphaFold, consolidant el paper de la IA en la recerca científica transformadora.
La influència d'AlphaGo es va estendre encara més a diversos dominis científics i matemàtics:
-
Raonament Matemàtic: AlphaProof, heretant directament l'ADN arquitectònic d'AlphaGo, va aprendre a demostrar enunciats matemàtics formals. Combinant models de llenguatge amb l'aprenentatge per reforç i la cerca d'AlphaZero, va aconseguir un nivell de medalla de plata a l'IMO. El mode avançat Deep Think dins dels últims models multimodals de DeepMind, com ara Gemini 3.1 Pro, ha aconseguit des de llavors un rendiment de medalla d'or a l'IMO de 2025, mostrant mètodes inspirats en AlphaGo que desbloquegen el raonament matemàtic avançat.
-
Descobriment d'Algorismes: Inspirat per la cerca d'AlphaGo de moviments òptims, AlphaEvolve explora l'espai del codi informàtic per descobrir algorismes més eficients. Va experimentar el seu propi moment de "Moviment 37" en trobar una manera nova de multiplicar matrius, una operació fonamental que sustenta les xarxes neuronals modernes, prometent optimitzacions per a àrees que van des de la gestió de centres de dades fins a la computació quàntica.
-
Col·laboració Científica: Els principis de cerca i raonament d'AlphaGo estan ara integrats en els co-científics d'IA. Aquests sistemes poden 'debatre' idees científiques, identificar patrons en les dades i generar hipòtesis de manera independent. Un estudi de validació a l'Imperial College London va veure un co-científic d'IA derivar de manera independent la mateixa hipòtesi sobre la resistència antimicrobiana que els investigadors havien trigat anys a desenvolupar.
Aquestes aplicacions, juntament amb els esforços per comprendre millor el genoma, avançar en la investigació de l'energia de fusió i millorar la predicció meteorològica, subratllen com AlphaGo va establir les bases perquè la IA es convertís en una eina indispensable en el mètode científic.
El Camí cap a l'AGI: El Model d'AlphaGo per al Futur de la IA
Tot i ser impressionants, molts dels models científics de DeepMind estan altament especialitzats. L'objectiu final, inspirat en el viatge d'AlphaGo, és construir sistemes d'IA generals que puguin trobar estructures i connexions subjacents en diversos camps – el que es coneix com Intel·ligència Artificial General (AGI).
Perquè una IA sigui veritablement general, ha d'entendre el món físic en la seva totalitat. Això requereix multimodalitat, un principi de disseny fonamental darrere dels models Gemini de DeepMind. Gemini entén no només el llenguatge, sinó també àudio, vídeo, imatges i codi, construint un model més complet del món. De manera crucial, els últims models Gemini empren tècniques pioneres amb AlphaGo i AlphaZero per pensar i raonar a través d'aquestes modalitats.
La propera generació de sistemes d'IA també requerirà la capacitat de fer servir eines especialitzades, de la mateixa manera que un expert humà utilitza diferents instruments per a diferents tasques. Per exemple, un sistema AGI que necessiti informació sobre l'estructura de proteïnes podria aprofitar AlphaFold. Es preveu que la combinació dels models multimodals del món de Gemini, les robustes tècniques de cerca i planificació d'AlphaGo, i l'ús estratègic d'eines d'IA especialitzades sigui fonamental per aconseguir l'AGI. Això senyalitza un futur on l'era de la IA com a text ha acabat, amb agents intel·ligents realitzant accions complexes i del món real.
La veritable creativitat, la que es va vislumbrar en el "Moviment 37", segueix sent una capacitat clau per a l'AGI. Un sistema AGI no només idearia una nova estratègia de Go; inventaria un joc tan profund i elegant com el Go mateix. Deu anys després, l'espurna creativa que va encendre per primera vegada el moviment decisiu d'AlphaGo ha catalitzat una cascada d'avenços, tots convergint per obrir el camí cap a l'AGI i inaugurar el que promet ser una nova edat d'or del descobriment científic.
Font original
https://deepmind.google/blog/10-years-of-alphago/Preguntes freqüents
What was the significance of AlphaGo's victory in 2016?
How did AlphaGo's methodology evolve after its initial success?
What is AlphaFold and how does it relate to AlphaGo's legacy?
Beyond protein folding, what other scientific fields has AlphaGo's approach influenced?
How is AlphaGo's work contributing to the development of Artificial General Intelligence (AGI)?
What is 'Move 37' and why is it so significant in AI history?
Manteniu-vos al dia
Rebeu les últimes notícies d'IA al correu.
