Code Velocity
Recerca en IA

La Dècada d'AlphaGo: Dels Jocs a l'AGI i el Descobriment Científic

·7 min de lectura·Google·Font original
Compartir
L'icònic Moviment 37 d'AlphaGo en la històrica partida de Go contra Lee Sedol, que simbolitza un punt d'inflexió en la recerca de la IA.

title: "La Dècada d'AlphaGo: Dels Jocs a l'AGI i el Descobriment Científic" slug: "10-years-of-alphago" date: "2026-03-12" lang: "ca" source: "https://deepmind.google/blog/10-years-of-alphago/" category: "Recerca en IA" keywords:

  • AlphaGo
  • DeepMind
  • AGI
  • Intel·ligència Artificial General
  • AlphaFold
  • plegament de proteïnes
  • descobriment científic
  • aprenentatge per reforç
  • joc del Go
  • Moviment 37
  • AlphaZero
  • Gemini meta_description: "Celebrant 10 anys des que AlphaGo va vèncer un campió mundial de Go, descobreix el seu profund impacte, des de catalitzar avenços científics com AlphaFold fins a obrir el camí cap a la Intel·ligència Artificial General (AGI)." image: "/images/articles/10-years-of-alphago.png" image_alt: "L'icònic Moviment 37 d'AlphaGo en la històrica partida de Go contra Lee Sedol, que simbolitza un punt d'inflexió en la recerca de la IA." quality_score: 94 content_score: 93 seo_score: 95 companies:
  • Google schema_type: "NewsArticle" reading_time: 7 faq:
  • question: "Quina va ser la importància de la victòria d'AlphaGo el 2016?" answer: "La victòria d'AlphaGo sobre el campió mundial de Go, Lee Sedol, el 2016 va ser un assoliment monumental que va marcar l'inici de l'era moderna de la IA. Va demostrar que els sistemes d'IA no només podien imitar l'experiència humana, sinó també desenvolupar estratègies noves i creatives que van sorprendre fins i tot els jugadors professionals, com el famós 'Moviment 37'. Aquest avenç va trencar els terminis previs per al desenvolupament de la IA, demostrant el seu potencial per abordar problemes d'immensa complexitat i obrint el camí per a aplicacions en dominis científics del món real més enllà dels jocs, senyalant un canvi profund en les capacitats tecnològiques i les expectatives per a la IA."
  • question: "Com va evolucionar la metodologia d'AlphaGo després del seu èxit inicial?" answer: "Després del seu èxit inicial, la metodologia d'AlphaGo va evolucionar ràpidament amb la introducció d'AlphaGo Zero i AlphaZero. AlphaGo Zero va aprendre a jugar a Go des de zero sense dades humanes, basant-se únicament en l'aprenentatge per reforç mitjançant l'auto-joc, convertint-se en el jugador de Go més fort de la història. AlphaZero va generalitzar aquest enfocament, dominant múltiples jocs de dos jugadors amb informació perfecta com els escacs i el Shogi des de zero, demostrant que els principis subjacents de les xarxes neuronals profundes, la cerca avançada i l'aprenentatge per reforç podien aplicar-se a diversos dominis complexos sense coneixement previ específic del joc, provant la robustesa de l'enfocament."
  • question: "Què és AlphaFold i com es relaciona amb el llegat d'AlphaGo?" answer: "AlphaFold 2 és un sistema d'IA de DeepMind que va resoldre el gran repte de 50 anys de predir l'estructura 3D de les proteïnes. Es relaciona directament amb el llegat d'AlphaGo aplicant principis fonamentals similars de navegació per grans espais de cerca a un problema científic complex. Així com AlphaGo va dominar les complexes possibilitats en un tauler de Go, AlphaFold navega per l'explosió combinatòria de configuracions de plegament de proteïnes. El seu èxit va portar al plegament dels 200 milions de proteïnes conegudes i va valdre un Premi Nobel als seus creadors, il·lustrant com la recerca en IA de jocs pot catalitzar avenços profunds en camps com la biologia i la medicina."
  • question: "Més enllà del plegament de proteïnes, quins altres camps científics ha influenciat l'enfocament d'AlphaGo?" answer: "L'enfocament innovador d'AlphaGo ha influenciat nombrosos camps científics més enllà del plegament de proteïnes. Els seus principis d'aprenentatge per reforç profund i cerca avançada s'han aplicat al raonament matemàtic amb sistemes com AlphaProof, que va aconseguir el nivell de medalla de plata a l'IMO, i el mode Deep Think de Gemini, que va aconseguir l'or. També va inspirar AlphaEvolve, un agent de codificació que descobreix algorismes eficients, i el desenvolupament de co-científics d'IA capaços de debatre hipòtesis i accelerar la recerca en àrees com la resistència antimicrobiana, la comprensió del genoma, la investigació de l'energia de fusió i la millora de la predicció meteorològica."
  • question: "Com contribueix el treball d'AlphaGo al desenvolupament de la Intel·ligència Artificial General (AGI)?" answer: "El treball d'AlphaGo contribueix de manera crítica al desenvolupament de la Intel·ligència Artificial General (AGI) proporcionant tècniques fonamentals per a la resolució de problemes complexos, la cerca i l'aprenentatge per reforç. La seva capacitat d'aprendre estratègies noves i generalitzar entre dominis es veu com un model per a l'AGI. Els models Gemini de DeepMind, dissenyats per ser multimodals i entendre diversos tipus de dades, integren les tècniques de cerca i planificació d'AlphaGo. L'objectiu és combinar models del món, cerca avançada i eines d'IA especialitzades per aconseguir una veritable creativitat i capacitats de raonament generals que puguin abordar reptes científics i d'enginyeria desconeguts, anant més enllà dels sistemes d'IA especialitzats."
  • question: "Què és el 'Moviment 37' i per què és tan significatiu en la història de la IA?" answer: "'Moviment 37' es refereix a un moviment específic i poc convencional realitzat per AlphaGo durant la seva segona partida contra Lee Sedol el 2016. Els comentaristes professionals de Go van creure inicialment que era un error a causa de la seva desviació de les estratègies humanes establertes. No obstant això, va resultar ser un moviment decisiu i de gran visió que va posicionar AlphaGo per a la victòria. La seva importància rau en demostrar la capacitat de la IA per a la creativitat genuïna i la innovació estratègica, no només imitant experts humans, sinó superant-los amb enfocaments completament nous. Es va convertir en un símbol potent del potencial de la IA per pensar 'fora de la caixa' i va insinuar la futura capacitat de la IA per redefinir la resolució de problemes en diverses disciplines."

El Llegat Perenne d'AlphaGo: Una Dècada de Transformació de la IA i Avenços Científics

Fa deu anys, el món va ser testimoni d'un moment que va remodelar irremeiablement la trajectòria de la intel·ligència artificial. El 12 de març de 2016, el sistema d'IA de DeepMind, AlphaGo, va aconseguir el que molts experts creien que estava a una dècada de distància: vèncer un campió mundial en el joc increïblement complex del Go. Aquest assoliment monumental, destacat pel ja llegendari "Moviment 37", no només va marcar una fita en la IA de jocs; va anunciar l'arribada de l'era moderna de la IA, mostrant una espurna creativa que transcendia la intuïció humana i assenyalava el potencial de la IA per abordar problemes científics del món real.

Avui, mentre commemorem una dècada des d'aquella partida històrica, l'avenç d'AlphaGo continua informant i inspirant la recerca de la Intel·ligència Artificial General (AGI) a DeepMind. El viatge des de dominar un antic joc de taula fins a catalitzar descobriments científics guanyadors del Premi Nobel subratlla l'impacte profund i durador d'AlphaGo, posicionant-lo com un pilar fonamental en la recerca de la humanitat per obtenir les millors eines per avançar en la ciència, la medicina i la productivitat.

La Partida Històrica: El "Moviment 37" i l'Alba d'una Nova Era

El món va observar amb admiració el 2016 com AlphaGo s'enfrontava a la llegenda del Go Lee Sedol a Seül. El Go, amb els seus impressionants 10^170 possibles posicions al tauler —molt superiors al nombre d'àtoms de l'univers observable— havia estat considerat durant molt de temps el repte definitiu per a la IA a causa de la seva immensa complexitat i la seva dependència de la intuïció. La victòria d'AlphaGo va ser un testimoni de la seva arquitectura innovadora, que combinava xarxes neuronals profundes amb algorismes de cerca avançats i aprenentatge per reforç, un enfocament que DeepMind va ser pioner.

El moment decisiu va arribar a la Partida 2 amb el "Moviment 37". Aquesta jugada era tan poc convencional que els comentaristes professionals la van descartar inicialment com un error. No obstant això, la profunda visió d'AlphaGo els va demostrar que estaven equivocats. Cent moviments més tard, la pedra estava exactament on havia de ser perquè AlphaGo s'assegurés la victòria. Aquest moviment creatiu, aparentment contra-intuïtiu, va mostrar un sistema d'IA capaç d'anar més enllà d'imitar experts humans, demostrant la capacitat de descobrir estratègies completament noves i òptimes. Va ser una visió definitiva de la creixent capacitat de la IA per a la veritable innovació.

Més enllà del Tauler: L'Evolució i Generalització d'AlphaGo

L'èxit inicial d'AlphaGo només va ser el principi. DeepMind va evolucionar ràpidament els seus sistemes d'IA de jocs, ampliant els límits del que era possible mitjançant la millora automàtica i la generalització.

Primer va arribar AlphaGo Zero, un sistema que va aprendre el joc del Go purament mitjançant l'auto-joc, començant des de moviments completament aleatoris i sense cap dada d'experts humans. Jugant centenars de milers de partides contra si mateix, AlphaGo Zero no només va superar el seu predecessor sinó que es va convertir, sens dubte, en el jugador de Go més fort de la història, demostrant el poder de l'aprenentatge per reforç pur.

Després, AlphaZero va generalitzar aquest concepte encara més. Dissenyat per dominar qualsevol joc de dos jugadors amb informació perfecta, AlphaZero va aprendre Go, Escacs i Shogi des de zero. Donades només les regles, AlphaZero va ser capaç d'aprendre i vèncer no només els millors jugadors humans sinó també els millors programes especialitzats d'escacs de l'època, com Stockfish, en poques hores. Igual que amb el Go, la perspectiva fresca d'AlphaZero va conduir al descobriment de noves estratègies en aquests jocs llargament estudiats, demostrant l'adaptabilitat i el poder dels seus algorismes d'aprenentatge.

Aquesta ràpida progressió des del domini de jocs específics fins a l'aprenentatge generalitzat va ser un pas crític, demostrant que els principis subjacents de la IA podien aplicar-se àmpliament. La taula següent il·lustra el llinatge i l'impacte d'aquests sistemes d'IA pioners:

Sistema d'IAInnovació ClauAssoliments Clau
AlphaGoXarxes neuronals profundes, Monte Carlo Tree Search (MCTS), aprenentatge per reforçPrimera IA a vèncer un campió mundial de Go; el 'Moviment 37' va demostrar la creativitat de la IA.
AlphaGo ZeroAuto-joc des de zero, sense dades humanesEs va convertir en el jugador de Go més fort; va aprendre estratègies òptimes de manera autònoma.
AlphaZeroAlgorisme d'auto-joc generalitzat en diversos jocsVa dominar Go, Escacs i Shogi des de zero; va vèncer els millors programes especialitzats en hores.
AlphaFold 2IA per a la predicció de l'estructura de proteïnesVa resoldre el problema del plegament de proteïnes de 50 anys; va conduir al Premi Nobel; va crear una base de dades pública de proteïnes.
AlphaProofModels de llenguatge + RL/cerca d'AlphaZero per a proves formalsVa aconseguir el nivell de medalla de plata a l'Olimpíada Internacional de Matemàtiques (IMO) per al raonament matemàtic.
AlphaEvolveAgent de codificació impulsat per Gemini per al descobriment d'algorismesVa descobrir un nou algorisme més eficient de multiplicació de matrius; potencial per a l'optimització de centres de dades.
Gemini DeepThinkRaonament multimodal, cerca i planificació inspirats en AlphaGoVa aconseguir el nivell de medalla d'or a l'IMO; aplicat a reptes científics i d'enginyeria complexos i oberts.

Catalitzant Avenços Científics: De Proteïnes a Demostracions

La veritable visió darrere d'AlphaGo sempre va ser accelerar el descobriment científic. Demostrant la seva capacitat per navegar per l'enorme espai de cerca del Go, va mostrar el potencial de la IA per comprendre les vastes complexitats del món físic. Aquesta filosofia es va traduir ràpidament en avenços científics tangibles.

El 2020, DeepMind va resoldre un dels "grans reptes" de la biologia: el problema del plegament de proteïnes. Durant 50 anys, els científics havien lluitat per predir les estructures 3D de les proteïnes, essencials per entendre malalties i desenvolupar nous medicaments. AlphaFold 2, un descendent directe dels principis d'AlphaGo, va predir amb èxit aquestes estructures intricades. Aquest assoliment monumental va portar al plegament dels 200 milions de proteïnes conegudes per la ciència, posades a disposició gratuïta en una base de dades de codi obert utilitzada per més de 3 milions d'investigadors a tot el món. Aquest treball innovador va valdre a John Jumper i Demis Hassabis el Premi Nobel de Química el 2024, en nom de l'equip d'AlphaFold, consolidant el paper de la IA en la recerca científica transformadora.

La influència d'AlphaGo es va estendre encara més a diversos dominis científics i matemàtics:

  • Raonament Matemàtic: AlphaProof, heretant directament l'ADN arquitectònic d'AlphaGo, va aprendre a demostrar enunciats matemàtics formals. Combinant models de llenguatge amb l'aprenentatge per reforç i la cerca d'AlphaZero, va aconseguir un nivell de medalla de plata a l'IMO. El mode avançat Deep Think dins dels últims models multimodals de DeepMind, com ara Gemini 3.1 Pro, ha aconseguit des de llavors un rendiment de medalla d'or a l'IMO de 2025, mostrant mètodes inspirats en AlphaGo que desbloquegen el raonament matemàtic avançat.

  • Descobriment d'Algorismes: Inspirat per la cerca d'AlphaGo de moviments òptims, AlphaEvolve explora l'espai del codi informàtic per descobrir algorismes més eficients. Va experimentar el seu propi moment de "Moviment 37" en trobar una manera nova de multiplicar matrius, una operació fonamental que sustenta les xarxes neuronals modernes, prometent optimitzacions per a àrees que van des de la gestió de centres de dades fins a la computació quàntica.

  • Col·laboració Científica: Els principis de cerca i raonament d'AlphaGo estan ara integrats en els co-científics d'IA. Aquests sistemes poden 'debatre' idees científiques, identificar patrons en les dades i generar hipòtesis de manera independent. Un estudi de validació a l'Imperial College London va veure un co-científic d'IA derivar de manera independent la mateixa hipòtesi sobre la resistència antimicrobiana que els investigadors havien trigat anys a desenvolupar.

Aquestes aplicacions, juntament amb els esforços per comprendre millor el genoma, avançar en la investigació de l'energia de fusió i millorar la predicció meteorològica, subratllen com AlphaGo va establir les bases perquè la IA es convertís en una eina indispensable en el mètode científic.

El Camí cap a l'AGI: El Model d'AlphaGo per al Futur de la IA

Tot i ser impressionants, molts dels models científics de DeepMind estan altament especialitzats. L'objectiu final, inspirat en el viatge d'AlphaGo, és construir sistemes d'IA generals que puguin trobar estructures i connexions subjacents en diversos camps – el que es coneix com Intel·ligència Artificial General (AGI).

Perquè una IA sigui veritablement general, ha d'entendre el món físic en la seva totalitat. Això requereix multimodalitat, un principi de disseny fonamental darrere dels models Gemini de DeepMind. Gemini entén no només el llenguatge, sinó també àudio, vídeo, imatges i codi, construint un model més complet del món. De manera crucial, els últims models Gemini empren tècniques pioneres amb AlphaGo i AlphaZero per pensar i raonar a través d'aquestes modalitats.

La propera generació de sistemes d'IA també requerirà la capacitat de fer servir eines especialitzades, de la mateixa manera que un expert humà utilitza diferents instruments per a diferents tasques. Per exemple, un sistema AGI que necessiti informació sobre l'estructura de proteïnes podria aprofitar AlphaFold. Es preveu que la combinació dels models multimodals del món de Gemini, les robustes tècniques de cerca i planificació d'AlphaGo, i l'ús estratègic d'eines d'IA especialitzades sigui fonamental per aconseguir l'AGI. Això senyalitza un futur on l'era de la IA com a text ha acabat, amb agents intel·ligents realitzant accions complexes i del món real.

La veritable creativitat, la que es va vislumbrar en el "Moviment 37", segueix sent una capacitat clau per a l'AGI. Un sistema AGI no només idearia una nova estratègia de Go; inventaria un joc tan profund i elegant com el Go mateix. Deu anys després, l'espurna creativa que va encendre per primera vegada el moviment decisiu d'AlphaGo ha catalitzat una cascada d'avenços, tots convergint per obrir el camí cap a l'AGI i inaugurar el que promet ser una nova edat d'or del descobriment científic.

Preguntes freqüents

What was the significance of AlphaGo's victory in 2016?
AlphaGo's victory over Go world champion Lee Sedol in 2016 was a monumental achievement that marked the beginning of the modern AI era. It demonstrated that AI systems could not only mimic human expertise but also develop novel, creative strategies that surprised even professional players, such as the famous 'Move 37'. This breakthrough shattered previous timelines for AI development, proving its potential to tackle problems of immense complexity and paving the way for applications in real-world scientific domains beyond games, signaling a profound shift in technological capabilities and expectations for AI.
How did AlphaGo's methodology evolve after its initial success?
Following its initial success, AlphaGo's methodology rapidly evolved with the introduction of AlphaGo Zero and AlphaZero. AlphaGo Zero learned to play Go from completely random play without any human data, relying solely on self-play reinforcement learning, becoming the strongest Go player in history. AlphaZero then generalized this approach, mastering multiple two-player perfect information games like Chess and Shogi from scratch, demonstrating that the underlying principles of deep neural networks, advanced search, and reinforcement learning could be applied across diverse complex domains without prior specific game knowledge, proving the robustness of the approach.
What is AlphaFold and how does it relate to AlphaGo's legacy?
AlphaFold 2 is a DeepMind AI system that solved the 50-year-old grand challenge of predicting the 3D structure of proteins. It directly relates to AlphaGo's legacy by applying similar foundational principles of navigating vast search spaces to a complex scientific problem. Just as AlphaGo mastered the intricate possibilities on a Go board, AlphaFold navigates the combinatorial explosion of protein folding configurations. Its success led to the folding of all 200 million known proteins and earned a Nobel Prize for its creators, illustrating how game-playing AI research can catalyze profound breakthroughs in fields like biology and medicine.
Beyond protein folding, what other scientific fields has AlphaGo's approach influenced?
AlphaGo's groundbreaking approach has influenced numerous scientific fields beyond protein folding. Its principles of deep reinforcement learning and advanced search have been applied to mathematical reasoning with systems like AlphaProof, which achieved silver medal standard at the IMO, and Gemini's Deep Think mode, which achieved gold. It also inspired AlphaEvolve, a coding agent discovering efficient algorithms, and the development of AI co-scientists capable of debating hypotheses and accelerating research in areas like antimicrobial resistance, understanding the genome, fusion energy research, and improving weather prediction.
How is AlphaGo's work contributing to the development of Artificial General Intelligence (AGI)?
AlphaGo's work is critically contributing to the development of Artificial General Intelligence (AGI) by providing foundational techniques for complex problem-solving, search, and reinforcement learning. Its ability to learn novel strategies and generalize across domains is seen as a blueprint for AGI. DeepMind's Gemini models, designed to be multimodal and understand various data types, integrate AlphaGo's search and planning techniques. The goal is to combine world models, advanced search, and specialized AI tools to achieve true creativity and general reasoning capabilities that can tackle unknown scientific and engineering challenges, moving beyond specialized AI systems.
What is 'Move 37' and why is it so significant in AI history?
'Move 37' refers to a specific, unconventional move made by AlphaGo during its second game against Lee Sedol in 2016. Professional Go commentators initially believed it to be a mistake due to its departure from established human strategies. However, it proved to be a decisive, far-sighted move that positioned AlphaGo for victory. Its significance lies in demonstrating AI's capacity for genuine creativity and strategic innovation, not just mimicking human experts but surpassing them with entirely new approaches. It became a powerful symbol of AI's potential to think 'outside the box' and hinted at the future ability of AI to redefine problem-solving across various disciplines.

Manteniu-vos al dia

Rebeu les últimes notícies d'IA al correu.

Compartir