Outomatisering van Intellektuele Moeite met KI-agente
In die vinnig-ontwikkelende landskap van sagteware-ingenieurswese, lei die strewe na doeltreffendheid dikwels tot baanbrekende innovasies. Tyler McGoffin, 'n KI-navorser, het onlangs 'n reis beskryf wat hierdie gees tipeer: die outomatisering van sy intellektuele moeite deur middel van agent-gedrewe ontwikkeling met GitHub Copilot. Dit gaan nie net oor vinniger kodering nie; dit gaan oor die fundamentele verskuiwing van die ontwikkelaar se rol van herhalende analise na kreatiewe probleemoplossing en strategiese toesig. McGoffin se ervaring beklemtoon 'n bekende patroon onder ingenieurs—die bou van gereedskap om sleurwerk uit te skakel—maar neem dit 'n stap verder deur KI-agente met komplekse analitiese take toe te vertrou wat voorheen onmoontlik was om handmatig te skaal.
McGoffin se inspirasie het gespruit uit 'n kritieke, dog oorweldigende, aspek van sy werk: die analise van koderingsagentprestasie teen maatstawwe soos TerminalBench2 en SWEBench-Pro. Dit het behels die ontleding van 'trajekte'—gedetailleerde JSON-logboeke van 'n agent se denkprosesse en aksies—wat kon neerkom op honderdduisende reëls kode oor talle take en maatstafuitvoerings. Terwyl GitHub Copilot reeds gehelp het met patroonherkenning, het die herhalende aard van hierdie analitiese lus gesmeek vir volle outomatisering. Dit het gelei tot die skepping van 'eval-agents,' 'n stelsel wat ontwerp is om hierdie intellektuele las te outomatiseer, wat sy span in Copilot Applied Science bemagtig het om soortgelyke doeltreffendhede te bereik.
Die Bloudruk vir Agent-gedrewe Ontwikkeling
Die ontstaan van 'eval-agents' is gelei deur 'n duidelike stel beginsels wat fokus op samewerking en skaalbaarheid. McGoffin het daarna gestreef om hierdie KI-agente maklik deelbaar, eenvoudig om te skryf, en die primêre voertuig vir spanbydraes te maak. Hierdie doelwitte weerspieël GitHub se kernwaardes, veral dié wat geslyp is tydens sy ervaring as 'n OSE-onderhouer vir die GitHub CLI. Dit was egter die derde doelwit—om koderingsagente die primêre bydraer te maak—wat die projek se rigting werklik gevorm het en onverwagte voordele vir die eerste twee ontsluit het.
Die agentiese koderingsopstelling het verskeie kragtige gereedskap benut om die ontwikkelingsproses te stroomlyn:
- Koderingsagent: Copilot CLI, wat direkte interaksie en beheer bied.
- Model gebruik: Claude Opus 4.6, wat gevorderde redeneer- en kodegenereringsvermoëns bied.
- GOE: VSCode, wat dien as die sentrale werkruimte vir ontwikkeling.
Deurslaggewend was die Copilot SDK instrumenteel, wat toegang bied tot bestaande gereedskap, MCP-bedieners, en meganismes om nuwe gereedskap en vaardighede te registreer. Hierdie fondament het die noodsaaklikheid uitgeskakel om kern agentiese funksionaliteite te herontwerp, wat die span in staat gestel het om op toepassingspesifieke logika te fokus. Hierdie geïntegreerde omgewing het 'n vinnige ontwikkelingslus bevorder, wat bewys dat, met die regte opstelling, KI-agente nie net kon assisteer nie, maar ook beduidende gedeeltes van die ontwikkelingspoging kon aandryf.
Kernbeginsels vir Effektiewe Agentiese Kodering
Die oorgang na 'n agent-gedrewe paradigma vereis meer as net gereedskap; dit verg 'n verskuiwing in metodologie. McGoffin het drie kernbeginsels geïdentifiseer wat fundamenteel was vir die versnelling van ontwikkeling en die bevordering van samewerking:
- Aanstuurstrategieë: Effektiewe interaksie met agente beteken gespreksgeoriënteerd, breedvoerig en die prioritering van beplanning.
- Argitektoniese Strategieë: 'n Skoon, goed gedokumenteerde en herfaktoreerde kodebasis is van die uiterste belang vir agente om effektief te navigeer en daartoe by te dra.
- Iterasiestrategieë: Die omhelsing van 'n "proses blameer, nie agente nie"-ingesteldheid, soortgelyk aan 'n blaamlose kultuur, maak vinnige eksperimentering en leer moontlik.
Hierdie strategieë, wanneer dit konsekwent toegepas word, het tot verstommende resultate gelei. As 'n bewys van hierdie doeltreffendheid, het vyf nuwe bydraers, binne net drie dae, gesamentlik 11 nuwe agente, vier nuwe vaardighede bygevoeg, en die konsep van 'eval-agent werkvloeie' aan die projek bekendgestel. Hierdie samewerkende naelloop het gelei tot 'n merkwaardige +28,858/-2,884 reëls kode-verandering oor 345 lêers, wat die diepgaande impak van github-agentic-workflows in die praktyk demonstreer.
Hier is 'n opsomming van die kernbeginsels:
| Beginsels | Beskrywing | Voordeel vir Agent-gedrewe Ontwikkeling |
|---|---|---|
| Aanstuur | Behandel agente soos senior ingenieurs: lei hul denke, oorverklaar aannames, benut beplanningsmodusse (/plan) voor uitvoering. Wees gespreksgeoriënteerd en gedetailleerd. | Lei tot meer akkurate en relevante uitsette, wat agente help om komplekse probleme effektief op te los. |
| Argitektonies | Prioritiseer herfaktorering, omvattende dokumentasie en robuuste toetsing. Hou die kodebasis skoon, leesbaar en goed gestruktureer. Ruim aktief dooie kode op. | Stel agente in staat om die kodebasis, patrone en bestaande funksionaliteit te verstaan, wat akkurate bydraes fasiliteer. |
| Iterasie | Pas 'n "proses blameer, nie agente nie"-ingesteldheid toe. Implementeer voorsorgmaatreëls (streng tipering, lintere, uitgebreide toetse) om foute te voorkom. Leer uit agentfoute deur prosesse en voorsorgmaatreëls te verbeter. | Bevorder vinnige iterasie, bou vertroue in agentbydraes, en verbeter voortdurend die ontwikkelingspyplyn. |
Versnelling van Ontwikkeling: Strategieë in Aksie
Die sukses van hierdie agent-gedrewe benadering is gewortel in die praktiese toepassing van hierdie beginsels.
Aanstuurstrategieë: Begeleiding van die KI-ingenieur
KI-koderingsagente, hoewel kragtig, blink uit in goed-gedefinieerde probleme. Vir meer komplekse take, benodig hulle leiding, baie soos junior ingenieurs. McGoffin het gevind dat 'n gespreksgeoriënteerde styl, die verduideliking van aannames, en die benutting van beplanningsmodusse baie meer effektief was as bondige opdragte. Byvoorbeeld, toe robuuste regressietoetse bygevoeg is, het 'n prompt soos /plan Ek het onlangs opgemerk hoe Copilot geredelik toetse opdateer om by sy nuwe paradigmas te pas, alhoewel daardie toetse nie opgedateer moes word nie. Hoe kan ek 'n gereserveerde toetsruimte skep wat Copilot nie kan raak nie, of moet reserveer om teen regressies te beskerm? 'n produktiewe dialoog geïnisieer. Hierdie heen-en-weer, dikwels met die kragtige claude-opus-4-6-model, het gelei tot gesofistikeerde oplossings soos kontraktoets-voorsorgmaatreëls, wat slegs menslike ingenieurs kon opdateer, om te verseker dat kritieke funksionaliteit beskerm bly.
Argitektoniese Strategieë: Die Grondslag van KI-ondersteunde Kwaliteit
Vir menslike ingenieurs word die instandhouding van 'n skoon kodebasis, die skryf van toetse en die dokumentasie van kenmerke dikwels agterweë gelaat onder kenmerk-druk. In agent-gedrewe ontwikkeling word dit van die uiterste belang. McGoffin het ontdek dat die spandeer van tyd aan herfaktorering, dokumentasie en die byvoeging van toetsgevalle Copilot se vermoë om die kodebasis te navigeer en daartoe by te dra, dramaties verbeter het. 'n Agent-eerste bewaarplek floreer op duidelikheid. Dit stel ontwikkelaars in staat om selfs Copilot met vrae te prompt soos "As ek nou weet wat ek weet, hoe sou ek dit anders ontwerp?", wat teoretiese herfaktoreerprojekte in uitvoerbare projekte met KI-bystand omskep. Hierdie deurlopende fokus op argitektoniese gesondheid verseker dat nuwe kenmerke met gemak gelewer kan word.
Iterasiestrategieë: Vertrou die Proses, Nie Net die Agent Nie
Die evolusie van KI-modelle het die ingesteldheid verskuif van "vertrou maar verifieer" na 'n meer vertrouende houding, analoog aan hoe effektiewe spanne opereer met 'n "proses blameer, nie mense nie"-filosofie. Hierdie "blaamlose kultuur" in agent-gedrewe ontwikkeling beteken dat wanneer 'n KI-agent 'n fout maak, die reaksie is om die onderliggende prosesse en voorsorgmaatreëls te verbeter, eerder as om die agent self te blameer. Dit behels die implementering van streng CI/CD-praktyke: streng tipering om koppelvlakkonformiteit te verseker, robuuste lintere vir kodekwaliteit, en uitgebreide integrasie-, end-tot-end- en kontraktoetse. Hoewel die handmatige bou van hierdie toetse duur kan wees, maak agentbystand dit veel goedkoper om te implementeer, wat kritiese vertroue in nuwe veranderinge bied. Deur hierdie stelsels op te stel, bemagtig ontwikkelaars Copilot om sy eie werk te kontroleer, wat weerspieël hoe 'n junior ingenieur vir sukses opgestel word.
Beheersing van die Agent-gedrewe Ontwikkelingslus
Die integrasie van hierdie beginsels in 'n praktiese werkvloei skep 'n kragtige, versnelde ontwikkelingslus:
- Beplan met Copilot: Begin nuwe kenmerke deur
/plante gebruik. Herhaal die plan en verseker dat toetse en dokumentasie-opdaterings ingesluit en voltooi is voor kode-implementering. Dokumentasie kan dien as 'n bykomende stel riglyne vir die agent. - Implementeer met Autopilot: Laat Copilot die kenmerk implementeer deur
/autopilotte gebruik, en benut sy kodegenereringsvermoëns. - Hersien met Copilot Kodehersiening: Prompt Copilot om 'n hersieningslus te begin. Dit behels die aanvra van die Copilot Kodehersieningsagent, die aanspreek van sy kommentaar, en die heraanvra van hersienings totdat probleme opgelos is.
- Menslike Hersiening: Voer 'n finale menslike hersiening uit om te verseker dat patrone afgedwing word en komplekse besluite ooreenstem met strategiese bedoeling.
Buite die kenmerklus is deurlopende optimisering die sleutel. McGoffin prompt Copilot gereeld met opdragte soos /plan Hersien die kode vir enige ontbrekende toetse, enige toetse wat gebreek mag wees, en dooie kode of /plan Hersien die dokumentasie en kode om enige dokumentasiegapings te identifiseer. Hierdie kontroles, wat weekliks of soos nuwe kenmerke geïntegreer word, verseker dat die agent-gedrewe ontwikkelingsomgewing gesond en doeltreffend bly.
Die Toekoms van Sagteware-ingenieurswese met KI
Wat begin het as 'n persoonlike soektog om 'n frustrerende ontledings taak te outomatiseer, het ontwikkel tot 'n nuwe paradigma vir sagteware-ontwikkeling. Agent-gedrewe ontwikkeling, aangedryf deur gereedskap soos GitHub Copilot en gevorderde modelle soos Claude Opus, gaan nie net daaroor om ontwikkelaars vinniger te maak nie; dit gaan oor die fundamentele verandering van die aard van werk vir KI-navorsers en sagteware-ingenieurs. Deur intellektuele moeite na intelligente agente af te laai, kan spanne ongekende vlakke van produktiwiteit, samewerking en innovasie bereik, en uiteindelik fokus op die kreatiewe en strategiese uitdagings wat werklik vooruitgang aandryf. Hierdie benadering voorspel 'n opwindende toekoms waar KI-agente nie net gereedskap is nie, maar integrale lede van die ontwikkeling span, wat verander hoe ons sagteware bou en onderhou.
Oorspronklike bron
https://github.blog/ai-and-ml/github-copilot/agent-driven-development-in-copilot-applied-science/Gereelde Vrae
What is agent-driven development in the context of GitHub Copilot?
How did the 'eval-agents' project originate?
What are the key components of an agentic coding setup for this approach?
What prompting strategies are most effective when working with AI coding agents?
Why are architectural strategies like refactoring and documentation crucial for agent-driven development?
How does a 'blameless culture' apply to iteration strategies in agent-driven development?
What is the typical development loop when using agent-driven development?
What kind of impact did agent-driven development have on team productivity and collaboration?
Bly op hoogte
Kry die nuutste KI-nuus in jou inkassie.
