Henkisen työn automatisointi tekoälyagenttien avulla
Ohjelmistokehityksen nopeasti kehittyvässä maisemassa tehokkuuden tavoittelu johtaa usein mullistaviin innovaatioihin. Tekoälytutkija Tyler McGoffin kuvaili äskettäin matkan, joka ilmentää tätä henkeä: hän automatisoi henkisen työn agenttipohjaisen kehityksen avulla GitHub Copilotin kanssa. Kyse ei ole vain nopeammasta koodauksesta, vaan kehittäjän roolin perusteellisesta muuttamisesta toistuvasta analyysistä luovaan ongelmanratkaisuun ja strategiseen valvontaan. McGoffinin kokemus korostaa insinöörien keskuudessa tuttua kaavaa – työkalujen rakentamista puuduttavan työn poistamiseksi – mutta vie sen askeleen pidemmälle uskomalla tekoälyagenteille monimutkaisia analyyttisiä tehtäviä, joita oli aiemmin mahdotonta skaalata manuaalisesti.
McGoffinin inspiraatio johtui hänen työnsä kriittisestä, mutta ylivoimaisesta osasta: koodausagenttien suorituskyvyn analysoinnista vertailuarvoja, kuten TerminalBench2:a ja SWEBench-Pro:ta, vastaan. Tämä edellytti "trajektorien" – agentin ajatusprosessien ja toimien yksityiskohtaisten JSON-lokien – analysointia, joka saattoi nousta satoihin tuhansiin koodiriveihin useissa tehtävissä ja vertailuarvojen suorituskerroissa. Vaikka GitHub Copilot auttoi jo kuvioiden tunnistamisessa, tämän analyyttisen silmukan toistuva luonne vaati täydellistä automaatiota. Tämä johti "eval-agents" -järjestelmän luomiseen, joka on suunniteltu automatisoimaan tämä henkinen taakka ja auttamaan hänen Copilot Applied Science -tiimiään saavuttamaan samanlaisia tehokkuuksia.
Agenttipohjaisen kehityksen suunnitelma
"Eval-agents" -järjestelmän syntyä ohjasivat selkeät periaatteet, jotka keskittyivät yhteistyöhön ja skaalautuvuuteen. McGoffin pyrki tekemään näistä tekoälyagenteista helppoja jakaa, yksinkertaisia luoda ja ensisijaisen välineen tiimin panoksille. Nämä tavoitteet heijastavat GitHubin ydinarvoja, erityisesti niitä, jotka hioutuivat hänen kokemuksessaan GitHub CLI:n OSS-ylläpitäjänä. Kuitenkin juuri kolmas tavoite – koodausagenttien tekeminen ensisijaiseksi kontribuoijaksi – muokkasi hankkeen suuntaa ja avasi odottamattomia etuja kahdelle ensimmäiselle.
Agenttipohjainen koodausympäristö hyödynsi useita tehokkaita työkaluja kehitysprosessin virtaviivaistamiseksi:
- Koodausagentti: Copilot CLI, joka tarjoaa suoran vuorovaikutuksen ja hallinnan.
- Käytetty malli: Claude Opus 4.6, joka tarjoaa edistyneitä päättely- ja koodinluontikykyjä.
- IDE: VSCode, joka toimii kehityksen keskeisenä työtilana.
Ratkaisevaa oli, että Copilot SDK oli avainasemassa, tarjoten pääsyn olemassa oleviin työkaluihin, MCP-palvelimiin ja mekanismeihin uusien työkalujen ja taitojen rekisteröimiseksi. Tämä perusta poisti tarpeen keksiä uudelleen ydinagenttitoimintoja, jolloin tiimi saattoi keskittyä sovelluskohtaiseen logiikkaan. Tämä integroitu ympäristö edisti nopeaa kehityssykliä ja osoitti, että oikealla asennuksella tekoälyagentit voivat paitsi auttaa myös ohjata merkittäviä osia kehitystyöstä.
Agenttipohjaisen koodauksen ydinperiaatteet
Siirtyminen agenttipohjaiseen malliin vaatii muutakin kuin vain työkaluja; se vaatii muutosta metodologiassa. McGoffin tunnisti kolme ydinperiaatetta, jotka osoittautuivat perustavanlaatuisiksi kehityksen nopeuttamisessa ja yhteistyön edistämisessä:
- Kehote-strategiat: Tehokas vuorovaikutus agenttien kanssa tarkoittaa keskustelevaa, sanallista ja suunnitteluun painottuvaa lähestymistapaa.
- Arkkitehtuuristrategiat: Puhdas, hyvin dokumentoitu ja refaktoroitu koodikanta on ensiarvoisen tärkeä, jotta agentit voivat tehokkaasti ymmärtää sitä ja osallistua siihen.
- Iterointistrategiat: 'Syyttää prosessia, ei agentteja' -ajattelutavan omaksuminen, samoin kuin syyttämättömässä kulttuurissa, mahdollistaa nopean kokeilun ja oppimisen.
Nämä strategiat, kun niitä sovellettiin johdonmukaisesti, johtivat hämmästyttäviin tuloksiin. Tämän tehokkuuden osoituksena viisi uutta osallistujaa lisäsi vain kolmessa päivässä yhteensä 11 uutta agenttia, neljä uutta taitoa ja toi projektiin 'eval-agent workflows' -konseptin. Tämä yhteistyöhön perustuva sprintti johti huomattavaan +28 858 / -2 884 koodirivin muutokseen 345 tiedostossa, osoittaen github-agentic-workflows -käytännön syvällisen vaikutuksen.
Tässä yhteenveto ydinperiaatteista:
| Periaate | Kuvaus | Hyöty agenttipohjaisessa kehityksessä |
|---|---|---|
| Kehotteiden antaminen | Käsittele agentteja kuin vanhempia insinöörejä: ohjaa heidän ajatteluaan, selitä oletukset liiankin yksityiskohtaisesti, hyödynnä suunnittelutiloja (/plan) ennen toteutusta. Ole keskusteleva ja yksityiskohtainen. | Johtaa tarkempiin ja relevantimpiin tuloksiin, auttaen agentteja ratkaisemaan monimutkaisia ongelmia tehokkaasti. |
| Arkkitehtuuri | Priorisoi refaktorointi, kattava dokumentaatio ja vankka testaus. Pidä koodikanta puhtaana, luettavana ja hyvin jäsenneltynä. Siivoa aktiivisesti kuollutta koodia. | Antaa agenttien ymmärtää koodikannan, sen mallit ja olemassa olevat toiminnot, mikä helpottaa tarkkoja panoksia. |
| Iterointi | Omaksu 'syyttää prosessia, ei agentteja' -ajattelutapa. Toteuta suojatoimia (tiukka tyypitys, lintterit, laajat testit) virheiden estämiseksi. Opi agenttien virheistä parantamalla prosesseja ja suojatoimia. | Edistää nopeaa iterointia, rakentaa luottamusta agenttien panoksiin ja parantaa jatkuvasti kehitysketjua. |
Kehityksen nopeuttaminen: Strategiat käytännössä
Tämän agenttipohjaisen lähestymistavan menestys perustuu näiden periaatteiden käytännön soveltamiseen.
Kehote-strategiat: Tekoälyinsinöörin ohjaaminen
Vaikka tekoälykoodausagentit ovat tehokkaita, ne loistavat hyvin rajatuissa ongelmissa. Monimutkaisempiin tehtäviin ne tarvitsevat ohjausta, aivan kuten nuoremmat insinöörit. McGoffin havaitsi, että keskusteleva tyyli, oletusten selittäminen ja suunnittelutilojen hyödyntäminen olivat paljon tehokkaampia kuin lyhyet komennot. Esimerkiksi, kun lisättiin vankkoja regressiotestejä, kehote kuten /plan Olen äskettäin huomannut Copilotin päivittävän mielellään testejä sopimaan uusiin paradigmoihinsa, vaikka näitä testejä ei pitäisi päivittää. Miten voin luoda varatun testitilan, jota Copilot ei voi koskea tai jonka se on varattava suojaamaan regressioilta? käynnisti tuotteliaan vuoropuhelun. Tämä edestakainen vuorovaikutus, usein tehokkaan claude-opus-4-6 -mallin kanssa, johti kehittyneisiin ratkaisuihin, kuten sopimustestauksen suojatoimiin, joita vain ihmisinsinöörit pystyivät päivittämään, varmistaen kriittisen toiminnallisuuden suojan.
Arkkitehtuuristrategiat: Tekoälyavusteisen laadun perusta
Ihmisinsinööreille puhtaan koodikannan ylläpitäminen, testien kirjoittaminen ja ominaisuuksien dokumentointi jäävät usein taka-alalle ominaisuuspaineiden alla. Agenttipohjaisessa kehityksessä näistä tulee ensiarvoisen tärkeitä. McGoffin havaitsi, että refaktorointiin, dokumentointiin ja testitapausten lisäämiseen käytetty aika paransi merkittävästi Copilotin kykyä navigoida koodikannassa ja osallistua siihen. Agentti-ensimmäinen repositorion menestys perustuu selkeyteen. Tämä antaa kehittäjille mahdollisuuden kysyä Copilotilta jopa "Tietäen mitä tiedän nyt, miten suunnittelisin tämän toisin?", muuttaen teoreettiset refaktoroinnit saavutettaviksi projekteiksi tekoälyavun avulla. Tämä jatkuva keskittyminen arkkitehtuurin terveyteen varmistaa, että uudet ominaisuudet voidaan toimittaa vaivattomasti.
Iterointistrategiat: Prosessiin luottaminen, ei vain agenttiin
Tekoälymallien kehitys on muuttanut ajattelutavan "luota mutta tarkista" -asenteesta luottavaisempaan, samalla tavalla kuin tehokkaat tiimit toimivat "syyttää prosessia, ei ihmisiä" -filosofian mukaisesti. Tämä "syyttämätön kulttuuri" agenttipohjaisessa kehityksessä tarkoittaa, että kun tekoälyagentti tekee virheen, reaktio on parantaa taustalla olevia prosesseja ja suojatoimia sen sijaan, että syytettäisiin itse agenttia. Tähän kuuluu tiukkojen CI/CD-käytäntöjen käyttöönotto: tiukka tyypitys rajapintojen yhteensopivuuden varmistamiseksi, vankat lintterit koodin laadun takaamiseksi sekä laajat integraatio-, päästä päähän- ja sopimustestit. Vaikka näiden testien rakentaminen manuaalisesti voi olla kallista, agenttiavus tekee niistä paljon edullisempia toteuttaa, tarjoten kriittisen luottamuksen uusiin muutoksiin. Ottamalla käyttöön nämä järjestelmät kehittäjät antavat Copilotille mahdollisuuden tarkistaa omaa työtään, heijastaen sitä, miten nuorempi insinööri asetetaan menestymään.
Agenttipohjaisen kehityssyklin hallitseminen
Näiden periaatteiden integroiminen käytännön työnkulkuun luo tehokkaan ja nopeutetun kehityssyklin:
- Suunnittele Copilotin kanssa: Aloita uudet ominaisuudet
/plan-komennolla. Iteroi suunnitelmaa varmistaen, että testit ja dokumentaatiopäivitykset sisällytetään ja suoritetaan ennen koodin toteutusta. Dokumentaatio voi toimia lisäohjeena agentille. - Toteuta Autopilotin avulla: Anna Copilotin toteuttaa ominaisuus
/autopilot-komennolla hyödyntäen sen koodinluontikykyjä. - Tarkista Copilot Code Review'n avulla: Kehota Copilotia aloittamaan tarkistussykli. Tämä sisältää Copilot Code Review -agentin pyytämisen, sen kommenttien käsittelyn ja tarkistusten pyytämisen uudelleen, kunnes ongelmat on ratkaistu.
- Ihmisen suorittama tarkistus: Suorita lopullinen ihmisen suorittama tarkistus varmistaaksesi, että mallit noudatetaan ja monimutkaiset päätökset vastaavat strategista tarkoitusta.
Ominaisuussyklin ulkopuolella jatkuva optimointi on avainasemassa. McGoffin kehottaa säännöllisesti Copilotia komennoilla, kuten /plan Tarkista koodista puuttuvat testit, mahdollisesti rikkinäiset testit ja kuollut koodi tai /plan Tarkista dokumentaatio ja koodi puuttuvien dokumentaatiokohtien varalta. Nämä tarkistukset, jotka suoritetaan viikoittain tai uusien ominaisuuksien integroinnin yhteydessä, varmistavat, että agenttipohjainen kehitysympäristö pysyy terveenä ja tehokkaana.
Ohjelmistokehityksen tulevaisuus tekoälyn avulla
Se, mikä alkoi henkilökohtaisena pyrkimyksenä automatisoida turhauttava analyysitehtävä, on kehittynyt uudeksi ohjelmistokehityksen toimintamalliksi. Agenttipohjainen kehitys, jota edistävät työkalut kuten GitHub Copilot ja kehittyneet mallit kuten Claude Opus, ei ainoastaan tee kehittäjistä nopeampia; se muuttaa perusteellisesti tekoälytutkijoiden ja ohjelmistosuunnittelijoiden työn luonnetta. Siirtämällä henkistä työtä älykkäille agenteille tiimit voivat saavuttaa ennennäkemättömän tuottavuuden, yhteistyön ja innovaation tason, keskittyen lopulta luoviin ja strategisiin haasteisiin, jotka todella edistävät edistystä. Tämä lähestymistapa ennustaa jännittävää tulevaisuutta, jossa tekoälyagentit eivät ole vain työkaluja, vaan olennainen osa kehitystiimiä, muuttaen tapaamme rakentaa ja ylläpitää ohjelmistoja.
Alkuperäinen lähde
https://github.blog/ai-and-ml/github-copilot/agent-driven-development-in-copilot-applied-science/Usein kysytyt kysymykset
What is agent-driven development in the context of GitHub Copilot?
How did the 'eval-agents' project originate?
What are the key components of an agentic coding setup for this approach?
What prompting strategies are most effective when working with AI coding agents?
Why are architectural strategies like refactoring and documentation crucial for agent-driven development?
How does a 'blameless culture' apply to iteration strategies in agent-driven development?
What is the typical development loop when using agent-driven development?
What kind of impact did agent-driven development have on team productivity and collaboration?
Pysy ajan tasalla
Saa uusimmat tekoälyuutiset sähköpostiisi.
