Intelektuālā darba automatizēšana ar AI aģentiem
Strauji mainīgajā programmatūras inženierijas ainā efektivitātes meklējumi bieži noved pie revolucionārām inovācijām. Tailers Makgoffins (Tyler McGoffin), AI pētnieks, nesen detalizēti aprakstīja ceļojumu, kas iemieso šo garu: sava intelektuālā darba automatizēšana, izmantojot aģentu vadītu izstrādi ar GitHub Copilot. Tas nav tikai par ātrāku kodēšanu; tas ir par fundamentālu izstrādātāja lomas maiņu no atkārtotas analīzes uz radošu problēmu risināšanu un stratēģisku pārraudzību. Makgoffina pieredze izceļ pazīstamu inženieru paradumu — veidot rīkus, lai novērstu smagu darbu —, taču viņš to paceļ jaunā līmenī, uzticot AI aģentiem sarežģītus analītiskos uzdevumus, kurus iepriekš nebija iespējams manuāli mērogot.
Makgoffina iedvesma radās no viņa darba kritiskā, taču milzīgā aspekta: kodēšanas aģenta veiktspējas analīze pret etalonos, piemēram, TerminalBench2 un SWEBench-Pro. Tas ietvēra 'trajektoriju' — detalizētu JSON žurnālu par aģenta domāšanas procesiem un darbībām — sadalīšanu, kas varēja veidot simtiem tūkstošu koda rindiņu daudzos uzdevumos un etalonu izpildēs. Lai gan GitHub Copilot jau palīdzēja modeļu atpazīšanā, šī analītiskā cikla atkārtotais raksturs prasīja pilnīgu automatizāciju. Tas noveda pie 'eval-agents' izveides — sistēmas, kas paredzēta šī intelektuālā sloga automatizēšanai, dodot iespēju viņa komandai Copilot Applied Science sasniegt līdzīgu efektivitāti.
Aģentu vadītas izstrādes plāns
Projekta 'eval-agents' aizsākumu vadīja skaidrs principu kopums, kas vērsts uz sadarbību un mērogojamību. Makgoffins vēlējās padarīt šos AI aģentus viegli koplietojamus, vienkāršus veidošanā un primāro līdzekli komandas ieguldījumiem. Šie mērķi atspoguļo GitHub pamatvērtības, īpaši tās, kas tika pilnveidotas viņa pieredzē kā OSS uzturētājam GitHub CLI. Tomēr tieši trešais mērķis — padarīt kodēšanas aģentus par primārajiem veicinātājiem — patiesi veidoja projekta virzienu un sniedza negaidītus ieguvumus pirmajiem diviem.
Aģentiskās kodēšanas iestatīšana izmantoja vairākus jaudīgus rīkus, lai racionalizētu izstrādes procesu:
- Kodēšanas aģents: Copilot CLI, nodrošinot tiešu mijiedarbību un kontroli.
- Izmantotais modelis: Claude Opus 4.6, piedāvājot uzlabotas spriešanas un koda ģenerēšanas iespējas.
- IDE: VSCode, kas kalpo kā centrālā darba telpa izstrādei.
Būtiski, ka Copilot SDK bija izšķirošs, nodrošinot piekļuvi esošajiem rīkiem, MCP serveriem un mehānismiem jaunu rīku un prasmju reģistrēšanai. Šis pamats novērsa nepieciešamību no jauna izgudrot galvenās aģentiskās funkcionalitātes, ļaujot komandai koncentrēties uz lietojumprogrammu specifisko loģiku. Šī integrētā vide veicināja ātru izstrādes ciklu, pierādot, ka ar pareizu iestatījumu AI aģenti var ne tikai palīdzēt, bet arī virzīt ievērojamas izstrādes centienu daļas.
Efektīvas aģentiskās kodēšanas pamatprincipi
Pāreja uz aģentu vadītu paradigmu prasa vairāk nekā tikai rīkus; tā prasa metodoloģijas maiņu. Makgoffins identificēja trīs pamatprincipus, kas izrādījās būtiski izstrādes paātrināšanai un sadarbības veicināšanai:
- Prompt inženierijas stratēģijas: Efektīva mijiedarbība ar aģentiem nozīmē būt sarunvalodas stilā, izvērstam un prioritizēt plānošanu.
- Arhitektūras stratēģijas: Tīra, labi dokumentēta un refaktorēta koda bāze ir ārkārtīgi svarīga, lai aģenti varētu to efektīvi pārlūkot un sniegt savu ieguldījumu.
- Iterācijas stratēģijas: Pieņemot domāšanas veidu "vaino procesu, nevis aģentus", līdzīgi kā nevainīguma kultūrā, tiek veicināta ātra eksperimentēšana un mācīšanās.
Šīs stratēģijas, konsekventi pielietojot, noveda pie pārsteidzošiem rezultātiem. Apliecinājumam par šo efektivitāti, pieci jauni dalībnieki tikai trīs dienu laikā kopīgi pievienoja 11 jaunus aģentus, četras jaunas prasmes un ieviesa projektā 'eval-agent workflows' koncepciju. Šī kopīgā sprinta rezultātā tika veikta ievērojama +28 858/-2 884 koda rindiņu izmaiņa 345 failos, demonstrējot dziļo ietekmi, ko github-agentic-workflows sniedz praksē.
Šeit ir pamatprincipu kopsavilkums:
| Princips | Apraksts | Ieguvums aģentu vadītai izstrādei |
|---|---|---|
| Prompt inženierija | Iztratieties ar aģentiem kā ar vecākajiem inženieriem: vadīt viņu domāšanu, pārmērīgi izskaidrot pieņēmumus, izmantot plānošanas režīmus (/plan) pirms izpildes. Esiet sarunvalodas stilā un detalizēti. | Nodrošina precīzākus un atbilstošākus rezultātus, palīdzot aģentiem efektīvi risināt sarežģītas problēmas. |
| Arhitektūra | Prioritizējiet refaktorēšanu, visaptverošu dokumentāciju un stabilu testēšanu. Uzturiet koda bāzi tīru, lasāmu un labi strukturētu. Aktīvi tīriet nederīgu kodu. | Ļauj aģentiem saprast koda bāzi, modeļus un esošās funkcionalitātes, veicinot precīzu ieguldījumu. |
| Iterācija | Pieņemiet domāšanas veidu "vaino procesu, nevis aģentus". Ieviesiet aizsardzības mehānismus (stingra tipizēšana, linteri, plaši testi), lai novērstu kļūdas. Mācieties no aģentu kļūdām, uzlabojot procesus un aizsardzības mehānismus. | Veicina ātru iterāciju, veido uzticību aģentu ieguldījumam un nepārtraukti uzlabo izstrādes plūsmu. |
Izstrādes paātrināšana: Stratēģijas darbībā
Šo principu integrēšana praktiskā darbplūsmā rada jaudīgu, paātrinātu izstrādes ciklu:
Prompt inženierijas stratēģijas: AI inženiera vadīšana
AI kodēšanas aģenti, lai arī jaudīgi, izcili veic labi definētus uzdevumus. Sarežģītākiem uzdevumiem tiem nepieciešami norādījumi, gluži kā jaunākajiem inženieriem. Makgoffins atklāja, ka sarunvalodas stils, pieņēmumu izskaidrošana un plānošanas režīmu izmantošana bija daudz efektīvāka par īsām komandām. Piemēram, pievienojot robustus regresijas testus, prompts, piemēram, /plan Esmu nesen novērojis, ka Copilot labprāt atjaunina testus, lai tie atbilstu tā jaunajām paradigmām, lai gan šie testi nebūtu jāatjaunina. Kā es varu izveidot rezervētu testēšanas vietu, ko Copilot nevar aiztikt vai kam jābūt rezervētai, lai pasargātu no regresijām? uzsāka produktīvu dialogu. Šī mijiedarbība, bieži vien ar jaudīgo claude-opus-4-6 modeli, noveda pie sarežģītiem risinājumiem, piemēram, līgumu testēšanas aizsardzības mehānismiem, kurus varēja atjaunināt tikai cilvēki-inženieri, nodrošinot, ka kritiskā funkcionalitāte paliek aizsargāta.
Arhitektūras stratēģijas: AI atbalstītas kvalitātes pamats
Cilvēkiem-inženieriem tīras koda bāzes uzturēšana, testu rakstīšana un funkciju dokumentēšana bieži tiek atstāta otrajā plānā, jo ir spiediens piegādāt funkcijas. Aģentu vadītā izstrādē tas kļūst ārkārtīgi svarīgi. Makgoffins atklāja, ka laika veltīšana refaktorēšanai, dokumentēšanai un testu gadījumu pievienošanai dramatiski uzlaboja Copilot spēju orientēties koda bāzē un sniegt ieguldījumu. Repozitorijs, kurā vispirms tiek domāts par aģentiem, plaukst skaidrībā. Tas ļauj izstrādātājiem pat jautāt Copilot jautājumus, piemēram, 'Zinot to, ko zinu tagad, kā es to izveidotu citādi?', pārvēršot teorētiskus refaktoringus par sasniedzamiem projektiem ar AI palīdzību. Šis nepārtrauktais fokuss uz arhitektūras veselību nodrošina, ka jaunas funkcijas var tikt piegādātas bez piepūles.
Iterācijas stratēģijas: Uzticēšanās procesam, ne tikai aģentam
AI modeļu attīstība ir mainījusi domāšanas veidu no "uzticies, bet pārbaudi" uz uzticīgāku nostāju, līdzīgi tam, kā efektīvas komandas darbojas ar filozofiju "vaino procesu, nevis cilvēkus". Šī "nevainīguma kultūra" aģentu vadītā izstrādē nozīmē, ka, ja AI aģents pieļauj kļūdu, atbilde ir uzlabot pamatprocesus un aizsardzības mehānismus, nevis vainot pašu aģentu. Tas ietver stingru CI/CD praksi ieviešanu: stingru tipizāciju, lai nodrošinātu saskarnes atbilstību, robustus linterus koda kvalitātei un plašas integrācijas, galapunktu un līgumu testus. Lai gan šo testu manuāla izveide var būt dārga, aģentu palīdzība padara to ieviešanu daudz lētāku, nodrošinot kritisku uzticību jaunām izmaiņām. Iestatot šīs sistēmas, izstrādātāji dod Copilot iespēju pārbaudīt savu darbu, atspoguļojot, kā juniora inženieris tiek sagatavots panākumiem.
Aģentu vadītā izstrādes cikla apguve
Šo principu integrēšana praktiskā darbplūsmā rada jaudīgu, paātrinātu izstrādes ciklu:
- Plānot ar Copilot: Sākt jaunas funkcijas, izmantojot
/plan. Iterēt plānu, nodrošinot, ka testi un dokumentācijas atjauninājumi tiek iekļauti un pabeigti pirms koda ieviešanas. Dokumentācija var kalpot kā papildu vadlīniju kopums aģentam. - Ieviest ar Autopilot: Ļaut Copilot ieviest funkciju, izmantojot
/autopilot, izmantojot tā koda ģenerēšanas iespējas. - Pārskatīt ar Copilot Code Review: Mudināt Copilot uzsākt pārskatīšanas ciklu. Tas ietver pieprasījumu Copilot Code Review aģentam, tā komentāru risināšanu un atkārtotu pārskatu pieprasīšanu, līdz problēmas ir atrisinātas.
- Cilvēka pārskats: Veikt galīgo cilvēka pārskatu, lai nodrošinātu modeļu ievērošanu un sarežģītu lēmumu atbilstību stratēģiskajiem mērķiem.
Ārpus funkciju cikla nepārtraukta optimizācija ir galvenā. Makgoffins regulāri mudina Copilot ar komandām, piemēram, /plan Pārskatiet kodu, lai atrastu trūkstošus testus, testus, kas varētu būt salūzuši, un nederīgu kodu vai /plan Pārskatiet dokumentāciju un kodu, lai identificētu dokumentācijas nepilnības. Šīs pārbaudes, kas tiek veiktas katru nedēļu vai integrējot jaunas funkcijas, nodrošina, ka aģentu vadītā izstrādes vide paliek veselīga un efektīva.
Programmatūras inženierijas nākotne ar AI
Tas, kas sākās kā personisks uzdevums automatizēt frustrējošu analīzes uzdevumu, ir attīstījies jaunā programmatūras izstrādes paradigmā. Aģentu vadīta izstrāde, ko nodrošina tādi rīki kā GitHub Copilot un progresīvi modeļi, piemēram, Claude Opus, nav tikai par to, lai izstrādātāji būtu ātrāki; tas ir par AI pētnieku un programmatūras inženieru darba būtības fundamentālu maiņu. Novirzot intelektuālo darbu inteliģentiem aģentiem, komandas var sasniegt vēl nepieredzētu produktivitātes, sadarbības un inovācijas līmeni, galu galā koncentrējoties uz radošajiem un stratēģiskajiem izaicinājumiem, kas patiesi virza progresu. Šī pieeja vēsta par aizraujošu nākotni, kurā AI aģenti nav tikai rīki, bet gan neatņemami izstrādes komandas locekļi, mainot to, kā mēs veidojam un uzturam programmatūru.
Sākotnējais avots
https://github.blog/ai-and-ml/github-copilot/agent-driven-development-in-copilot-applied-science/Bieži uzdotie jautājumi
What is agent-driven development in the context of GitHub Copilot?
How did the 'eval-agents' project originate?
What are the key components of an agentic coding setup for this approach?
What prompting strategies are most effective when working with AI coding agents?
Why are architectural strategies like refactoring and documentation crucial for agent-driven development?
How does a 'blameless culture' apply to iteration strategies in agent-driven development?
What is the typical development loop when using agent-driven development?
What kind of impact did agent-driven development have on team productivity and collaboration?
Esiet informēti
Saņemiet jaunākās AI ziņas savā e-pastā.
