Tekoälyagenttien parantaminen: Siirtyminen tilalliseen MCP:hen Amazon Bedrockissa
Tekoälyagentit kehittyvät nopeasti, mutta niiden täysi potentiaali on usein kärsinyt tilattomista toteutuksista, erityisesti skenaarioissa, jotka vaativat reaaliaikaista käyttäjävuorovaikutusta, dynaamista sisällöntuotantoa tai jatkuvia edistymisilmoituksia. Kehittyneitä tekoälyagentteja rakentavat kehittäjät kohtaavat usein haasteita, kun työnkulkujen on keskeytettävä, kerättävä selvennyksiä tai raportoitava tilaa pitkäkestoisten toimintojen aikana. Tilattoman suorituksen jäykkä, yksisuuntainen luonne rajoittaa todella interaktiivisten ja responsiivisten tekoälysovellusten kehitystä.
Nyt Amazon Bedrock AgentCore Runtime esittelee uraauurtavia tilallisia Model Context Protocol (MCP) -asiakasominaisuuksia, jotka muuttavat tapaa, jolla tekoälyagentit toimivat käyttäjien ja suurten kielimallien (LLM) kanssa. Tämä ratkaiseva päivitys vapauttaa agentit tilattoman viestinnän rajoituksista, mahdollistaen monimutkaiset, monivaiheiset ja erittäin interaktiiviset työnkulut. Integroimalla keskeiset MCP-asiakasominaisuudet – tiedonhankinnan, näytteenoton ja edistymisilmoitukset – Bedrock AgentCore Runtime mahdollistaa kaksisuuntaiset keskustelut MCP-palvelinten ja asiakkaiden välillä, avaten tien älykkäämmille, käyttäjäkeskeisemmille tekoälyratkaisuille.
Tilattomasta tilaan perustuvaan: Interaktiivisten agenttityönkulkujen vapauttaminen
Aiemmin AgentCoren MCP-palvelintuki toimi tilattomassa tilassa, jossa jokainen HTTP-pyyntö toimi itsenäisesti ilman jaettua kontekstia. Vaikka tämä yksinkertaisti perustyökalupalvelinten käyttöönottoa, se rajoitti vakavasti skenaarioita, jotka vaativat keskustelun jatkuvuutta, työnkulun keskeistä käyttäjän selvennystä tai reaaliaikaista edistymisen raportointia. Palvelin ei yksinkertaisesti voinut ylläpitää keskusteluketjua erillisten pyyntöjen välillä, mikä haittasi todella interaktiivisten agenttien kehitystä.
Tilallisten MCP-asiakasominaisuuksien tulo muuttaa tätä paradigmaa perustavanlaatuisesti. Asettamalla stateless_http=False palvelimen käynnistyksen yhteydessä, AgentCore Runtime varaa dedikoidun microVM:n jokaiselle käyttäjäistunnolle. Tämä microVM säilyy istunnon ajan – jopa 8 tuntia, tai 15 minuuttia passiivisuuden jälkeen idleRuntimeSessionTimeout-asetuksen mukaisesti – varmistaen suorittimen, muistin ja tiedostojärjestelmän eristyksen istuntojen välillä. Jatkuvuus ylläpidetään Mcp-Session-Id -otsikon kautta, jonka palvelin antaa alustuksen aikana ja jonka asiakas sisällyttää kaikkiin myöhempiin pyyntöihin ohjatakseen ne takaisin samaan istuntoon. Tämä dedikoitu, pysyvä ympäristö mahdollistaa agenttien muistaa kontekstin, pyytää käyttäjän syötettä, tuottaa dynaamista LLM-sisältöä ja antaa jatkuvia päivityksiä.
Seuraava taulukko tiivistää tärkeimmät erot tilattoman ja tilallisen tilan välillä:
| Tilaton tila | Tilallinen tila | |
|---|---|---|
stateless_http -asetus | TRUE | FALSE |
| Istunnon eristys | Dedikoitu microVM per istunto | Dedikoitu microVM per istunto |
| Istunnon kesto | Jopa 8 tuntia; 15 minuutin käyttämättömyysraja | Jopa 8 tuntia; 15 minuutin käyttämättömyysraja |
| Asiakasominaisuudet | Ei tueta | Tiedonhankinta, näytteenotto, edistymisilmoitukset |
| Suositellaan | Yksinkertaiseen työkalujen tarjoiluun | Interaktiiviset, monivaiheiset työnkulut |
Kun istunto vanhenee tai palvelin käynnistetään uudelleen, myöhemmät pyynnöt vanhalla istunnon tunnuksella palauttavat 404-virheen. Tässä vaiheessa asiakkaiden on alustettava yhteys uudelleen saadakseen uuden istunnon tunnuksen ja aloittaakseen uuden istunnon. Konfiguraatiomuutos tilallisen tilan käyttöönottamiseksi on yksittäinen lippu palvelimen käynnistyksessä:
mcp.run( transport="streamable-http", host="0.0.0.0", port=8000, stateless_http=False # Enable stateful mode)
Tämän lipun lisäksi kolme asiakasominaisuutta tulevat automaattisesti saataville, kun MCP-asiakas ilmoittaa tukevansa niitä alustuskättelyn aikana.
Syvällinen katsaus uusiin asiakasominaisuuksiin: Tiedonhankinta, näytteenotto ja edistyminen
Siirtyessään tilalliseen tilaan Amazon Bedrock AgentCore Runtime avaa kolme tehokasta asiakasominaisuutta MCP-määrittelystä, joista kukin on suunniteltu vastaamaan erillisiin vuorovaikutusmalleihin, jotka ovat ratkaisevan tärkeitä edistyneille tekoälyagenteille. Nämä ominaisuudet muuttavat aiemmin jäykän, yksisuuntaisen komentojen suorituksen sujuvaksi, kaksisuuntaiseksi dialogiksi MCP-palvelimen ja sen yhdistettyjen asiakkaiden välillä. On tärkeää huomata, että nämä ominaisuudet ovat valinnaisia, mikä tarkoittaa, että asiakkaat ilmoittavat tukensa alustuksen aikana, ja palvelimien on käytettävä vain niitä ominaisuuksia, joita yhdistetty asiakas on ilmoittanut tukevansa.
Tiedonhankinta: Dynaamisen käyttäjän syötteen mahdollistaminen tekoälyagenteissa
Tiedonhankinta on interaktiivisen tekoälyn kulmakivi, joka mahdollistaa MCP-palvelimen harkitun keskeyttämisen ja spesifisen, strukturoidun syötteen pyytämisen käyttäjältä asiakkaan kautta. Tämä ominaisuus antaa työkalulle mahdollisuuden esittää tarkkoja kysymyksiä oikea-aikaisesti työnkulunsa aikana, olipa kyseessä päätöksen vahvistaminen, käyttäjän mieltymyksen kerääminen tai edeltävistä toiminnoista johdetun arvon kerääminen. Palvelin käynnistää tämän lähettämällä elicitation/create JSON-RPC-pyynnön, joka sisältää ihmislukukelpoisen viestin ja valinnaisen requestedSchema-kentän, joka kuvaa odotetun vastausrakenteen.
MCP-määrittely tarjoaa kaksi vankkaa tilaa tiedonhankintaan:
- Lomaketila: Tämä sopii ihanteellisesti strukturoidun tiedon keräämiseen suoraan MCP-asiakkaan kautta, kuten konfiguraatioparametrien, käyttäjän mieltymysten tai yksinkertaisten vahvistusten keräämiseen, joissa arkaluonteisia tietoja ei ole mukana.
- URL-tila: Vuorovaikutuksiin, jotka edellyttävät turvallista, ulkopuolista prosessia, kuten OAuth-virtoja, maksunkäsittelyä tai arkaluonteisten tunnusten syöttämistä, URL-tila ohjaa käyttäjän ulkoiseen URL-osoitteeseen. Tämä varmistaa, että arkaluonteiset tiedot ohittavat MCP-asiakkaan kokonaan, parantaen turvallisuutta ja vaatimustenmukaisuutta.
Vastaanotettuaan tiedonhankintapyynnön asiakas renderöi sopivan syöttöliittymän. Käyttäjän myöhempi toiminto laukaisee kolmen toiminnon vastausmallin takaisin palvelimelle: accept (käyttäjä antoi pyydetyt tiedot), decline (käyttäjä hylkäsi pyynnön nimenomaisesti) tai cancel (käyttäjä hylkäsi kehotteen tekemättä valintaa). Älykkäät palvelimet on suunniteltu käsittelemään kutakin näistä skenaarioista elegantisti, varmistaen vankan ja käyttäjäystävällisen kokemuksen. Esimerkiksi add_expense_interactive-työkalu, kuten lähdemateriaalissa esitetään, voi ohjata käyttäjää kysymyssarjan läpi – määrä, kuvaus, kategoria ja lopullinen vahvistus – ennen tietojen tallentamista taustaohjelmaan, kuten Amazon DynamoDB:hen. Jokainen vaihe hyödyntää Pydantic-malleja odotetun syötteen määrittämiseen, jonka FastMCP muuntaa saumattomasti elicitation/create-pyynnössä vaadituksi JSON Schema:ksi.
Näytteenotto ja edistymisilmoitukset: LLM-vuorovaikutuksen ja läpinäkyvyyden tehostaminen
Suoran käyttäjävuorovaikutuksen lisäksi näytteenotto antaa MCP-palvelimelle kyvyn pyytää LLM:n generoimaa sisältöä suoraan asiakkaalta sampling/createMessage-mekanismin kautta. Tämä on kriittinen mekanismi, sillä sen avulla palvelimen työkalulogiikka voi hyödyntää tehokkaita kielimallien ominaisuuksia ilman, että sen tarvitsee hallita omia LLM-tunnuksiaan tai suoria API-integraatioita. Palvelin antaa vain kehotteen ja valinnaiset mallimieltymykset, ja asiakas toimii välittäjänä, välittäen pyynnön yhdistettyyn LLM:ään ja palauttaen generoidun vastauksen. Tämä avaa lukuisia käytännön sovelluksia, kuten henkilökohtaisten yhteenvetojen luominen, luonnollisen kielen selitysten tuottaminen strukturoidusta datasta tai kontekstitietoisten suositusten antaminen käynnissä olevan keskustelun perusteella.
Toiminnoissa, jotka kestävät pidempään, edistymisilmoitukset ovat korvaamattomia. Tämä ominaisuus antaa MCP-palvelimelle mahdollisuuden raportoida asteittaisia päivityksiä pitkäkestoisten tehtävien aikana. Käyttämällä ctx.report_progress(progress, total), palvelin voi lähettää jatkuvia päivityksiä, jotka asiakkaat voivat muuntaa visuaaliseksi palautteeksi, kuten edistymispalkiksi tai tilailmaisimeksi. Olipa kyseessä laajojen tietolähteiden haku tai monimutkaisten laskennallisten tehtävien suoritus, läpinäkyvät edistymispäivitykset varmistavat, että käyttäjät pysyvät ajan tasalla, estävät turhautumista ja parantavat yleistä käyttökokemusta sen sijaan, että he joutuisivat tuijottamaan tyhjää ruutua miettien, onko järjestelmä edelleen aktiivinen.
Tekoälyagenttien kehityksen tulevaisuuden varmistaminen Bedrock AgentCore Runtimen avulla
Tilallisten MCP-asiakasominaisuuksien käyttöönotto Amazon Bedrock AgentCore Runtime -ympäristössä edustaa merkittävää harppausta tekoälyagenttien kehityksessä. Muuttamalla aiemmin tilattomat vuorovaikutukset dynaamisiksi, kaksisuuntaisiksi keskusteluiksi, AWS antaa kehittäjille mahdollisuuden rakentaa älykkäämpiä, responsiivisempia ja käyttäjäystävällisempiä tekoälysovelluksia. Nämä ominaisuudet – tiedonhankinta ohjattuun käyttäjän syötteeseen, näytteenotto on-demand LLM-generointiin ja edistymisilmoitukset reaaliaikaiseen läpinäkyvyyteen – avaavat yhdessä uuden aikakauden interaktiivisille agenttityönkuluille. Tekoälyn kehittyessä nämä perustavanlaatuiset ominaisuudet ovat ratkaisevan tärkeitä kehittyneen operatiivisen agenttimaisen tekoälyn luomisessa, joka voi saumattomasti integroitua monimutkaisiin liiketoimintaprosesseihin, mukautua käyttäjien tarpeisiin ja tuottaa poikkeuksellista arvoa.
Alkuperäinen lähde
https://aws.amazon.com/blogs/machine-learning/introducing-stateful-mcp-client-capabilities-on-amazon-bedrock-agentcore-runtime/Usein kysytyt kysymykset
What problem do stateful MCP client capabilities solve on Amazon Bedrock AgentCore Runtime?
How does the transition from stateless to stateful mode work on AgentCore Runtime?
What is Elicitation, and how does it enhance AI agent interactions?
How does Sampling capability benefit AI agents without managing LLM credentials?
Pysy ajan tasalla
Saa uusimmat tekoälyuutiset sähköpostiisi.
