What problem do stateful MCP client capabilities solve on Amazon Bedrock AgentCore Runtime?

Stateful Model Context Protocol (MCP) client capabilities on Amazon Bedrock AgentCore Runtime address the critical limitations of previous stateless AI agent implementations. Stateless agents struggled with interactive, multi-turn workflows, as they couldn't pause mid-execution to solicit user input for clarification, request dynamic large language model (LLM)-generated content, or provide real-time progress updates during lengthy operations. Each request was independent, lacking shared context. This new feature fundamentally transforms agent interactions by enabling bidirectional conversations, allowing agents to maintain conversational threads, gather necessary input precisely when needed, generate dynamic content on the fly, and transparently inform users about ongoing processes. This leads to the development of significantly more responsive, intelligent, and user-centric AI applications capable of complex, adaptive workflows.

How does the transition from stateless to stateful mode work on AgentCore Runtime?

The transition to stateful mode within Amazon Bedrock AgentCore Runtime is initiated by a simple configuration adjustment: setting `stateless_http=False` when starting your MCP server. Once enabled, AgentCore Runtime provisions a dedicated microVM for each individual user session. This microVM is designed for persistence throughout the session's duration, which can last up to 8 hours or expire after 15 minutes of inactivity, ensuring isolated CPU, memory, and filesystem resources for each session. Continuity across interactions is maintained through a unique `Mcp-Session-Id` header. This ID is established during the initial handshake and subsequently included by the client in all follow-up requests, ensuring they are accurately routed back to the correct, persistent session, thereby preserving context and enabling complex, interactive dialogues.

What is Elicitation, and how does it enhance AI agent interactions?

Elicitation is a powerful stateful MCP capability that allows an AI agent (acting as the MCP server) to intelligently pause its ongoing execution and request specific, structured input directly from the user via the client. This significantly enhances interactive agent workflows by enabling agents to ask targeted questions at precise, opportune moments within their operational flow. For example, an agent might use elicitation to confirm a decision, gather user preferences, or collect particular data values that are contingent on preceding steps. The feature supports two robust modes: 'Form mode' for direct structured data collection through the MCP client, and 'URL mode' for secure, out-of-band interactions that require directing the user to an external URL (e.g., for OAuth or sensitive credential entry). The user's response – whether accepting, declining, or canceling the request – is then returned to the server, allowing the agent to dynamically adapt its workflow based on real-time human feedback.

How does Sampling capability benefit AI agents without managing LLM credentials?

Sampling equips the MCP server with the ability to request sophisticated large language model (LLM)-generated content directly from the client using the `sampling/createMessage` mechanism. A key benefit is that the MCP server itself does not need to manage its own LLM credentials, API keys, or direct integrations with various LLM providers. Instead, the server simply provides a well-formed prompt and any optional model preferences to the client. The client then acts as an intelligent intermediary, forwarding this request to its connected LLM and returning the generated response back to the server. This abstraction allows AI agents to seamlessly leverage powerful language model capabilities for tasks such as crafting personalized summaries, generating natural-language explanations from complex structured data, or producing context-aware recommendations, all while simplifying the operational overhead and security concerns associated with LLM management on the server side.

Amazon Bedrock: Tilalliset MCP-asiakasominaisuudet AgentCore Runtime -ympäristössä

Tekoälyagenttien parantaminen: Siirtyminen tilalliseen MCP:hen Amazon Bedrockissa

Tekoälyagentit kehittyvät nopeasti, mutta niiden täysi potentiaali on usein kärsinyt tilattomista toteutuksista, erityisesti skenaarioissa, jotka vaativat reaaliaikaista käyttäjävuorovaikutusta, dynaamista sisällöntuotantoa tai jatkuvia edistymisilmoituksia. Kehittyneitä tekoälyagentteja rakentavat kehittäjät kohtaavat usein haasteita, kun työnkulkujen on keskeytettävä, kerättävä selvennyksiä tai raportoitava tilaa pitkäkestoisten toimintojen aikana. Tilattoman suorituksen jäykkä, yksisuuntainen luonne rajoittaa todella interaktiivisten ja responsiivisten tekoälysovellusten kehitystä.

Nyt Amazon Bedrock AgentCore Runtime esittelee uraauurtavia tilallisia Model Context Protocol (MCP) -asiakasominaisuuksia, jotka muuttavat tapaa, jolla tekoälyagentit toimivat käyttäjien ja suurten kielimallien (LLM) kanssa. Tämä ratkaiseva päivitys vapauttaa agentit tilattoman viestinnän rajoituksista, mahdollistaen monimutkaiset, monivaiheiset ja erittäin interaktiiviset työnkulut. Integroimalla keskeiset MCP-asiakasominaisuudet – tiedonhankinnan, näytteenoton ja edistymisilmoitukset – Bedrock AgentCore Runtime mahdollistaa kaksisuuntaiset keskustelut MCP-palvelinten ja asiakkaiden välillä, avaten tien älykkäämmille, käyttäjäkeskeisemmille tekoälyratkaisuille.

Tilattomasta tilaan perustuvaan: Interaktiivisten agenttityönkulkujen vapauttaminen

Aiemmin AgentCoren MCP-palvelintuki toimi tilattomassa tilassa, jossa jokainen HTTP-pyyntö toimi itsenäisesti ilman jaettua kontekstia. Vaikka tämä yksinkertaisti perustyökalupalvelinten käyttöönottoa, se rajoitti vakavasti skenaarioita, jotka vaativat keskustelun jatkuvuutta, työnkulun keskeistä käyttäjän selvennystä tai reaaliaikaista edistymisen raportointia. Palvelin ei yksinkertaisesti voinut ylläpitää keskusteluketjua erillisten pyyntöjen välillä, mikä haittasi todella interaktiivisten agenttien kehitystä.

Tilallisten MCP-asiakasominaisuuksien tulo muuttaa tätä paradigmaa perustavanlaatuisesti. Asettamalla stateless_http=False palvelimen käynnistyksen yhteydessä, AgentCore Runtime varaa dedikoidun microVM:n jokaiselle käyttäjäistunnolle. Tämä microVM säilyy istunnon ajan – jopa 8 tuntia, tai 15 minuuttia passiivisuuden jälkeen idleRuntimeSessionTimeout-asetuksen mukaisesti – varmistaen suorittimen, muistin ja tiedostojärjestelmän eristyksen istuntojen välillä. Jatkuvuus ylläpidetään Mcp-Session-Id -otsikon kautta, jonka palvelin antaa alustuksen aikana ja jonka asiakas sisällyttää kaikkiin myöhempiin pyyntöihin ohjatakseen ne takaisin samaan istuntoon. Tämä dedikoitu, pysyvä ympäristö mahdollistaa agenttien muistaa kontekstin, pyytää käyttäjän syötettä, tuottaa dynaamista LLM-sisältöä ja antaa jatkuvia päivityksiä.

Seuraava taulukko tiivistää tärkeimmät erot tilattoman ja tilallisen tilan välillä:

	Tilaton tila	Tilallinen tila
`stateless_http` -asetus	`TRUE`	`FALSE`
Istunnon eristys	Dedikoitu microVM per istunto	Dedikoitu microVM per istunto
Istunnon kesto	Jopa 8 tuntia; 15 minuutin käyttämättömyysraja	Jopa 8 tuntia; 15 minuutin käyttämättömyysraja
Asiakasominaisuudet	Ei tueta	Tiedonhankinta, näytteenotto, edistymisilmoitukset
Suositellaan	Yksinkertaiseen työkalujen tarjoiluun	Interaktiiviset, monivaiheiset työnkulut

Kun istunto vanhenee tai palvelin käynnistetään uudelleen, myöhemmät pyynnöt vanhalla istunnon tunnuksella palauttavat 404-virheen. Tässä vaiheessa asiakkaiden on alustettava yhteys uudelleen saadakseen uuden istunnon tunnuksen ja aloittaakseen uuden istunnon. Konfiguraatiomuutos tilallisen tilan käyttöönottamiseksi on yksittäinen lippu palvelimen käynnistyksessä:

mcp.run( transport="streamable-http", host="0.0.0.0", port=8000, stateless_http=False # Enable stateful mode)

Tämän lipun lisäksi kolme asiakasominaisuutta tulevat automaattisesti saataville, kun MCP-asiakas ilmoittaa tukevansa niitä alustuskättelyn aikana.

Syvällinen katsaus uusiin asiakasominaisuuksiin: Tiedonhankinta, näytteenotto ja edistyminen

Siirtyessään tilalliseen tilaan Amazon Bedrock AgentCore Runtime avaa kolme tehokasta asiakasominaisuutta MCP-määrittelystä, joista kukin on suunniteltu vastaamaan erillisiin vuorovaikutusmalleihin, jotka ovat ratkaisevan tärkeitä edistyneille tekoälyagenteille. Nämä ominaisuudet muuttavat aiemmin jäykän, yksisuuntaisen komentojen suorituksen sujuvaksi, kaksisuuntaiseksi dialogiksi MCP-palvelimen ja sen yhdistettyjen asiakkaiden välillä. On tärkeää huomata, että nämä ominaisuudet ovat valinnaisia, mikä tarkoittaa, että asiakkaat ilmoittavat tukensa alustuksen aikana, ja palvelimien on käytettävä vain niitä ominaisuuksia, joita yhdistetty asiakas on ilmoittanut tukevansa.

Tiedonhankinta: Dynaamisen käyttäjän syötteen mahdollistaminen tekoälyagenteissa

Tiedonhankinta on interaktiivisen tekoälyn kulmakivi, joka mahdollistaa MCP-palvelimen harkitun keskeyttämisen ja spesifisen, strukturoidun syötteen pyytämisen käyttäjältä asiakkaan kautta. Tämä ominaisuus antaa työkalulle mahdollisuuden esittää tarkkoja kysymyksiä oikea-aikaisesti työnkulunsa aikana, olipa kyseessä päätöksen vahvistaminen, käyttäjän mieltymyksen kerääminen tai edeltävistä toiminnoista johdetun arvon kerääminen. Palvelin käynnistää tämän lähettämällä elicitation/create JSON-RPC-pyynnön, joka sisältää ihmislukukelpoisen viestin ja valinnaisen requestedSchema-kentän, joka kuvaa odotetun vastausrakenteen.

MCP-määrittely tarjoaa kaksi vankkaa tilaa tiedonhankintaan:

Lomaketila: Tämä sopii ihanteellisesti strukturoidun tiedon keräämiseen suoraan MCP-asiakkaan kautta, kuten konfiguraatioparametrien, käyttäjän mieltymysten tai yksinkertaisten vahvistusten keräämiseen, joissa arkaluonteisia tietoja ei ole mukana.
URL-tila: Vuorovaikutuksiin, jotka edellyttävät turvallista, ulkopuolista prosessia, kuten OAuth-virtoja, maksunkäsittelyä tai arkaluonteisten tunnusten syöttämistä, URL-tila ohjaa käyttäjän ulkoiseen URL-osoitteeseen. Tämä varmistaa, että arkaluonteiset tiedot ohittavat MCP-asiakkaan kokonaan, parantaen turvallisuutta ja vaatimustenmukaisuutta.

Vastaanotettuaan tiedonhankintapyynnön asiakas renderöi sopivan syöttöliittymän. Käyttäjän myöhempi toiminto laukaisee kolmen toiminnon vastausmallin takaisin palvelimelle: accept (käyttäjä antoi pyydetyt tiedot), decline (käyttäjä hylkäsi pyynnön nimenomaisesti) tai cancel (käyttäjä hylkäsi kehotteen tekemättä valintaa). Älykkäät palvelimet on suunniteltu käsittelemään kutakin näistä skenaarioista elegantisti, varmistaen vankan ja käyttäjäystävällisen kokemuksen. Esimerkiksi add_expense_interactive-työkalu, kuten lähdemateriaalissa esitetään, voi ohjata käyttäjää kysymyssarjan läpi – määrä, kuvaus, kategoria ja lopullinen vahvistus – ennen tietojen tallentamista taustaohjelmaan, kuten Amazon DynamoDB:hen. Jokainen vaihe hyödyntää Pydantic-malleja odotetun syötteen määrittämiseen, jonka FastMCP muuntaa saumattomasti elicitation/create-pyynnössä vaadituksi JSON Schema:ksi.

Näytteenotto ja edistymisilmoitukset: LLM-vuorovaikutuksen ja läpinäkyvyyden tehostaminen

Suoran käyttäjävuorovaikutuksen lisäksi näytteenotto antaa MCP-palvelimelle kyvyn pyytää LLM:n generoimaa sisältöä suoraan asiakkaalta sampling/createMessage-mekanismin kautta. Tämä on kriittinen mekanismi, sillä sen avulla palvelimen työkalulogiikka voi hyödyntää tehokkaita kielimallien ominaisuuksia ilman, että sen tarvitsee hallita omia LLM-tunnuksiaan tai suoria API-integraatioita. Palvelin antaa vain kehotteen ja valinnaiset mallimieltymykset, ja asiakas toimii välittäjänä, välittäen pyynnön yhdistettyyn LLM:ään ja palauttaen generoidun vastauksen. Tämä avaa lukuisia käytännön sovelluksia, kuten henkilökohtaisten yhteenvetojen luominen, luonnollisen kielen selitysten tuottaminen strukturoidusta datasta tai kontekstitietoisten suositusten antaminen käynnissä olevan keskustelun perusteella.

Toiminnoissa, jotka kestävät pidempään, edistymisilmoitukset ovat korvaamattomia. Tämä ominaisuus antaa MCP-palvelimelle mahdollisuuden raportoida asteittaisia päivityksiä pitkäkestoisten tehtävien aikana. Käyttämällä ctx.report_progress(progress, total), palvelin voi lähettää jatkuvia päivityksiä, jotka asiakkaat voivat muuntaa visuaaliseksi palautteeksi, kuten edistymispalkiksi tai tilailmaisimeksi. Olipa kyseessä laajojen tietolähteiden haku tai monimutkaisten laskennallisten tehtävien suoritus, läpinäkyvät edistymispäivitykset varmistavat, että käyttäjät pysyvät ajan tasalla, estävät turhautumista ja parantavat yleistä käyttökokemusta sen sijaan, että he joutuisivat tuijottamaan tyhjää ruutua miettien, onko järjestelmä edelleen aktiivinen.

Tekoälyagenttien kehityksen tulevaisuuden varmistaminen Bedrock AgentCore Runtimen avulla

Tilallisten MCP-asiakasominaisuuksien käyttöönotto Amazon Bedrock AgentCore Runtime -ympäristössä edustaa merkittävää harppausta tekoälyagenttien kehityksessä. Muuttamalla aiemmin tilattomat vuorovaikutukset dynaamisiksi, kaksisuuntaisiksi keskusteluiksi, AWS antaa kehittäjille mahdollisuuden rakentaa älykkäämpiä, responsiivisempia ja käyttäjäystävällisempiä tekoälysovelluksia. Nämä ominaisuudet – tiedonhankinta ohjattuun käyttäjän syötteeseen, näytteenotto on-demand LLM-generointiin ja edistymisilmoitukset reaaliaikaiseen läpinäkyvyyteen – avaavat yhdessä uuden aikakauden interaktiivisille agenttityönkuluille. Tekoälyn kehittyessä nämä perustavanlaatuiset ominaisuudet ovat ratkaisevan tärkeitä kehittyneen operatiivisen agenttimaisen tekoälyn luomisessa, joka voi saumattomasti integroitua monimutkaisiin liiketoimintaprosesseihin, mukautua käyttäjien tarpeisiin ja tuottaa poikkeuksellista arvoa.