Thực thi AI: Kết thúc kỷ nguyên 'AI dưới dạng văn bản' cho phần mềm

Bức tranh về trí tuệ nhân tạo trong phát triển phần mềm đang trải qua một sự chuyển đổi sâu sắc. Trong hai năm qua, mô hình chủ đạo để tương tác với AI bao gồm một trao đổi đơn giản: nhập văn bản, nhận đầu ra văn bản, sau đó tự quyết định hành động tiếp theo. Kỷ nguyên 'AI dưới dạng văn bản' này, dù mang tính đột phá, giờ đây đang nhường chỗ cho một cách tiếp cận năng động và tích hợp hơn. Hãy cùng chào đón GitHub Copilot SDK, báo hiệu kỷ nguyên mới nơi AI dưới dạng thực thi trở thành giao diện.

Phần mềm sản xuất vốn dĩ xoay quanh việc thực thi—lập kế hoạch các bước, gọi công cụ, sửa đổi tệp, phục hồi sau lỗi và thích ứng với các ràng buộc. Đây là những hoạt động phức tạp, đa bước mà việc tạo văn bản đơn thuần không thể bao quát hết. GitHub Copilot SDK trực tiếp giải quyết khoảng trống này, cung cấp lớp thực thi mạnh mẽ làm nền tảng cho GitHub Copilot CLI dưới dạng một khả năng lập trình trong bất kỳ ứng dụng phần mềm nào. Điều này có nghĩa là các nhóm có thể nhúng các công cụ lập kế hoạch và thực thi đã được kiểm thử trong môi trường sản xuất trực tiếp vào hệ thống của họ, thay đổi cơ bản cách các ứng dụng hỗ trợ AI được kiến trúc và vận hành.

Từ Kịch bản Tĩnh đến Quy trình Làm việc Tự hành Thích ứng

Phát triển phần mềm truyền thống từ lâu đã dựa vào các tập lệnh và mã kết nối để tự động hóa các tác vụ lặp đi lặp lại. Mặc dù hiệu quả cho các chuỗi cố định, những giải pháp này nhanh chóng trở nên dễ hỏng khi đối mặt với các sắc thái ngữ cảnh, thay đổi giữa chừng hoặc nhu cầu phục hồi lỗi mạnh mẽ. Các nhà phát triển thường thấy mình phải mã hóa cứng các trường hợp đặc biệt hoặc xây dựng các lớp điều phối tùy chỉnh, một nỗ lực tốn thời gian và thường không bền vững.

GitHub Copilot SDK giải phóng các ứng dụng khỏi những ràng buộc này bằng cách cho phép chúng ủy thác ý định thay vì mã hóa rõ ràng từng bước. Hãy hình dung một ứng dụng cần 'Chuẩn bị kho lưu trữ này để phát hành.' Thay vì một tập lệnh cứng nhắc, Copilot SDK cho phép một tác nhân AI:

Khám phá cấu trúc và nội dung của kho lưu trữ.
Lập kế hoạch các bước cần thiết, chẳng hạn như cập nhật tài liệu, chạy thử nghiệm hoặc tăng số phiên bản.
Sửa đổi các tệp theo yêu cầu.
Chạy các lệnh trong môi trường hệ thống.
Thích ứng linh hoạt nếu bất kỳ bước nào thất bại hoặc nếu thông tin mới xuất hiện, tất cả trong khi hoạt động trong các ranh giới và quyền được xác định trước.

Sự thay đổi này rất quan trọng đối với các hệ thống phần mềm hiện đại. Khi các ứng dụng mở rộng quy mô và môi trường phát triển, các quy trình làm việc cố định dễ bị lỗi. Thực thi tự hành, được hỗ trợ bởi Copilot SDK, cho phép phần mềm thích ứng và tự sửa lỗi, duy trì khả năng quan sát và các ràng buộc mà không phải chịu gánh nặng liên tục xây dựng lại hệ thống điều phối phức tạp từ đầu. Điều này biến AI thành một người tham gia tích cực, thông minh trong vòng đời phát triển, vượt ra ngoài việc hoàn thành mã cơ bản để tự động hóa tác vụ thông minh. Để biết thêm thông tin chi tiết về cách các quy trình làm việc phức tạp này được bảo mật, hãy khám phá kiến trúc bảo mật của Quy trình làm việc Tự hành GitHub.

Ngữ cảnh có cấu trúc cho AI đáng tin cậy: Giao thức Ngữ cảnh Mô hình (MCP)

Một cạm bẫy phổ biến trong kỷ nguyên 'AI dưới dạng văn bản' là cố gắng đưa quá nhiều hành vi và dữ liệu hệ thống vào các lời nhắc AI. Mặc dù có vẻ tiện lợi, việc mã hóa logic trong văn bản khiến các quy trình làm việc khó kiểm thử, khó suy luận và khó phát triển. Theo thời gian, những lời nhắc phức tạp này trở thành những thay thế yếu kém cho việc tích hợp hệ thống có cấu trúc phù hợp.

GitHub Copilot SDK giải quyết vấn đề này bằng cách tiếp cận ngữ cảnh có cấu trúc và có thể kết hợp, tận dụng Giao thức Ngữ cảnh Mô hình (MCP). Với MCP, các nhà phát triển có thể:

Định nghĩa các công cụ hoặc kỹ năng tác nhân chuyên biệt theo miền mà AI có thể gọi.
Phơi bày các công cụ và kỹ năng này thông qua MCP.
Cho phép công cụ thực thi tự động truy xuất ngữ cảnh trong thời gian chạy.

Điều này có nghĩa là thông tin quan trọng – như dữ liệu quyền sở hữu dịch vụ, lược đồ API, hồ sơ quyết định lịch sử, biểu đồ phụ thuộc hoặc API nội bộ – không còn cần phải bị nhồi nhét vào các lời nhắc. Thay vào đó, các tác nhân truy cập trực tiếp các hệ thống này trong giai đoạn lập kế hoạch và thực thi của chúng. Chẳng hạn, một tác nhân nội bộ được giao nhiệm vụ giải quyết một vấn đề có thể tự động truy vấn quyền sở hữu dịch vụ, lấy dữ liệu lịch sử liên quan, kiểm tra biểu đồ phụ thuộc để đánh giá tác động và tham chiếu API nội bộ để đề xuất giải pháp, tất cả trong khi tuân thủ các ràng buộc an toàn đã định. Cách tiếp cận này tương phản rõ rệt với những thách thức của best-practices-for-prompt-engineering-with-the-openai-api nơi việc đưa ngữ cảnh vào có thể phức tạp.

Tại sao điều này quan trọng: Các quy trình làm việc AI đáng tin cậy được xây dựng dựa trên ngữ cảnh có căn cứ, có quyền và có cấu trúc. MCP cung cấp nền tảng quan trọng, đảm bảo việc thực thi tự hành hoạt động trên các công cụ và dữ liệu thực, loại bỏ sự đoán mò và tính dễ hỏng liên quan đến kỹ thuật nhắc lệnh dựa trên văn bản.

AI như một Hạ tầng: Nhúng Thực thi Vượt Ra Ngoài IDE

Trong lịch sử, phần lớn các công cụ AI dành cho nhà phát triển đã bị giới hạn trong Môi trường Phát triển Tích hợp (IDE). Mặc dù vô giá cho việc lập trình, các hệ sinh thái phần mềm hiện đại mở rộng vượt xa một trình soạn thảo duy nhất. Các nhóm yêu cầu khả năng tác nhân trong vô số môi trường: ứng dụng máy tính để bàn, công cụ vận hành nội bộ, dịch vụ nền, nền tảng SaaS và hệ thống điều khiển sự kiện.

Copilot SDK phá vỡ những ranh giới này, biến việc thực thi thành một khả năng ở lớp ứng dụng. Điều này có nghĩa là hệ thống của bạn giờ đây có thể lắng nghe các sự kiện – thay đổi tệp, kích hoạt triển khai, hành động của người dùng – và lập trình gọi Copilot để bắt đầu một quy trình làm việc tự hành. Vòng lặp lập kế hoạch và thực thi chạy bên trong sản phẩm của bạn, chứ không phải là một giao diện riêng biệt hay công cụ dành cho nhà phát triển.

Tính năng	Kỷ nguyên 'AI dưới dạng văn bản'	Kỷ nguyên 'AI dưới dạng thực thi' (Copilot SDK)
Tương tác	Đầu vào văn bản, đầu ra văn bản	Vòng lặp thực thi có thể lập trình
Quy trình làm việc	Quyết định thủ công, kịch bản dễ hỏng	Các tác nhân thích ứng, tự sửa lỗi
Ngữ cảnh	Thường được nhúng vào lời nhắc (dễ hỏng)	Có cấu trúc qua MCP, truy xuất thời gian thực
Tích hợp	Trao đổi cô lập, tập trung vào IDE	Nhúng ở bất cứ đâu (ứng dụng, dịch vụ, SaaS)
Vai trò nhà phát triển	Kỹ thuật nhắc lệnh, điều phối thủ công	Định nghĩa ý định, ràng buộc, công cụ
Nguyên tắc cốt lõi	AI tư vấn, con người thực thi	AI lập kế hoạch & thực thi, con người giám sát

Tại sao điều này quan trọng: Khi việc thực thi AI được nhúng trực tiếp vào ứng dụng của bạn, nó không còn là một người trợ giúp hữu ích mà trở thành hạ tầng cơ bản. Nó có sẵn ở bất cứ nơi nào phần mềm của bạn chạy, mở rộng sức mạnh của AI đến mọi ngóc ngách trong hoạt động kỹ thuật số của bạn, nuôi dưỡng một bức tranh phần mềm thực sự thông minh và thích ứng.

Sự Thay đổi Kiến trúc: AI Có thể Lập trình và Tương lai

Sự chuyển dịch từ 'AI dưới dạng văn bản' sang 'AI dưới dạng thực thi' đại diện cho một sự phát triển kiến trúc đáng kể. Nó báo hiệu một mô hình nơi các tác nhân AI không chỉ tạo ra các đoạn mã mà còn là các vòng lặp lập kế hoạch và thực thi có thể lập trình, có khả năng hoạt động dưới các ràng buộc đã định, tích hợp liền mạch với các hệ thống thực và thích ứng thông minh trong thời gian chạy.

GitHub Copilot SDK là yếu tố then chốt cho tương lai này. Bằng cách làm cho các khả năng thực thi tinh vi này có thể truy cập được dưới dạng một lớp có thể lập trình, nó trao quyền cho các nhóm phát triển tập trung vào 'những gì' cấp cao hơn mà phần mềm của họ nên hoàn thành, thay vì liên tục xây dựng lại 'cách thức' cơ bản của việc điều phối AI. Sự thay đổi này biến AI từ một tiện ích mới lạ thành một thành phần cốt lõi, không thể thiếu của kiến trúc phần mềm hiện đại, hứa hẹn các ứng dụng kiên cường hơn, tự động hơn và thông minh hơn trên diện rộng. Nếu ứng dụng của bạn có thể kích hoạt logic, giờ đây nó có thể kích hoạt thực thi tự hành, mở ra một kỷ nguyên mới của phần mềm thực sự thông minh.

Nguồn gốc

https://github.blog/ai-and-ml/github-copilot/the-era-of-ai-as-text-is-over-execution-is-the-new-interface/

Câu hỏi thường gặp

What is the core shift from 'AI as text' to 'AI as execution' introduced by the GitHub Copilot SDK?

The fundamental shift signifies a move from AI systems that merely generate text output from text input, requiring manual human intervention for the next steps, to systems where AI can actively plan, execute, adapt, and recover from errors within a predefined set of constraints. This means AI transitions from a passive assistant to an active participant, capable of orchestrating complex, multi-step operations directly within software applications, making it a functional component rather than just a conversational interface. The Copilot SDK provides the tools to embed this execution layer into any application.

How does the GitHub Copilot SDK enable sophisticated agentic workflows within applications?

The GitHub Copilot SDK empowers applications by providing access to the same production-tested planning and execution engine that drives GitHub Copilot CLI. Instead of building complex orchestration stacks from scratch, developers can embed this SDK to delegate intent to AI agents. These agents can explore repositories, plan necessary steps, modify files, run commands, and adapt to unforeseen issues—all while respecting defined boundaries. This allows software to become more adaptive and resilient, moving beyond rigid, scripted workflows to dynamic, context-aware operations.

What is the Model Context Protocol (MCP) and why is it crucial for grounded AI execution?

The Model Context Protocol (MCP) is a vital component that enables structured and composable context for AI agents. Rather than embedding critical system logic and data within prompts—a practice that leads to brittle, hard-to-test workflows—MCP allows applications to define domain-specific tools and agent skills. The execution engine then uses MCP to retrieve relevant context directly at runtime, such as service ownership data, API schemas, or dependency rules. This ensures that AI agents operate on real, permissioned data and systems, preventing guesswork and making AI workflows more reliable and maintainable.

Beyond the Integrated Development Environment (IDE), where can the GitHub Copilot SDK embed AI execution?

The GitHub Copilot SDK liberates AI execution from being confined primarily to the IDE, allowing it to function as a pervasive application-layer capability. This means agentic capabilities can be seamlessly integrated into a wide array of environments, including desktop applications, internal operational tools, background services, SaaS platforms, and event-driven systems. By enabling applications to programmatically invoke Copilot upon specific events—like a file change, deployment trigger, or user action—the SDK transforms AI from a mere helper in a side window into core infrastructure that operates wherever the software runs.

What are the primary benefits of delegating multi-step tasks to AI agents using the Copilot SDK?

Delegating multi-step tasks to AI agents via the Copilot SDK offers significant advantages over traditional scripting. It allows software to handle workflows that are context-dependent, change dynamically mid-run, or require robust error recovery, which typically break down fixed scripts. By delegating 'intent' rather than explicit steps, agents can autonomously explore, plan, execute, and adapt within defined constraints. This leads to more scalable, adaptable, and observable systems, freeing developers from continually rebuilding bespoke orchestration layers for complex, evolving processes.

How does the Copilot SDK improve the reliability and adaptability of AI-powered systems?

The Copilot SDK enhances reliability and adaptability by providing a robust execution layer and integrating structured context. Its production-tested planning and execution engine ensures agents can plan complex operations, execute commands, modify files, and recover from errors, making systems more resilient. Furthermore, by utilizing the Model Context Protocol (MCP), agents access real-time, structured, and permissioned context—like API schemas or dependency graphs—rather than relying on potentially outdated or generalized prompt information. This grounding in real data ensures agents make informed decisions, reducing errors and increasing the system's ability to adapt to changing conditions and constraints.

Is the GitHub Copilot SDK primarily for professional developers, or can others benefit from its capabilities?

While the GitHub Copilot SDK is designed to empower professional developers by extending agentic AI capabilities into their applications and infrastructure, its benefits ripple outwards. By enabling AI to handle complex, multi-step tasks and integrate directly into various software systems, it streamlines workflows, reduces manual effort, and enhances the adaptability of applications. This ultimately benefits end-users and organizations by leading to more efficient, intelligent, and robust software, even if the direct interaction with the SDK is primarily on the developer's side. The SDK makes AI a fundamental infrastructure component across the software ecosystem.

Cập nhật tin tức

Nhận tin tức AI mới nhất qua email.

Chia sẻ