Strategi Protokol Konteks Model pada AWS

Amazon Web Services (kontributor)

Maret 2026 (sejarah dokumen)

Panduan ini dapat membantu Anda mengembangkan dan menerapkan strategi Model Context Protocol (MCP) di seluruh organisasi Anda untuk mendukung perjalanan AI agen Anda. Ketika agen dan model bahasa menjadi semakin sentral untuk operasi bisnis, menetapkan strategi MCP sangat penting untuk solusi agen yang sukses.

Panduan ini mengeksplorasi tiga pilar dasar untuk membangun strategi MCP: desain alat MCP, hosting server MCP, dan tata kelola MCP. Dengan menangani komponen yang saling berhubungan ini, organisasi dapat membuat sistem yang terukur, aman, dan efektif untuk mengelola konteks model di seluruh implementasi AI mereka. Panduan ini memberikan wawasan yang dapat ditindaklanjuti dan panduan strategis untuk organisasi di setiap tahap perjalanan AI organisasi, mulai dari eksperimen awal hingga penerapan produksi skala penuh. Ini membantu mereka mengembangkan solusi MCP yang disesuaikan yang selaras dengan kebutuhan dan tujuan spesifik mereka.

Praktik terbaik ini berasal dari implementasi dunia nyata dari organisasi yang menerapkan MCP pada skala perusahaan, analisis standar spesifikasi MCP saat ini, dan pelajaran yang dipetik dari aplikasi Large Language Model (LLM) kustom dalam produksi.

Sistem AI menggunakan semakin canggih dan kuat LLMs dalam berbagai kasus penggunaan. LLMs unggul dalam memahami bahasa alami, menghasilkan respons seperti manusia, dan penalaran atas informasi yang kompleks. Namun, untuk mengubah LLMs dari antarmuka percakapan menjadi sistem yang dapat secara mandiri menyelesaikan tugas-tugas kompleks, organisasi mengadopsi arsitektur AI agen, sistem AI yang dapat memahami lingkungan mereka, alasan tentang tujuan, membuat keputusan otonom, mengatur berbagai langkah, dan mengambil tindakan untuk mencapai tujuan atas nama pengguna. Pendekatan agen ini membantu organisasi membangun sistem AI yang dapat memahami maksud pengguna melalui bahasa alami, berkoordinasi secara mandiri di berbagai sumber dan alat data, dan memberikan pengalaman yang dipersonalisasi pada skala yang tidak mungkin dilakukan dengan pola permintaan-respons tradisional. Untuk membuat agen ini lebih mampu, organisasi perlu menyediakan akses ke alat dan data yang ada untuk memperkaya pemahaman kontekstual agen dan memungkinkannya bertindak atas nama pengguna.

MCP menyediakan protokol standar untuk integrasi alat AI, memungkinkan komunikasi yang konsisten antara agen dan sumber daya eksternal. Sementara MCP sendiri mendefinisikan standar komunikasi, menerapkannya secara efektif memerlukan pertimbangan yang cermat terhadap pola arsitektur, model keamanan, praktik operasional, dan strategi pengoptimalan kinerja untuk mencapai solusi yang dapat diskalakan, aman, dan dapat dipelihara.

Panduan ini mensintesis pelajaran yang dipetik dari penerapan MCP perusahaan, memberikan rekomendasi yang dapat ditindaklanjuti yang selaras dengan Kerangka Well-Architected.AWS Ini mencakup strategi untuk desain alat MCP, hosting server MCP, dan tata kelola MCP, yang penting dalam membangun solusi MCP Anda sendiri. Rekomendasi dalam panduan ini memetakan lima pilar Kerangka Kerja AWS Well-Architected berikut:

Keamanan — Isolasi token, kredensi tercakup, otorisasi terpisah read/write
Keunggulan Operasional - Metrik akurasi pemilihan alat, kumpulan data emas untuk pengujian regresi
Keandalan - Pembatasan laju per pengguna dan per alat, penumpahan beban
Efisiensi kinerja - Alat dengan cakupan alur kerja, penyaringan alat, pencarian semantik untuk mengurangi penggunaan jendela konteks
Pengoptimalan biaya — Server MCP yang dapat digunakan kembali di seluruh tim, mengurangi biaya token per permintaan melalui pemfilteran alat

Audiens yang dituju

Panduan ini ditujukan untuk arsitek, pengembang, dan pemimpin teknologi yang menerapkan solusi AI agen di organisasi mereka. Untuk memahami konsep dalam panduan ini, Anda harus memahami cara LLMs kerja dan memiliki pengetahuan dasar tentang MCP, alat, dan teknik yang cepat.

Tujuan

Membangun sistem AI Agentic yang siap produksi berarti menyelesaikan tata kelola, pengoptimalan, dan keamanan bersama untuk mendukung kebijakan organisasi Anda. Di bawah ini menjelaskan bagaimana panduan ini membahas tujuan-tujuan ini:

Tata Kelola — Tanpa tata kelola terpusat, Anda tidak dapat menjawab pertanyaan audit tentang beban kerja AI Anda, termasuk agen mana yang mengakses data mana, dengan izin apa, dan kapan. Anda juga tidak dapat memaksakan pembuatan versi. Bagian strategi hosting MCP dari panduan ini menjelaskan bagaimana pengguna dapat menjalankan server MCP lokal yang sudah ketinggalan zaman dengan kerentanan yang diketahui karena kurangnya penegakan sistematis.

Untuk industri yang diatur, tata kelola sangat penting. Auditor ingin melihat penegakan kebijakan dan pelacakan penggunaan alat di semua agen dari satu panel. Tata kelola MCP menyediakan itu.

Dengan mengikuti rekomendasi dalam panduan ini, Anda dapat meningkatkan akurasi tugas sebesar 28-32% dalam tolok ukur peer-review. Untuk informasi selengkapnya, lihat MARCO: Orkestrasi Obrolan Real-Time Multi-Agen (situs web Antologi ACL). Tata kelola bukan hanya tentang kepatuhan; itu juga meningkatkan kinerja sistem AI agen Anda.
Optimasi — Tim Anda mungkin membangun integrasi yang sama lebih dari sekali. Misalnya, ketika lima tim yang berbeda menulis skrip kueri database mereka sendiri untuk aplikasi AI mereka untuk berkomunikasi dengan database mereka, itu lima kali biaya pengembangan dan lima set daftar bug yang harus dipertahankan. MCP memungkinkan Anda membangunnya sekali dan membagikannya ke seluruh komunitas teknik. Senyawa tabungan saat jumlah agen Anda bertambah.

Ada juga masalah biaya per permintaan yang sebagian besar tim tidak menyadarinya pada awalnya. Setiap definisi alat menggunakan token jendela konteks. Pada 20 alat, Anda menghabiskan 5.000-10.000 token per permintaan untuk deskripsi saja, di samping pertanyaan pengguna. Ini meningkatkan biaya inferensi latensi dan LLM dan menurunkan akurasi karena model berjuang untuk memilih alat yang tepat dari daftar alat yang tersedia.

Agen yang menggunakan pembungkus alat terstruktur kira-kira tiga kali lebih akurat pada tugas database daripada agen yang mengakses APIs secara langsung (untuk informasi selengkapnya, lihat Middleware untuk LLMs: Alat Instrumental untuk Agen Bahasa di Lingkungan Kompleks). Bagaimana Anda mendesain dan menyajikan alat untuk model AI adalah penting. Panduan ini merekomendasikan untuk memberikan skema yang jelas kepada alat, melingkupinya ke alur kerja aktual alih-alih titik akhir mentah, dan membatasi informasi di jendela konteks. Bagian strategi desain alat MCP dari panduan ini menyelami aspek-aspek ini.
Keamanan dan kepatuhan - Bayangkan sistem AI agen yang berhalusinasi langkah pembersihan dan mencoba menghapus basis data produksi. Jika agen mewarisi kredensi admin lengkap pengguna, penghapusan mungkin akan dilakukan. Dengan isolasi token dan kredenal cakupan yang hanya memberikan akses baca dan buat, gagal dengan aman.

Alur kerja yang diatur mempertajam ini lebih lanjut. Panduan ini memberikan contoh (jaringan pipa perawatan kesehatan yang memerlukan validasi HIPAA dan anonimisasi informasi yang dapat diidentifikasi secara pribadi sebelum memproses data pasien). Menyematkan logika tersebut dalam alat MCP berarti kepatuhan terjadi secara deterministik setiap saat.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Apa itu MCP?