Audiens yang dituju Tujuan Tentang seri konten ini Kasus bisnis AI tanpa server Layanan AWS memberdayakan AI tanpa server

Membangun arsitektur tanpa server untuk AI agen AWS

Aaron Sempf, Amazon Web Services

Januari 2026 (sejarah dokumen)

Konvergensi AI dan komputasi tanpa server membentuk kembali lanskap arsitektur perusahaan modern. Sebagai tanggapan, organisasi berusaha untuk memberikan kemampuan cerdas dalam skala besar. Mereka menghadapi tekanan yang meningkat untuk mengurangi overhead operasional, mempercepat inovasi, dan menyebarkan aplikasi yang dapat beradaptasi secara real time dengan perilaku pengguna dan peristiwa sistem.

AI tanpa server AWS mewakili perubahan mendasar menuju sistem cloud-native yang cerdas, adaptif, dan cloud. Dengan strategi dan perkakas yang tepat, organisasi dapat membuka siklus inovasi yang lebih cepat, biaya yang lebih rendah, dan skalabilitas yang lebih besar. Pendekatan ini menempatkan mereka di garis depan generasi komputasi perusahaan berikutnya. AWS memungkinkan pergeseran ini melalui kombinasi layanan AI yang dikelola sepenuhnya dan infrastruktur tanpa server yang digerakkan oleh peristiwa.

Panduan ini menguraikan fondasi strategis dan teknis untuk membangun arsitektur asli AI dan tanpa server. AWS Arsitektur ini dapat diskalakan, hemat biaya, dan mampu memberikan intelijen real-time tanpa kompleksitas pengelolaan infrastruktur.

Audiens yang dituju

Panduan ini ditujukan untuk arsitek, pengembang, dan pemimpin teknologi yang ingin memanfaatkan kekuatan agen perangkat lunak berbasis AI dalam aplikasi cloud-native modern.

Tujuan

Panduan ini membantu Anda melakukan hal berikut:

Memahami layanan AWS asli yang tersedia untuk pengembangan solusi AI agen
Operasionalkan AI agen dengan keandalan skala cloud
Sejajarkan eksekusi AI dengan hasil bisnis dan model biaya
Menetapkan kerangka kerja untuk adopsi AI yang aman dan diatur

Tentang seri konten ini

Panduan ini adalah bagian dari seri tentang AI agen di AWS. Untuk informasi lebih lanjut dan untuk melihat panduan lain dalam seri ini, lihat Agentic AI di situs web AWS Prescriptive Guidance.

Kasus bisnis AI tanpa server

Komputasi tanpa server memberikan fondasi yang ideal untuk beban kerja AI modern. Aplikasi AI sering memerlukan inferensi intermiten, komputasi intensif, terutama dalam kasus penggunaan seperti deteksi penipuan, mesin rekomendasi, ringkasan dokumen, dan otomatisasi layanan pelanggan. Model infrastruktur tradisional bisa mahal dan kompleks secara operasional saat mengelola beban kerja yang tidak terduga atau runcing.

Sebaliknya, arsitektur tanpa server menawarkan keuntungan yang signifikan. Mereka menskalakan secara otomatis, mengeksekusi sesuai permintaan, mengurangi overhead operasional, dan hanya mengenakan biaya untuk sumber daya yang digunakan. Fitur-fitur ini membuat arsitektur tanpa server sangat cocok untuk menyematkan AI ke dalam aplikasi cloud-native modern. AWS menawarkan portofolio layanan komprehensif yang menggabungkan kemampuan tanpa server dan AI. Layanan ini termasuk Amazon SageMaker Serverless Inference dan Amazon Bedrock, yang menyediakan akses ke model foundation melalui antarmuka berbasis API yang dikelola sepenuhnya. Amazon Bedrock AgentCore memperluas Amazon Bedrock di luar akses model ke runtime lengkap untuk membangun, menyebarkan, dan mengelola agen otonom.

Selain itu, AWS Lambda dan AWS Step Functions memungkinkan pengembangan sistem AI yang gesit, selaras dengan biaya, dan siap produksi. Saat dipasangkan dengan layanan seperti Amazon Bedrock, Inferensi SageMaker Tanpa Server, dan AgentCore, mereka menyediakan kemampuan penalaran, memori, dan konektor terintegrasi, memungkinkan pengembang untuk membuat agen yang dapat merencanakan, bertindak, dan berkolaborasi lintas sistem eksternal. Layanan AWS Alat-alat ini menawarkan dukungan kuat untuk beban kerja AI, semuanya dalam arsitektur tanpa server yang digerakkan oleh peristiwa.

Beban kerja AI, terutama inferensi, seringkali tidak dapat diprediksi dan meledak. Dalam arsitektur tradisional, ini mengarah pada infrastruktur yang terlalu banyak, peningkatan biaya, dan kompleksitas dalam penskalaan. Model tanpa server memecahkan masalah ini dengan menawarkan:

Skalabilitas elastis — Skala sumber daya secara otomatis berdasarkan permintaan.
Optimalisasi biaya - Tidak ada biaya untuk komputasi idle. Bayar hanya untuk waktu eksekusi.
Mengurangi overhead operasional — Lebih sedikit operasi, lebih sedikit untuk mengelola, dan lebih sedikit ketergantungan pada teknologi, proses, atau sumber daya lainnya.
Waktu yang lebih cepat ke pasar — Pengembang dapat fokus pada logika bisnis dan kinerja model daripada mengelola server.
Ketersediaan tinggi dan ketahanan bawaan - penawaran AWS tanpa server menyediakan kemampuan ini secara default.

Kemampuan ini membuat tanpa server cocok secara alami untuk menerapkan model AI di berbagai kasus penggunaan, mulai dari deteksi penipuan dan rekomendasi yang dipersonalisasi hingga analisis dokumen dan AI percakapan.

Layanan AWS memberdayakan AI tanpa server

AWS menyediakan rangkaian layanan terkelola yang kuat yang membantu tim menanamkan intelijen ke dalam aplikasi, mengatur alur kerja, dan bereaksi terhadap peristiwa tanpa mengelola infrastruktur:

Dengan AWS Lambda, Anda dapat menjalankan beban kerja komputasi berbasis peristiwa dalam skala besar tanpa menyediakan server. Ini ideal untuk AI pra dan pasca pemrosesan dan logika inferensi ringan.
Gunakan Amazon SageMaker Serverless Inference untuk menerapkan model machine learning (ML) untuk prediksi real-time dengan penskalaan otomatis dan tanpa biaya idle.
Amazon Bedrock menyediakan akses ke model foundation dari perusahaan AI terkemuka seperti AI21 Labs,, Anthropic, Cohere, DeepSeek, Luma AI Meta Mistral AI, poolside(segera hadir), Stability AI,,, TwelveLabs Writer, dan Amazon melalui satu API untuk beban kerja AI generatif.
Dengan Amazon Bedrock Agents, Anda dapat membangun alur kerja berbasis AI di mana model mengatur panggilan fungsi dan alasan melalui tugas dengan menggunakan bahasa alami.
Amazon Bedrock AgentCore menyediakan kemampuan runtime, memori, dan konektor dasar yang menyederhanakan pembuatan dan penskalaan sistem multi-agen. AgentCore Mengintegrasikan ke dalam desain tanpa server memungkinkan pengembang untuk membangun agen adaptif dan sadar konteks secara native tanpa mengelola orkestrasi khusus atau penanganan status. AWS
Amazon EventBridge memungkinkan Anda membangun arsitektur berbasis peristiwa yang digabungkan secara longgar yang memicu alur kerja AI secara otomatis.
Gunakan AWS Step Functionsuntuk mengatur pipeline AI multi-langkah dan terhubung menggunakan alur kerja visual. Layanan AWS
Dengan AWS IoT Greengrassdan Lambda @Edge, Anda dapat menerapkan model dan logika di edge untuk inferensi latensi rendah di IoT dan aplikasi global.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Prinsip inti AI tanpa server AWS