Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Teknik meminta tingkat lanjut
Bagian-bagian ini memberikan panduan lanjutan tentang cara meningkatkan kualitas petunjuk Anda dan memanfaatkan fitur-fitur utama seperti pemikiran yang diperluas.
Model Amazon Nova 2 menawarkan mode penalaran opsional yang meningkatkan pendekatan model untuk pemecahan masalah yang kompleks dengan memungkinkannya bekerja melalui masalah secara sistematis sebelum merespons. Memanfaatkan mode penalaran model adalah cara ampuh untuk meningkatkan akurasi permintaan Anda.
Kapan menggunakannya: Mode penalaran direkomendasikan untuk tugas-tugas kompleks seperti kasus penggunaan dengan:
-
Beberapa langkah penalaran: Bukti matematika, desain algoritma, arsitektur sistem
-
Informasi referensi silang: Analisis dokumen, perbandingan opsi, evaluasi trade-off
-
Perhitungan rawan kesalahan: Pemodelan keuangan, analisis data, debugging kompleks
-
Perencanaan dengan kendala: Optimalisasi sumber daya, manajemen ketergantungan, penilaian risiko
-
Klasifikasi kompleks: Kategorisasi multi-label, taksonomi hierarkis, batas keputusan bernuansa
-
Skenario pemanggilan alat: Alur kerja API multi-langkah, pengoptimalan kueri basis data, integrasi sistem terkoordinasi
catatan
Untuk informasi lebih lanjut tentang mode penalaran, lihat. Menggunakan penalaran
Untuk situasi di mana model perlu menilai beberapa pendekatan untuk memecahkan masalah, instruksikan untuk mengambil pendekatan top-down.
-
Model Amazon Nova 2 berkinerja lebih baik ketika model dimulai dengan gambaran besar dan kemudian memecahnya menjadi submasalah atau langkah yang lebih kecil dan lebih rinci.
-
Secara eksplisit mengarahkan model untuk terlebih dahulu mengidentifikasi tujuan utama, kemudian menguraikannya menjadi komponen yang dapat dikelola sebelum mengerjakan detail setiap bagian.
-
Pendekatan terstruktur ini membantu model mengatur pemikirannya dan menghasilkan rantai penalaran yang lebih koheren.
Contoh:
{{User query}}. Start with the big picture and break it down into progressively smaller, more detailed subproblems or steps.
Sementara mode penalaran memberikan akurasi yang ditingkatkan melalui pemecahan masalah yang sistematis, ada skenario spesifik di mana Chain of Thought (CoT) mendorong dalam mode non-penalaran dapat melayani kebutuhan Anda dengan lebih baik.
Kapan menggunakannya:
-
Transparansi dan auditabilitas: Saat Anda ingin melihat, memverifikasi, atau mengaudit proses penalaran model, CoT memberikan visibilitas penuh ke setiap langkah. Ini sangat penting untuk industri yang diatur, keputusan berisiko tinggi, atau ketika Anda ingin mendokumentasikan logika di balik jawaban.
-
Struktur penalaran khusus: Gunakan CoT untuk menegakkan pola atau metodologi penalaran tertentu. Anda dapat memandu model untuk mengikuti kerangka keputusan organisasi Anda, menggunakan pendekatan pemecahan masalah khusus domain, atau memastikan faktor-faktor dipertimbangkan dalam urutan tertentu.
-
Pengembangan dan debugging yang cepat: Selama fase rekayasa yang cepat, CoT membantu Anda memahami bagaimana model mendekati masalah, mengidentifikasi di mana penalaran rusak dan mengulangi permintaan Anda dengan lebih efektif.
-
Pendekatan hibrida: Pertimbangkan untuk menggunakan CoT selama pengembangan untuk menyempurnakan permintaan Anda, lalu beralih ke mode penalaran untuk penerapan produksi setelah Anda yakin dengan pendekatan model untuk kasus penggunaan spesifik Anda.
catatan
Tidak semua tugas membutuhkan CoT. Untuk tugas yang lebih sederhana, izinkan model menggunakan proses penalarannya sendiri.
Memandu arah CoT model:
{{User query}} Please follow these steps: 1. {{Step 1}} 2. {{Step 2}} ...
Model Amazon Nova 2 memiliki panjang konteks yang didukung 1 juta token dan unggul dalam pemahaman kode dan menjawab pertanyaan pada dokumen panjang. Kinerjanya (termasuk kepatuhan cepat sistem dan penggunaan alat) dapat sedikit menurun seiring bertambahnya ukuran konteks.
Cara menggunakannya:
-
Letakkan data formulir panjang di awal: Tempatkan dokumen dan masukan panjang Anda di dekat awal prompt Anda. Tempatkan mereka sebelum kueri, instruksi, dan contoh Anda.
-
Letakkan instruksi di akhir: Tempatkan instruksi Anda di akhir prompt. Model berkinerja terbaik ketika konteks diberikan terlebih dahulu dan instruksi diberikan di akhir.
-
Penanda awal dan akhir konten dokumen struktur: Gunakan penanda awal dan akhir, seperti
DOCUMENT {idx} STARTdanDOCUMENT {idx} END, untuk menunjukkan awal dan akhir dokumen panjang di mana {idx} mewakili indeks dokumen tertentu.
Contoh Template:
// Provide your long inputs at the top of your prompt BEGIN INPUT DOCUMENTS DOCUMENT 1 START {{Your document}} DOCUMENT 1 END END INPUT DOCUMENTS // Then specify your query and instructions BEGIN QUESTION {{User query}} END QUESTION BEGIN INSTRUCTIONS {{Instructions}} END INSTRUCTIONS
Kami menyarankan Anda memberikan model dengan informasi tepercaya yang relevan dengan kueri input. Informasi ini, bersama dengan kueri input, sering menjadi bagian dari sistem yang disebut retrieval augmented generation (RAG).
-
Dalam proses ini, beberapa dokumen atau informasi kontekstual yang relevan ditambah ke prompt pengguna yang sebenarnya sehingga model mendapatkan konten yang dapat dipercaya untuk menghasilkan respons yang relevan dan akurat.
-
Menginstruksikan Amazon Nova 2 untuk menjawab menggunakan teks referensi dari sumber tepercaya dapat membimbingnya untuk menyusun responsnya berdasarkan materi yang disediakan dan memastikan bahwa responsnya didasarkan pada informasi yang akurat dan relevan, meningkatkan keandalan dan kredibilitas konten yang dihasilkan.
-
Menggunakan teks referensi dapat membantu menghindari halusinasi, sehingga meningkatkan kualitas dan kepercayaan tanggapan secara keseluruhan. Untuk meminimalkan halusinasi, sebaiknya sebutkan
DO NOT USE INFORMATION THAT IS NOT IN REFERENCE TEXTS!secara eksplisit dalam instruksi model Anda.
Templat cepat
System: In this session, the model has access to search results and a user's question, your job is to answer the user's question using only information from the search results. Model Instructions: - DO NOT USE INFORMATION THAT IS NOT IN SEARCH RESULTS! User: {Query} Resource: Search Results: {Reference texts}
Contoh ini menunjukkan bagaimana konteks grounding dapat mencegah model berhalusinasi.
Sistem:
In this session, the model has access to search results and a user's question, your job is to answer the user's question using only information from the search results. Model Instructions:- DO NOT USE INFORMATION THAT IS NOT IN SEARCH RESULTS!
Pengguna:
What were the economic impacts of the COVID-19 pandemic on the United States in 2020? Resource: Search Results: In 2020, the United States experienced significant economic impacts due to the COVID-19 pandemic. The U.S. economy contracted by 3.5% in 2020, according to the Bureau of Economic Analysis. Unemployment rates surged to 14.7% in April 2020, the highest since the Great Depression, before gradually declining. Small businesses faced severe challenges, with millions of firms closing permanently. Additionally, consumer spending dropped sharply as people reduced non-essential expenditures and saved more. Government intervention played a critical role in mitigating these impacts through stimulus packages and support programs, such as the Paycheck Protection Program (PPP) for small businesses and direct payments to individuals. Despite these measures, the economic recovery remained uneven across different sectors and regions.
Ground menggunakan spidol kutipan
Untuk tugas dokumen yang panjang, kami sarankan Anda menginstruksikan model Amazon Nova 2 untuk membumikan tanggapannya menggunakan kutipan dari bagian dokumen yang relevan sebelum melanjutkan tugas.
Pendekatan ini membantu model fokus pada informasi yang paling relevan dan menghindari terganggu oleh konten asing. Saat Anda meminta model mendasarkan responsnya, bagian yang dapat dikutip harus diberi nomor. Misalnya,Passage
%[1]%, Passage %[2]% dan sebagainya.
contoh Penanda kutipan cepat
You are an AI financial assistant. Your task is to find patterns and insights from multi-year financial documents Passage %[1]% {{Your document}} Passage %[2]% {{Your document}} ## Task: Analyze my LLC's reports across multiple years to identify significant performance trends, segment growth patterns and strategic shifts. ## Context information: - You have access to my LLC's annual financial reports (10-K) for multiple fiscal years in PDF format - These reports contain comprehensive financial data including income statements, balance sheets, cash flow statements and management discussions - The analysis should focus on year-over-year comparisons to identify meaningful trends - I operate two business segments, one in Massachusetts and one in New York Based on the provided Context, extract key financial metrics from each year's reports phrases from the documents. Place citations as inline markers (e.g., %[1]%, %[2]%, etc.) directly within the relevant parts of the response text. Do not include a separate citation section after the response. ## Response Schema: %% (Extracted Financial Metrics) %% (Extracted Financial Metrics) %% (Extracted Financial Metrics) ...
Setelah Anda mengekstrak informasi kunci berdasarkan tugas pengguna, Anda dapat menggunakan metrik keuangan yang diekstraksi untuk menjawab pertanyaan yang relevan seperti yang ditunjukkan:
contoh Analisis tindak lanjut dengan metrik yang diekstraksi
## Task Analyze my LLC's financial reports across multiple years to identify significant performance trends, segment growth patterns and strategic shifts. {{extracted financial metrics}} ## Model Instructions: - Organize data chronologically to identify meaningful trends - DO compare segment performance across the five-year period - DO identify significant strategic shifts or investments mentioned in management discussions - DO NOT make speculative predictions beyond what is supported by the data - ALWAYS note any changes in accounting practices or reporting methodologies that might affect year-over-year comparisons ## Response style and format requirements: - Respond in markdown - Structure the analysis with clear headings and subheadings - Present key financial metrics in tabular format showing all five years side-by-side - Include percentage changes year-over-year for all major metrics - Create a section dedicated to visualizing the most significant trends (with descriptions of what would be shown in charts) - Limit the executive summary to 250 words maximum - Format segment analysis as separate sections with consistent metrics across all segments - MUST include a Key Insights bullet-pointed list at the end of each major section
Gunakan Nova Web Grounding
Alih-alih meminta secara langsung kutipan untuk membumikan model dalam teks pendukung, model Amazon Nova 2 menyediakan alat pentanahan web internal yang dapat digunakan. Saat diaktifkan, model Amazon Nova 2 akan langsung menanyakan web dan grafik pengetahuan Amazon dan membumikan respons akhir dengan kutipan.
Untuk mempelajari lebih lanjut tentang cara memanfaatkan Amazon Nova Web Grounding, Anda dapat merujuk panduan pengguna Amazon Nova Web Grounding.
Untuk memastikan format output yang konsisten dan terstruktur, Anda dapat menggunakan output terstruktur, termasuk format seperti XHTML, JSON, Markdown, atau menggunakan fungsionalitas penggunaan alat.
-
Pendekatan ini memungkinkan sistem hilir untuk lebih efektif memahami dan mengurai output yang dihasilkan oleh model.
-
Dengan memberikan instruksi eksplisit untuk model, tanggapan dihasilkan dengan cara yang mematuhi skema yang telah ditentukan.
Misalnya, jika parser hilir mengharapkan konvensi penamaan khusus untuk kunci dalam objek JSON, Anda harus menentukan skema respons di akhir prompt. Selain itu, jika Anda lebih suka respons dalam format JSON tanpa teks pembukaan, instruksikan model yang sesuai. Artinya, secara eksplisit menyatakan Harap hasilkan hanya output JSON. JANGAN berikan pembukaan apa pun. untuk memastikan output bersih.
Tip
-
Kami mengamati kepatuhan terbaik terhadap persyaratan format data ketika mereka didefinisikan dalam skema itu sendiri alih-alih melalui penggunaan contoh (seperti, menentukan tanggal dalam format). YYYY/MM/DD
-
Untuk output JSON sederhana dengan hingga 10 kunci, Anda dapat menemukan skema di bawah ini. Untuk skema yang lebih kompleks, kami sarankan Anda menentukan skema Anda melalui alat. Penggunaan alat memanfaatkan teknik yang disebut decoding terbatas yang akan meningkatkan kepatuhan model untuk scehma kompleks ini.
Skema pemformatan umum
Berikut ini adalah contoh skema pemformatan umum.
Isi konten asisten pra-isi
Jika Anda menghasilkan output terstruktur dalam mode non-penalaran, Anda dapat mendorong respons model dengan mengisi konten asisten terlebih dahulu.
Prefilling meningkatkan konsistensi dalam format output saat dalam mode non-penalaran. Ini memungkinkan Anda untuk mengarahkan tindakan model, mem-bypass pembukaan dan menerapkan format output tertentu seperti JSON dan XHTML. Misalnya, jika Anda mengisi konten asisten dengan { atau```json, masukan itu memandu model untuk menghasilkan objek JSON tanpa informasi tambahan.
Tip
Jika Anda secara eksplisit mencari mengekstraksi JSON, pola yang umum adalah mengisi sebelumnya ```json dan menambahkan urutan berhenti. ``` Ini memastikan model mengeluarkan objek JSON yang dapat diurai secara terprogram.
contoh Isi konten asisten pra-isi
Kode berikut menunjukkan cara mengisi ulang dengan API:
import boto3 import json # Create a Bedrock Runtime client. client = boto3.client( "bedrock-runtime", region_name="us-east-1" ) request_body = { "system": [ {"text": "You write JSON objects based on the given instructions"} ], "messages": [ { "role": "user", "content": [{"text": "Provide details about the best selling full-frame cameras in past three years. Answer in JSON format with keys like name, brand, price and a summary."}] }, { "role": "assistant", "content": [{"text": " Here is the JSON response: ```json"}] } ], "inferenceConfig": { "maxTokens": 1000, } } # Invoke the model and extract the response body. response = client.invoke_model( modelId="amazon.nova-2-lite-v1:0", body=json.dumps(request_body) ) model_response = json.loads(response["body"].read())
Tentukan alat yang akan digunakan untuk skema kompleks
Pendekatan lain adalah dengan menggunakan alat untuk memaksa skema tertentu untuk respons model dengan memasukkan skema JSON pydantic di bagian skema penggunaan alat. Anda dapat menentukan pilihan alat ke skema yang disediakan dan respons Amazon Nova akan disusun berdasarkan alat yang dipilih. Untuk mempelajari lebih lanjut tentang cara memanfaatkan penggunaan alat, lihat Penggunaan Alat.
Contoh
Menambahkan bagian Output Schema dengan skema yang sesuai membuat model lebih memilih untuk menyesuaikan skema itu. Namun, output model tidak deterministik dan dapat bervariasi dari skema output.
Pendekatan lain adalah dengan mengisi respons model dengan memasukkan teks awal yang diinginkan dalam pesan asisten. Dalam hal ini, respons model Amazon Nova akan berlanjut dari tempat pesan asisten ditinggalkan.
Tip: Prefill hanya valid ketika penalaran tidak diaktifkan.
Pengguna:
Provide details about the best selling full-frame cameras in past three years. Your response should be in JSON format, with the following keys: name, brand, year, price, summary.
Asisten (Prefilling):
```json
Asisten:
{ "cameras": [ { "name": "Sony Alpha A7 III", "brand": "Sony", "year": 2018, "price": "$1999", "summary": "The Sony Alpha A7 III is a highly acclaimed full-frame mirrorless camera known for its excellent image quality, advanced autofocus system, and 4K video capabilities." }, { "name": "Canon EOS R5", "brand": "Canon", "year": 2020, "price": "$3899", "summary": "The Canon EOS R5 is a top-tier full-frame mirrorless camera that offers stunning 45MP images, 8K video recording, and exceptional performance in various lighting conditions." }, { "name": "Nikon Z7 II", "brand": "Nikon", "year": 2020, "price": "$2999", "summary": "The Nikon Z7 II is a flagship full-frame mirrorless camera with a 45.7MP sensor, superb image quality, and advanced video recording features." }, { "name": "Fujifilm GFX 100S", "brand": "Fujifilm", "year": 2020, "price": "$7999", "summary": "The Fujifilm GFX 100S is a medium format mirrorless camera known for its impressive 102MP sensor, beautiful film simulations, and versatile lens options." }, { "name": "Sony Alpha A7R IV", "brand": "Sony", "year": 2019, "price": "$3499", "summary": "The Sony Alpha A7R IV features a 61MP sensor, excellent low-light performance, and advanced video capabilities, making it a favorite among professional photographers." } ] } ```
Sebagai alternatif untuk menggunakan teknik prefill untuk output terstruktur, Anda dapat menggabungkan fungsionalitas alat Nova dengan ToolChoice. Dalam contoh ini, model akan menghasilkan panggilan alat yang mematuhi skema JSON yang disediakan dan memanggil alat khusus yang ditentukan ke format JSON lengkap yang ditentukan. Untuk panduan tambahan, lihat Sistem Lanjutan.
Pengguna:
From the below provided Query, extract the relevent entities Query: John works in BUILDING-0987 and have been incharge of product id 23564#. His performance have been excellent in past year and is up for a raise. Use the extract_ner tool.
ToolConfig:
{ "tools": [ { "toolSpec": { "name": "extract_ner", "description": "Extract all the named entities. based on provided input", "inputSchema": { "json": { "type": "object", "properties": { "entities": { "type": "array", "items": { "type": "object", "properties": { "name": { "type": "string", "description": "The extracted entity name. This should be a name of a person, place, animal or thing" }, "location": { "type": "string", "description": "The extracted location name. This is a site name or a building name like SITE-001 or BUILDING-003" }, "product": { "type": "string", "description": "The extrcted product code, this is generally a 6 digit alphanumeric code such as 45623#, 234567" } }, "required": [ "name", "location", "product" ] } } }, "required": [ "entities" ] } } } }], "toolChoice": { "tool": { "name": "extract_ner" } } }
Model Amazon Nova 2 telah dilatih pada lebih dari 200 bahasa dan dioptimalkan untuk 15 bahasa.
Minta terjemahan yang akurat
Untuk memanfaatkan kemampuan ini untuk terjemahan bentuk singkat (beberapa kalimat) Anda dapat menginstruksikan model untuk menerjemahkan teks ke dalam bahasa target yang ditentukan.
contoh Permintaan terjemahan
Translate the following text into {target language}. Please output only the translated text with no prefix or introduction: {text}
Translate the following sentence from {source_language} to {target language}: {text}
{text} How do you say this sentence in {target_language}
Menegakkan konvensi penulisan yang konsisten
Dalam bahasa berbasis karakter, model Amazon Nova 2 dapat menggunakan set karakter dari bahasa sumber. Anda dapat menggunakan prompt berikut untuk menerapkan output yang konsisten.
contoh Menegakkan konvensi penulisan
When translating, ensure to use the correct orthography / script / writing convention of the target language, not the source language's characters
Sistem agen
Topik
Atur parameter inferensi yang tepat
Pemanggilan alat memerlukan output terstruktur yang sangat spesifik dari model dan ditingkatkan dengan menggunakan parameter inferensi berikut:
-
Mode Non Penalaran: Suhu: 0,7 & P Teratas: 0,9
-
Mode Penalaran: Suhu: 1 & P Teratas: 0,9
Pertimbangkan persyaratan latensi
Tip
Model Amazon Nova 2 mampu memanggil alat dengan alasan hidup dan mati. Namun, mode penalaran memiliki dampak signifikan pada latensi.
Untuk aplikasi sensitif latensi, Anda harus mengoptimalkan mode penalaran mati dan menyederhanakan panggilan alat yang diperlukan jika memungkinkan. Pisahkan alur kerja multistep menjadi langkah-langkah diskrit untuk mengurangi ketergantungan model pada memuntahkan parameter yang tidak perlu.
Gunakan kata-kata yang disengaja untuk instruksi panggilan alat
Nama alat: Alat referensi dalam prompt sistem adalah umum dalam sistem pemanggilan alat untuk menginstruksikan model kapan harus memanggil alat. Saat Anda mereferensikan alat dalam prompt, kami sarankan Anda menggunakan nama alat alih-alih referensi atau contoh xml/pythonic.
Use the 'run_shell_command' tool for running shell commands
Call run_shell_command() to run shell commands
Manfaatkan perintah “berpikir”
Untuk semua kasus penggunaan di mana pemikiran bermanfaat untuk pemanggilan alat, kami sarankan Anda memanfaatkan mode penalaran alih-alih mendorong model untuk “berpikir dalam tag” atau menggunakan alat “berpikir”.
Model Amazon Nova 2 dilatih secara ekstensif untuk mode penalaran dan akan menghasilkan hasil yang optimal bila digunakan dalam mode penalaran untuk rantai pemikiran.
Pemesanan panggilan alat
Dalam kasus penggunaan yang mungkin memerlukan penggunaan alat bawaan dan pemanggilan alat asli secara bersamaan, model bias memanggil alat bawaan terlebih dahulu.
Jangan menginstruksikan model untuk bertindak berbeda dalam prompt. Sebagai gantinya, rancang alur kerja Anda untuk mempertimbangkan hal ini.
Misalnya, jika Anda tidak ingin model menggunakan alat bawaan, jangan sertakan dalam alur kerja Anda sehingga model tidak bias terhadapnya.
Buat skema alat berkualitas
Skema alat adalah salah satu tempat utama Anda dapat meminta sistem panggilan alat yang efektif untuk merekayasa. Namun, penting untuk mempertimbangkan apa yang ditangkap dalam skema alat itu sendiri, bagaimana setiap elemen skema dijelaskan secara semantik dan bagaimana sistem meminta referensi alat dan elemen skema dalam instruksi sistem.
Model Amazon Nova 2 dioptimalkan untuk deskripsi ringkas dalam skema alat. Tetap singkat.
Skema alat versus pedoman prompt sistem:
Sertakan dalam skema alat:
-
Fungsionalitas inti: Apa yang dilakukan alat (20-50 kata direkomendasikan)
-
Spesifikasi parameter: Deskripsi yang jelas dari setiap parameter (sekitar 10 kata per parameter)
-
Format yang diharapkan: Tipe data (seperti enum, int, float), bidang wajib dan rentang nilai yang valid
Sertakan dalam prompt sistem:
-
Dedikasikan
#Tool Usagebagian dengan logika orkestrasi (kapan dan mengapa menggunakan alat khusus) dan aturan bisnis (logika bersyarat, persyaratan pengurutan, dan dependensi). -
Strategi penanganan kesalahan: Tambahkan
#Error Handling and Troubleshootingbagian dengan instruksi tentang cara merespons kegagalan atau keluaran yang tidak terduga -
Pemformatan keluaran: Tambahkan detail tentang cara menyajikan kepada pengguna
You are a software engineering issue root cause analysis agent. You are tasked with reviewing a customer issue and examining the repository to identify a plan to resolve the issue. # Core Mandates - **DO NOT** update the original issue that was posted by the user. You only add *additional* comments to the reported issue if necessary # Primary Workflows 1. **Understand:** Analyze the user's request and explore the codebase thoroughly using **get_file_contents** to grasp file structures and conventions. 2. **Plan:** Create a coherent, evidence-based plan for resolving the task and share it with the user following the format below # Tool Usage - **Read the Issue:** Always start by using the **read_issue** tool to get the details about the requested issue - **File Paths:** Always end the file path with "/" if you are searching a directory using the **get_file_contents** tools - **Parallelism:** Execute multiple independent tool calls in parallel when feasible # Error Handling and Troubleshooting - **File Exploration:** If you get an error that a file doesn't exist, try searching at the directory level first to validate the file path # Output Formatting Return your plan in markdown in the following format ## Issue <Your root cause analysis of the issue> ## Resolution Plan <your step by step plan of how to solve the issue>
Buat sub-agen
Pertimbangkan untuk membuat sub-agen khusus alih-alih satu agen dengan banyak alat saat Anda menemukan:
-
Jumlah alat melebihi 20: Set alat besar menjadi sulit untuk dikelola dan meningkatkan kesalahan pemilihan
-
Domain fungsional yang berbeda: Alat secara alami mengelompokkan ke dalam kategori terpisah (seperti pengambilan data versus pemrosesan versus pelaporan)
-
Skema kompleks: Ketika kedalaman parameter melebihi 3-4 level atau alat memiliki saling ketergantungan yang rumit
-
Panjang percakapan: Alur kerja secara teratur melebihi 15-20 putaran dapat mengambil manfaat dari sub-agen khusus
-
Degradasi kinerja: Jika Anda mengamati penurunan akurasi dalam pemilihan alat atau peningkatan latensi
Tip
Server MCP dilengkapi dengan alat dan skema yang tidak dapat Anda kendalikan. Hanya sertakan alat yang diperlukan untuk alur kerja Anda untuk menyelesaikan tugas yang diperlukan.
Gunakan alat untuk input multimodal
Untuk tugas multimodal, kami belum mengamati peningkatan akurasi yang memanfaatkan alat untuk tugas terstruktur (seperti ekstraksi atau pembuatan stempel waktu).
Sebagai gantinya, kami sarankan Anda meninjau bagian yang relevan di bagian Meminta input multimodal untuk cara meminta model dengan sukses menggunakan templat yang disediakan.
Langkah selanjutnya
-
Untuk permintaan multimodal, lihat. Meminta input multimodal