Uma linha do tempo paralela: o surgimento de grandes modelos de linguagem - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Uma linha do tempo paralela: o surgimento de grandes modelos de linguagem

Enquanto as estruturas de agentes evoluíam, uma revolução paralela e convergente estava acontecendo no processamento de linguagem natural e no aprendizado de máquina:

  • 2017 — transformers: O paper Attention Is All You Need (Vaswani et al. 2017) apresentou a arquitetura do transformador, que melhorou drasticamente a forma como as máquinas processam e geram linguagem.

  • 2022 - ChatGPT: A OpenAI lançou uma interface baseada em bate-papo para o GPT-3.5 chamada ChatGPT, que permitiu uma conversa natural e interativa com um sistema de IA de uso geral.

  • 2023 — código aberto LLMs: os lançamentos do Llama, Falcon e Mistral tornaram modelos poderosos amplamente acessíveis e aceleraram o desenvolvimento de estruturas de agentes em ambientes corporativos e de código aberto.

Essas inovações transformaram os modelos de linguagem em mecanismos de raciocínio capazes de analisar o contexto, planejar ações e encadear respostas, além de LLMs se tornarem os principais facilitadores de agentes de software inteligentes.