Tamanho de fonte
Alto contraste
Altura de linha

Assistants da OpenAI: Retrieval para Iniciantes

Avatar de Luiza Cherobini Pereira Luiza Cherobini Pereira
4 minutos de leitura 5 meses atrás

Se você está começando a explorar o mundo da Inteligência Artificial (IA) e quer entender como utilizar a funcionalidade de retrieval dos assistants da OpenAI, você está no lugar certo! Neste post, vamos explicar o que é o retrieval, como ele funciona e como você pode utilizá-lo em suas aplicações de IA. Vamos lá!

O que é o Retrieval dos Assistants da OpenAI?

O retrieval dos assistants da OpenAI é uma ferramenta poderosa que permite que os modelos de IA acessem e utilizem informações externas para responder a perguntas de forma mais precisa e contextualizada. Em outras palavras, o retrieval permite que o assistente busque dados em documentos fornecidos pelo usuário, como PDFs, arquivos de texto, entre outros, e utilize essas informações para gerar respostas mais relevantes.

Como Funciona o Retrieval?

O processo de retrieval envolve várias etapas:

  1. Carregamento do Arquivo: O usuário carrega um arquivo (por exemplo, um PDF) para o assistente.
  2. Segmentação e Indexação: A OpenAI segmenta o documento em partes menores e cria embeddings (representações vetoriais) dessas partes.
  3. Busca Vetorial: Quando uma pergunta é feita, o assistente realiza uma busca vetorial para encontrar os trechos mais relevantes do documento que podem ajudar a responder à pergunta.
  4. Geração da Resposta: O assistente utiliza os trechos recuperados para gerar uma resposta contextualizada e precisa.

Como Utilizar o Retrieval dos Assistants da OpenAI?

Vamos ver um exemplo prático de como utilizar o retrieval dos assistants da OpenAI. Suponha que você tenha um arquivo PDF com as demonstrações de resultado da empresa Ambev e queira fazer perguntas sobre esses dados.

Passo 1: Carregar o Arquivo

Primeiro, você precisa carregar o arquivo PDF para o assistente. No exemplo, utilizaremos a divulgação dos resutados financeiros da Ambev de 2023. Aqui está um exemplo de código em Python para fazer isso:

import openai
from dotenv import load_dotenv, find_dotenv

_ = load_dotenv(find_dotenv())

client = openai.Client()

# Enviando o arquivo para o servidor da OpenAI
file = client.files.create(
    file=open('arquivos/divulgacao_resultado_ambev_4T23.pdf', 'rb'),
    purpose='assistants'
)

Passo 2: Criar o Assistant

Em seguida, você cria o assistant e especifica que deseja utilizar a ferramenta de retrieval:

# Criando o assistant
assistant = client.beta.assistants.create(
    name="Analista de Demonstrações Financeiras",
    instructions="Você é um analista de demonstrações financeiras da Ambev. Você tem acesso à demonstração de resultado do 4º trimestre de 2023. Baseado apenas no documento que você tem acesso, responda as perguntas do usuário.",
    tools=[{'type': 'retrieval'}],
    file_ids=[file.id],
    model='gpt-4-turbo-preview'
)

Passo 3: Fazer Perguntas ao Assistant

Agora, você pode fazer perguntas ao assistant e ele utilizará o retrieval para buscar as informações relevantes no documento carregado:

# Criamos uma thread
thread = client.beta.threads.create()

# Adicionamos uma mensagem à thread
pergunta = 'Qual o volume de cerveja vendido no Brasil segundo o documento?'

messages = client.beta.threads.messages.create(
    thread_id=thread.id,
    role='user',
    content=pergunta
)

# Solicitamos ao assistant que rode a thread
run = client.beta.threads.runs.create(
    thread_id=thread.id,
    assistant_id=assistant.id,
    instructions='O nome do usuário é Adriano.'
)

# Aguardamos a finalização do processo
import time

while run.status in ['queued', 'in_progress', 'cancelling']:
    time.sleep(1)
    run = client.beta.threads.runs.retrieve(
        thread_id=thread.id,
        run_id=run.id
    )

print(run.status)

Passo 4: Verificar a Resposta

Finalmente, você pode verificar a resposta gerada pelo assistant:

print(messages.data[0].content[0].text.value)

A resposta pode ser algo como:

Segundo o documento, o volume de cerveja vendido no Brasil pela Ambev no ano de 2023 foi de 183.659 mil hectolitros, o que representa uma redução de 11% em relação ao ano anterior, 2022, quando o volume foi de 185.7497 mil hectolitros.

Conclusão

O retrieval dos assistants da OpenAI é uma ferramenta incrível para quem está começando na área de IA e quer criar aplicações práticas e úteis. Com ele, você pode aumentar a capacidade dos modelos de IA, permitindo que eles acessem e utilizem informações externas para gerar respostas mais precisas e contextualizadas.

Esperamos que este guia tenha ajudado você a entender o que é o retrieval e como utilizá-lo. Experimente carregar seus próprios documentos e fazer perguntas ao assistant para ver como ele pode ajudar em suas tarefas diárias. Boa sorte e até a próxima!

Se você gostou deste post e quer aprender mais sobre IA e programação, confira nossos outros artigos e cursos na Asimov Academy. Estamos aqui para ajudar você a dar os primeiros passos no mundo da Inteligência Artificial!

Imagem de um notebook

Cursos de programação gratuitos com certificado

Aprenda a programar e desenvolva soluções para o seu trabalho com Python para alcançar novas oportunidades profissionais. Aqui na Asimov você encontra:

  • Conteúdos gratuitos
  • Projetos práticos
  • Certificados
  • +20 mil alunos e comunidade exclusiva
  • Materiais didáticos e download de código
Inicie agora

Comentários

Comentar
Faça parte da discussão Crie sua conta gratuita e compartilhe
sua opinião nos comentários
Entre para a Asimov