Tamanho de fonte
Alto contraste
Altura de linha
Entrar Cadastrar

Como criar áudios com a API da OpenAI?

Avatar de Luiza Cherobini Pereira Luiza Cherobini Pereira
4 minutos de leitura 23/06/2024 • Atualizado 7 meses atrás 5xp

Você já imaginou transformar textos em áudios de forma simples e prática? Com a API da OpenAI, isso é possível! Neste tutorial, vamos aprender como criar áudios com a API da OpenAI, uma ferramenta poderosa que pode ser utilizada em diversas aplicações, desde a criação de audiolivros até a inclusão digital. Vamos explorar passo a passo como utilizar essa tecnologia incrível.

ondas de som 3d

Introdução

A API da OpenAI oferece uma série de funcionalidades avançadas de inteligência artificial, incluindo a capacidade de transformar texto em áudio. Essa funcionalidade é especialmente útil para quem está começando na área de IA e deseja implementar soluções práticas sem a necessidade de treinar algoritmos complexos. Vamos ver como criar áudios com a API da OpenAI e entender em que situações isso pode ser útil.

Por que criar áudios com a API da OpenAI?

Transformar texto em áudio pode ser útil em diversas situações, como:

  • Acessibilidade: Facilitar o acesso à informação para pessoas com deficiência visual.
  • Educação: Criar audiolivros e materiais educativos em áudio.
  • Automação: Gerar respostas de voz automáticas em assistentes virtuais.
  • Entretenimento: Produzir podcasts e narrações de histórias.

Agora, vamos ao passo a passo para criar áudios com a API da OpenAI.

Passo 1: Configurando o Ambiente

Antes de começar, precisamos configurar nosso ambiente de desenvolvimento. Certifique-se de ter o Python instalado em seu computador. Em seguida, instale a biblioteca da OpenAI e a biblioteca dotenv para gerenciar variáveis de ambiente.

pip install openai python-dotenv

Passo 2: Obtendo a API Key da OpenAI

Para utilizar a API da OpenAI, você precisará de uma chave de API (API Key). Siga os passos abaixo para obter a sua:

  1. Acesse o site da OpenAI.
  2. Crie uma conta ou faça login.
  3. Navegue até a seção de API Keys e gere uma nova chave.

Guarde essa chave em um arquivo .env para manter suas credenciais seguras:

OPENAI_API_KEY=your_api_key_here

Passo 3: Escrevendo o Código para Criar Áudios

Agora que temos tudo configurado, vamos escrever o código para transformar texto em áudio. Crie um arquivo Python e adicione o seguinte código:

import openai
from dotenv import load_dotenv
import os

# Carregar variáveis de ambiente do arquivo .env
load_dotenv()

# Obter a chave da API da OpenAI
api_key = os.getenv("OPENAI_API_KEY")

# Configurar o cliente da OpenAI
openai.api_key = api_key

# Texto que será transformado em áudio
texto = '''
Python é uma linguagem de programação de alto nível, interpretada de script, imperativa, orientada a objetos, 
funcional, de tipagem dinâmica e forte. Foi lançada por Guido van Rossum em 1991. Atualmente, possui um modelo 
de desenvolvimento comunitário, aberto e gerenciado pela organização sem fins lucrativos Python Software Foundation.
'''

# Gerar áudio a partir do texto
resposta = openai.Audio.create(
    model='tts-1',
    voice='onyx',
    input=texto
)

# Salvar o áudio em um arquivo
with open('fala.mp3', 'wb') as f:
    f.write(resposta['audio'])

Passo 4: Executando o Código

Salve o arquivo e execute-o no terminal:

python seu_arquivo.py

Se tudo estiver configurado corretamente, um arquivo fala.mp3 será gerado com o áudio do texto fornecido.

Explorando Opções de Voz

A API da OpenAI oferece diferentes opções de voz que você pode utilizar. No exemplo acima, utilizamos a voz onyx, que é bem adequada para o português do Brasil. Outras opções incluem alloy, echo, fable, nova e shimmer. Experimente diferentes vozes para encontrar a que melhor se adapta às suas necessidades.

Conclusão

Criar áudios com a API da OpenAI é uma tarefa simples e pode ser extremamente útil em diversas aplicações. Seja para melhorar a acessibilidade, criar conteúdos educativos ou automatizar respostas de voz, essa tecnologia oferece uma solução prática e eficiente. Esperamos que este tutorial tenha sido útil e que você se sinta inspirado a explorar ainda mais as possibilidades da inteligência artificial.

Se você gostou deste conteúdo e quer aprender mais sobre IA e outras tecnologias, continue acompanhando nosso blog e explore nossos cursos na Asimov Academy. Até a próxima!

Imagem de um notebook

Cursos de programação gratuitos com certificado

Aprenda a programar e desenvolva soluções para o seu trabalho com Python para alcançar novas oportunidades profissionais. Aqui na Asimov você encontra:

  • Conteúdos gratuitos
  • Projetos práticos
  • Certificados
  • +20 mil alunos e comunidade exclusiva
  • Materiais didáticos e download de código
Inicie agora

Comentários

30xp
Comentar
Faça parte da discussão Crie sua conta gratuita e compartilhe
sua opinião nos comentários
Entre para a Asimov
inviável usar libs de empresas pra fazer TTS. Por favor faça um curso para usar o Coqui-TTS(ou libs melhores) para fazer o TTS em PTBR. Já briguei muito com esse CoquiTTS, consegui rodar, mas até agora não consegui deixar ele liso. Foquem em rodar soluções locais porque soluções de empresa geralmente são inviáveis porque você fica na mão de uma empresa e seus famintos acionistas e CEOs por cada vez mais lucro.
LB
Luiz Jeronimo de Freitas Barroso 04/06/2025