12 minutos de leitura

Técnicas de visualização de dados financeiros no Trading Quantitativo

Por Rodrigo Soares Tadewald
Conteúdos do artigo

A visualização de dados financeiros no trading quantitativo exige dados em grande quantidade e de fontes confiáveis. Esses dados são o principal ativo de um trader quantitativo, pois sem eles o processo de desenvolvimento de estratégias se torna impossível. 

A cada minuto de mercado, é gerado um volume de informações maior do que seríamos capazes de analisar em anos. Portanto, tão importante quanto possuir bons datasets (conjuntos de dados) é saber o ângulo certo para analisá-los.

Neste artigo, faremos uma revisão das principais técnicas de amostragem de dados financeiros na ótica de um trader quantitativo. Mas antes precisamos compreender um conceito ainda mais básico: o de séries temporais.

Séries temporais

Define-se uma série temporal como sendo um conjunto de observações ordenadas de forma cronológica. Definição muito genérica, não? Mas não poderia ser diferente, visto que as séries temporais são objeto de estudo de diversas áreas, tais como:

  • Medicina, quando um médico monitora os batimentos cardíacos de um paciente por meio de um eletrocardiograma;
  • Física, quando se observa a trajetória de uma partícula no tempo;
  • Meteorologia, quando se monitora as pressões atmosféricas de determinada região com o passar dos dias.

No nosso caso, estaremos interessados na evolução dos preços dos ativos ao longo do tempo.

Eletrocardiograma como exemplo de série temporal
Eletrocardiograma é um tipo de série temporal

Por se tratar de um conceito habitual em diversas áreas, muitas técnicas matemáticas já foram desenvolvidas nesse campo ao longo dos anos. Elas buscam solucionar problemas comuns de quem precisa lidar com séries temporais, como estratégias de modelagem de séries, decomposição em componentes estáticos e estocásticos, análise de sazonalidade, correlação, causalidade, etc.

Dominar as principais técnicas de visualização de dados financeiros é uma ferramenta essencial do bom trader quantitativo. Por isso, recomendamos o livro Análise de Séries Temporais, de Pedro Alberto Morettin e Clélia Maria de Castro Toloi, que é uma referência valiosa para aqueles interessados em explorar e compreender a análise de séries temporais por meio de fundamentos teóricos e práticos.

Livro Análise de Séries Temporais, de Pedro Morettin e Clélia Toloi
Exemplo de gráficos de análise de série temporal
Exemplo de gráficos de análise de série temporal

Como se formam as séries temporais do mercado financeiro?

Assim como o batimento cardíaco é o evento-chave em uma série temporal de um eletrocardiograma, as transações financeiras de um ativo são a peça central no trading quantitativo.

Por mais que as operações possam ocorrer de diversas formas (por exemplo, através do mercado de balcão, quando um investidor fecha negócio fora do ambiente tradicional da bolsa), focaremos nossa atenção aqui apenas em negócios realizados em ambientes eletrônicos. 

Hoje em dia, a maior parte das operações financeiras ocorrem no chamado book de ofertas (ou livro de ofertas). Nele, são registradas todas as intenções de compra e venda de um determinado ativo. Quando determinado participante do mercado aceita uma oferta de compra ou venda já existente no book, fecha-se um negócio.

Exemplo de book de ofertas (ou livro de ofertas) do mercado financeiro

Ao registrarmos as transações financeiras de um ativo e as ordenarmos cronologicamente, damos origem à sua Série Temporal de Transações (STT). Essa é a série temporal mais importante na análise quant. É dela que derivam todas as outras, como as intradiárias e de fechamento. 

Exemplo de transação financeira em que comprador encontra vendedor
Transação financeira
Exemplo de séries temporais de transações - STTs
Transações analisadas ao longo do tempo originam as séries temporais de transações – STTs

Os famosos candlesticks são representações simplificadas dessa série temporal. 

Chamaremos aqui tanto a STT quanto seus derivados de séries tradicionais, as quais narram a história da evolução dos preços dos ativos.

Tipos de séries tradicionais e suas estratégias

Além das STTs, um analista quantitativo pode também trabalhar com a Série Temporal do Book de Ofertas – STBO. Algumas estratégias utilizam ambas as séries para tentar prever desbalanceamentos imediatos que podem ocorrer na relação oferta e procura de determinado ativo e, assim, tentar lucrar ao se antecipar a um micromovimento do mercado. A esse tipo de estratégia damos o nome de high-frequency-trading ou negociação de alta frequência

High-frequency-trading (HFT)

Esta classe de estratégias é a que mais nos deu resultado nos últimos anos na Asimov Finance (empresa focada em desenvolvimento de estratégias financeiras e que é “irmã” da Asimov Academy), ao operarmos os mercados de criptomoedas e de derivativos na B3.

Alguns de nossos algoritmos chegam a fazer dezenas de operações por ativo em um único dia. Ao combinar múltiplos instrumentos financeiros, a quantidade de transações pode passar dos milhares.

Exemplo de high-frequency-trading (técnica de visualização de dados financeiros)

Tais estratégias têm por característica um baixo retorno por trade (pois o tempo médio de exposição ao mercado é reduzido) aliado a uma elevada quantidade de operações em um curto espaço de tempo. Tal característica permite ao trader obter uma estimativa precisa da real qualidade de seu modelo em pouquíssimo tempo (uma vez que em poucos dias já terá uma amostragem suficientemente grande de operações).

Dados tick-by-tick

Modelos HFT só podem ser concebidos, simulados e operacionalizados utilizando STTs e STBOs. Juntas, essas séries são popularmente conhecidas como “dados tick-by-tick”.

Dados tick-by-tick são o mais alto grau de qualidade de um dataset tradicional de mercado. Mas, infelizmente, trabalhar com esses dados financeiros no trading quantitativo possui um alto custo.

Se possuíssemos capacidade computacional ilimitada, não seria preciso lidar com simplificações dos dados tick-by-tick. Porém, por mais rápidos que sejam os computadores modernos, ainda sofrem ao tentar simular estratégias apenas com dados desse tipo.

Para se ter uma ideia da complexidade computacional, uma STT de dois anos de Petrobrás (PETR4) possui mais de 20 milhões de linhas e, se armazenada em formato .csv, pesa 2.5 GB. 

Série Temporal de Transações (STT) de 2 anos de PETR4
STT de 2 anos de PETR4 – mais de 20 milhões de entradas!

Se analisarmos o dólar futuro, os dados ainda são impressionantes.

Um dia de negociações de WDO possui em média 2 milhões de negociações, quando um ano armazenado de dados financeiros pode facilmente ultrapassar 50 GB. Estime agora o espaço necessário para armazenar 10 anos de STTs dos mais de 300 ativos da B3. Tudo isso sem levar em consideração as STBOs, que podem chegar a pesar 20x mais que uma STT normal.

No entanto, se o armazenamento fosse o único problema, seria possível superá-lo. Porém, usar de maneira eficiente esses dados é o principal desafio.

Ao desenvolver uma estratégia de trading, o analista quantitativo precisa criar um script que, utilizando os dados históricos, simule todas as operações feitas no passado. Ao trabalhar com dados tick-by-tick, é comum que uma única simulação leve algumas horas.

Durante a construção dos modelos, precisamos avaliar centenas de parâmetros diferentes da mesma estratégia. Sendo assim, muitas vezes se faz necessário lidar com simplificações nas séries temporais. 

Amostragem temporal (time bars) e candlesticks

A técnica de simplificação mais comum e mais popular na visualização de dados financeiros é a amostragem temporal.

Se você já deu seus primeiros passos no mercado financeiro, com toda certeza já deve ouvido falar de candlesticks ou teve contato com gráficos como este:

Exemplo de candlesticks para vizualização de dados financeiros para trading quantitativo

Nos candlesticks, as transações financeiras agrupam-se em janelas temporais de tamanho fixo (exemplo: operações ocorridas entre 10:00 e 10:10, operações entre 10:10 e 10:20, etc.). A transação de maior (menor) valor naquele intervalo é indicada pela posição vertical da linha superior (inferior). Se a primeira transação do intervalo for maior (menor) que a última, o interior do candle será vermelho (verde), indicando uma queda (alta) de preços no período.  

E aqui vem a parte mais curiosa…

Agrupamento de operações baseadas em janelas temporais equidistantes é apenas uma das infinitas técnicas possíveis de amostragem. Porém, ela é tão dominante nos softwares de mercado hoje em dia, que os usuários nem mais questionam o porquê de só a utilizarmos – e ficam cegos aos problemas decorrentes do uso dessa única técnica de amostragem.

Tradingview, uma das principais ferramentas para visualização de dados financeiros para trading quantitativo
Tradingview, uma das principais ferramentas de análise de dados de mercado. Repare que só podemos alterar parâmetros de tamanho da janela temporal.

Mas qual é o problema dos candlesticks e time bars? Por que o uso deles pode prejudicar seu fluxo de desenvolvimento de estratégias ou limitar o retorno potencial de suas estratégias? Precisamos responder a tais perguntas com calma. Para isso, leia o artigo Candlesticks e Time Bars: por que você deveria parar de usá-los nas suas estratégias.

Dúvidas ou sugestões? Deixe nos comentários abaixo.

Inscreva-se gratuitamente e fique atualizado

Receba toda semana um resumo dos principais conteúdos da Asimov direto no seu e-mail. 100% livre de spam.

Áreas de interesse: