← Back to blog
guide

Melhores formatos de legenda explicados: SRT vs VTT vs ASS vs SSA

TranscribeGo Team·15 de junho de 2026·13 min read
Comparação dos formatos de arquivo de legenda SRT, VTT, ASS e SSA mostrados como cartões rotulados sobre um fundo claro e limpo

Os quatro formatos de legenda mais comuns são SRT, VTT, ASS e SSA. Use SRT para máxima compatibilidade (YouTube, TikTok, Vimeo, a maioria dos players), VTT para web e vídeo HTML5, e ASS ou SSA quando precisar de estilos avançados como fontes personalizadas, cores, posicionamento e efeitos de karaokê. Para cerca de 90% dos casos de uso do dia a dia, SRT é a escolha certa: é texto simples, compatível universalmente e fácil de editar. Você só precisa dos formatos mais complexos quando estilos e o controle preciso na tela importam.

As legendas não são mais um diferencial opcional. Cerca de 85% dos vídeos em redes sociais são assistidos sem som, e os espectadores têm 80% mais probabilidade de assistir a um vídeo inteiro quando ele inclui legendas. A adoção de legendas também continua crescendo: 70% da Geração Z dizem usar legendas o tempo todo ou parte do tempo, mesmo para conteúdo no próprio idioma. Escolher o formato de legenda certo é a diferença entre legendas que funcionam em todo lugar e um arquivo que falha na plataforma onde você realmente publica.

Este guia detalha cada formato, quando usá-lo e como gerar o formato de que você precisa em minutos, sem temporização manual nem software caro.

O que é um formato de legenda, exatamente?

Um formato de legenda é apenas uma estrutura de arquivo de texto que diz três coisas a um player de mídia: qual texto exibir, quando exibi-lo e (às vezes) como estilizá-lo. Todos os formatos armazenam os mesmos dados básicos (linhas de diálogo com tempos), mas diferem em quanta informação extra conseguem carregar.

Pense nisso como um espectro. Em uma ponta você tem formatos simples de texto puro que armazenam apenas tempos e texto. Na outra ponta você tem formatos ricos que armazenam fontes, cores, posições e animações. Mais capacidade geralmente significa menos compatibilidade, então o "melhor" formato sempre depende de onde seu vídeo será reproduzido.

Cartões de comparação lado a lado mostrando os formatos de legenda SRT, VTT, ASS e SSA com suas principais características sobre um fundo claro
Os quatro principais formatos de legenda ficam em um espectro que vai do simples e universal (SRT) ao ricamente estilizado, mas menos compatível (ASS/SSA).

SRT (SubRip) — O padrão universal

SRT, abreviação de SubRip Subtitle, é o formato de legenda mais usado do mundo. É texto puro, legível por humanos e compatível com praticamente todos os players e plataformas de vídeo: YouTube, TikTok, Vimeo, Facebook, VLC, Plex e os serviços de streaming o aceitam.

Um arquivo SRT é construído a partir de "cues" numerados. Cada cue tem um número de índice, uma marca de tempo de início e fim, e uma ou duas linhas de texto:

1
00:00:01,000 --> 00:00:04,500
Welcome to today's presentation.

2
00:00:05,000 --> 00:00:08,200
We'll cover three key topics this quarter.

Observe que a marca de tempo usa uma vírgula antes dos milissegundos (,000). Esse pequeno detalhe importa: é uma das poucas coisas técnicas que separam o SRT do VTT.

Quando usar SRT: Quase sempre. Se você vai publicar em uma plataforma social, compartilhar legendas com um cliente ou simplesmente quer algo que funcione em todo lugar, SRT é a opção padrão segura. Sua única limitação real é o estilo: o SRT não suporta nativamente cores, fontes nem posicionamento na tela. Alguns players respeitam tags básicas <i> e <b>, mas você não deve depender delas.

VTT (WebVTT) — Feito para a web

VTT, ou WebVTT (Web Video Text Tracks), foi projetado especificamente para vídeo HTML5. Se você está incorporando vídeo no seu próprio site com o elemento <track>, VTT é a escolha nativa, baseada em padrões.

VTT é quase idêntico ao SRT, com duas diferenças principais. Primeiro, as marcas de tempo usam um ponto em vez de uma vírgula antes dos milissegundos (00:00:01.000 em vez de 00:00:01,000). Segundo, o VTT suporta estilos e layout básicos: você pode posicionar os cues na tela, adicionar estilos baseados em CSS, marcar quem fala e incluir metadados. Um arquivo VTT também começa com uma linha de cabeçalho WEBVTT.

WEBVTT

1
00:00:01.000 --> 00:00:04.500
Welcome to today's presentation.

Quando usar VTT: Para players web e incorporações de vídeo HTML5, e quando você precisa de estilos leves ou posicionamento que o SRT não oferece. Converter entre SRT e VTT é trivial porque eles compartilham a mesma estrutura: muitas vezes basta trocar vírgulas por pontos e adicionar o cabeçalho. A maioria das ferramentas modernas faz a conversão automaticamente.

ASS (Advanced SubStation Alpha) — Estilo máximo

ASS, abreviação de Advanced SubStation Alpha, é o formato para usuários avançados. Ele suporta de longe a maior variedade de estilos: fontes personalizadas, cores, contornos, sombras, posicionamento preciso, rotação, animações e até efeitos de temporização de karaokê. A comunidade de fansubbing de anime popularizou o ASS justamente porque ele consegue reproduzir uma tipografia complexa na tela.

A contrapartida é a complexidade e a compatibilidade. Um arquivo ASS tem um cabeçalho estruturado que define estilos, além de linhas de diálogo que referenciam esses estilos. É muito menos tolerante para editar à mão, e muitos players (especialmente players web e apps móveis) ignoram os estilos ou não suportam ASS de jeito nenhum. Players construídos sobre a biblioteca libass (como VLC e mpv) o renderizam corretamente.

Quando usar ASS: Quando o estilo é o ponto central: composição tipográfica, placas, vídeos de letras, karaokê ou qualquer projeto em que as legendas precisem ter uma aparência específica e você controla o ambiente de reprodução.

SSA (SubStation Alpha) — O antecessor do ASS

SSA, ou SubStation Alpha, é o formato mais antigo do qual o ASS evoluiu. O ASS é essencialmente "SSA versão 4+", com mais opções de estilo e melhor precisão. O SSA ainda funciona em muitos players, mas raramente há motivo para escolhê-lo em vez do ASS para um projeto novo.

Quando usar SSA: Principalmente para compatibilidade com ferramentas antigas ou arquivos SSA existentes. Para novas legendas estilizadas, ASS é a melhor escolha. Pense no SSA como um ASS legado.

Comparação rápida: qual formato de legenda você deve usar?

Uma regra prática simples: comece pelo SRT. Passe para o VTT se você publica no seu próprio site. Recorra ao ASS (ou SSA para necessidades legadas) somente quando estilos avançados forem essenciais. Seja qual for sua escolha, a conversão entre formatos é simples, então você nunca fica preso.

Como gerar qualquer formato de legenda rápido

Aqui está a parte que a maioria dos guias pula: o formato é a parte fácil. O difícil é conseguir, em primeiro lugar, uma transcrição precisa e perfeitamente temporizada. Transcrever e temporizar legendas manualmente pode levar de cinco a seis vezes a duração do áudio. A abordagem mais inteligente é transcrever automaticamente e exportar o formato de que você precisa.

O TranscribeGo cuida disso de ponta a ponta. Envie um arquivo de vídeo ou áudio, ou cole uma URL do YouTube, TikTok ou Vimeo, e o motor com tecnologia de IA transcreve o áudio com marcas de tempo no nível da palavra automaticamente. Funciona em mais de 90 idiomas com detecção automática de idioma, então você não precisa especificar o idioma com antecedência. Quando a transcrição estiver pronta, exporte-a como arquivo SRT com um clique, e converta para VTT ou outro formato quando sua plataforma precisar.

Painel do TranscribeGo mostrando uma transcrição concluída com o botão Exportar SRT destacado
Envie um arquivo ou cole a URL de um vídeo, e exporte um arquivo SRT perfeitamente temporizado com um clique.

O que torna o TranscribeGo mais do que uma ferramenta de legendas é tudo o que envolve a transcrição. Depois que seu vídeo é transcrito, você pode:

  • Traduzir toda a transcrição para outro idioma com um clique, mantendo as marcas de tempo alinhadas para que as legendas continuem sincronizadas. Essa é a forma mais rápida de localizar legendas para públicos internacionais.
  • Exportar SRT arquivos de legenda prontos para o YouTube, plataformas sociais ou qualquer player de mídia.
  • Gerar resumos com IA de gravações longas, para obter os pontos principais sem ler a transcrição completa.
  • Pesquisar e gerenciar tudo em um painel web limpo em transcribego.com, onde cada transcrição que você já fez fica em um único lugar pesquisável.
Painel de tradução do TranscribeGo mostrando uma transcrição sendo traduzida para outro idioma com as marcas de tempo preservadas
A tradução com um clique mantém as marcas de tempo alinhadas, para que as legendas localizadas continuem perfeitamente sincronizadas entre idiomas.

Além das legendas: notas de voz, lembretes e acesso multicanal

O TranscribeGo não se limita ao app web. Ele funciona no WhatsApp, no Telegram e na web com uma única conta unificada, para que você possa transcrever onde já está. Encaminhe uma nota de voz ou um arquivo de áudio para o bot do TranscribeGo no WhatsApp ou no Telegram e você recebe a transcrição de volta na hora, no chat, e ela também aparece no seu painel web, pronta para exportar como SRT.

Um dos recursos mais amados não tem nada a ver com legendas: os lembretes. As pessoas esquecem coisas, e o TranscribeGo permite configurar lembretes por voz ou texto diretamente dentro do WhatsApp e do Telegram. Basta enviar uma mensagem como:

  • "Me lembre de publicar o vídeo legendado amanhã às 15h"
  • "Me lembre de ligar para o cliente toda segunda às 9h"
  • "Recordame tomar la pastilla a las 8am"

Você pode configurar lembretes únicos ou recorrentes, e o TranscribeGo te avisa no momento certo no mesmo chat que você já usa todos os dias. Para qualquer pessoa que lida com fluxos de trabalho de conteúdo, trabalho com clientes ou simplesmente a vida cotidiana, ele transforma o mesmo app que você usa para transcrição em um assistente de produtividade leve.

Mockups de chat do WhatsApp e do Telegram mostrando uma nota de voz sendo transcrita e um lembrete recorrente sendo configurado
Transcreva notas de voz e configure lembretes por voz ou texto diretamente dentro do WhatsApp e do Telegram, tudo vinculado a uma única conta unificada.

Erros comuns a evitar com os formatos de legenda

Enviar o formato errado para a plataforma errada. Não envie um arquivo ASS para uma plataforma que só lê SRT: os estilos serão removidos ou o arquivo rejeitado. Combine o formato com o destino.

Confundir vírgula e ponto nas marcas de tempo. Esse é o erro clássico de SRT contra VTT. O SRT usa vírgulas (00:00:01,000), o VTT usa pontos (00:00:01.000). Se errar, o player pode se recusar a carregar o arquivo. Exportar de uma ferramenta dedicada evita isso por completo.

Estilizar demais quando não é preciso. O ASS é poderoso, mas se você publica no YouTube ou nas redes sociais, todo esse estilo é descartado de qualquer forma. Poupe-se da complexidade e fique com o SRT, a menos que você controle o ambiente de reprodução.

Deixar as linhas ficarem longas demais. Independentemente do formato, mantenha cada linha abaixo de cerca de 42 caracteres para que as legendas sejam confortáveis de ler em qualquer tela, especialmente no celular.

Try TranscribeGo Free

10 free minutes. No credit card required.

Get Started →

Perguntas frequentes

Qual é o melhor formato de legenda no geral?

Para a maioria das pessoas, SRT é o melhor formato de legenda. É texto puro, fácil de editar e compatível com praticamente todas as plataformas e players, incluindo YouTube, TikTok, Vimeo, Facebook e VLC. Use VTT para vídeo web HTML5, e recorra a ASS ou SSA somente quando precisar de estilos avançados como fontes personalizadas, cores e posicionamento. O TranscribeGo exporta SRT por padrão e funciona na web, no WhatsApp e no Telegram.

Qual é a diferença entre SRT e VTT?

SRT e VTT são quase idênticos em estrutura. As duas principais diferenças são que as marcas de tempo do VTT usam um ponto antes dos milissegundos (00:00:01.000) enquanto o SRT usa uma vírgula (00:00:01,000), e que o VTT suporta estilos leves, posicionamento na tela e metadados que o SRT não tem. O VTT também começa com uma linha de cabeçalho WEBVTT. Use VTT para players web HTML5 e SRT para quase tudo o mais.

Qual é a diferença entre ASS e SSA?

ASS (Advanced SubStation Alpha) é a versão mais nova e mais capaz do SSA (SubStation Alpha), na prática SSA versão 4+. O ASS adiciona mais opções de estilo, melhor posicionamento e controle mais fino sobre fontes e efeitos. O SSA ainda funciona em muitos players, mas para qualquer projeto novo de legendas estilizadas, ASS é a melhor escolha. Trate o SSA como um formato legado que você só usa para compatibilidade com arquivos ou ferramentas antigas.

Posso converter entre formatos de legenda?

Sim. Como SRT e VTT compartilham quase a mesma estrutura, converter entre eles é simples e geralmente automático nas ferramentas de legenda. Converter de ou para ASS/SSA também é possível, embora os estilos possam ser perdidos ao passar para um formato mais simples como SRT. A abordagem mais fácil é gerar sua transcrição uma vez e exportar o formato de que sua plataforma precisa.

Qual formato de legenda o YouTube suporta?

O YouTube suporta SRT (a opção mais comum), além de VTT e vários outros formatos. SRT é recomendado para envios ao YouTube porque é simples e confiável. Qualquer estilo de um formato como ASS será ignorado, já que o YouTube aplica seu próprio estilo de legenda. Exporte um arquivo SRT do TranscribeGo e envie-o diretamente no YouTube Studio.

Como crio legendas sem temporização manual?

Use uma ferramenta de transcrição automática. Com o TranscribeGo, você envia um arquivo de vídeo ou áudio (ou cola uma URL do YouTube, TikTok ou Vimeo) e o motor de IA gera uma transcrição com marcas de tempo no nível da palavra em mais de 90 idiomas. Depois exporte um arquivo SRT com um clique. Você também pode encaminhar notas de voz para o bot do TranscribeGo no WhatsApp ou no Telegram, traduzir a transcrição para outro idioma e gerenciar tudo no seu painel web.

T
TranscribeGo Team

Building the future of AI transcription. We write about transcription, productivity, and how to get the most out of audio and video content.

Share

Related Articles