Pular para o conteudo principal

Como falar sobre disponibilidade e confiabilidade

Como responder sobre sistema confiável sem cair em promessa vazia, número bonito sem contexto ou discurso arquitetural.

Andrews Ribeiro

Andrews Ribeiro

Founder & Engineer

Trilha

Trilha para entrevistas de senior full stack

Etapa 14 / 14

O problema

Tem resposta de entrevista que parece forte porque usa as palavras certas:

  • alta disponibilidade
  • resiliência
  • tolerância a falhas
  • sistema confiável

Só que, quando você aperta um pouco, descobre que a resposta estava vazia.

Porque não dizia:

  • disponível para quem
  • confiável em qual fluxo
  • com qual custo
  • em que tipo de falha
  • e com qual comportamento degradado

Esse é o erro comum.

A pessoa fala de confiabilidade como se fosse um selo abstrato de qualidade técnica.

Mas confiabilidade real nunca é abstrata.

Ela sempre depende de:

  • contexto
  • medição
  • expectativa
  • e compromisso com o comportamento do sistema

Modelo mental

Pense assim:

disponibilidade fala sobre o sistema responder. Confiabilidade fala sobre o sistema se comportar como precisa, de forma consistente, ao longo do tempo.

Essa distinção ajuda muito.

Porque um sistema pode estar disponível e ainda assim ser pouco confiável.

Por exemplo:

  • responde devagar demais
  • falha num fluxo crítico
  • oscila de forma imprevisível
  • exige intervenção manual demais
  • entrega resultado inconsistente

Disponibilidade importa.

Mas sozinha não fecha a conversa.

Quebrando o problema

Disponibilidade não é a história inteira

Esse é o primeiro ajuste importante.

Muita gente reduz tudo a uptime.

Algo como:

  • “nosso sistema tem 99,9% de disponibilidade”

Legal.

Mas isso ainda não responde:

  • o checkout funciona?
  • o login está rápido?
  • o sistema degrada bem sob carga?
  • os erros estão concentrados num fluxo vital?

Disponibilidade mede uma parte importante.

Confiabilidade olha o comportamento que realmente interessa para o produto e para a operação.

Confiabilidade sem contexto vira marketing técnico

Frases como:

  • “nosso sistema é resiliente”
  • “a arquitetura é altamente confiável”
  • “temos alta disponibilidade”

soam fortes, mas podem ser só embalagem.

Para soar real, a resposta precisa ganhar forma:

  • qual comportamento você quer garantir
  • para qual fluxo
  • em que janela
  • com que tipo de falha em mente
  • com que custo aceitável

Sem isso, a fala vira arquitetura de slide.

Todo nível de confiabilidade cobra preço

Esse é um dos sinais mais claros de maturidade.

Se a resposta só fala de confiabilidade como se fosse obviamente boa e sem custo, está fraca.

Mais confiabilidade costuma cobrar em algum lugar:

  • mais complexidade
  • mais custo de infraestrutura
  • mais restrição de release
  • mais trabalho operacional
  • mais investimento em observabilidade e automação

Então falar bem do tema exige mostrar:

  • o alvo
  • o custo
  • e por que esse custo se justifica

Cinco noves sem contexto quase sempre é bravata

Esse é um tropeço clássico.

A pessoa fala número agressivo para parecer madura:

  • 99,99%
  • 99,999%

Só que não diz:

  • para qual funcionalidade
  • em que período
  • medido como
  • com que impacto real no negócio

Sem esse contexto, o número impressiona menos do que parece.

Às vezes uma meta mais modesta e honesta é muito mais madura do que um percentual heroico sem sustentação.

Comportamento degradado também faz parte da confiabilidade

Esse ponto costuma diferenciar resposta forte de resposta média.

Sistema confiável não é só o que “nunca cai”.

Também pode ser o que:

  • cai de forma limitada
  • degrada um fluxo secundário para proteger o principal
  • falha com mensagem clara
  • se recupera sem intervenção caótica

Ou seja:

confiabilidade também fala sobre como o sistema falha.

Não só sobre o melhor cenário.

Em entrevista, menos slogan e mais exemplo

Melhor do que falar “eu me importo com confiabilidade” é mostrar algo como:

  • que fluxo você protegeria mais
  • que sinal acompanharia
  • que tipo de degradação aceitaria
  • que trade-off faria entre velocidade e robustez

Isso transforma o tema em julgamento.

E julgamento é o que o avaliador quer enxergar.

Exemplo simples

Imagine um produto em que o checkout é o fluxo mais crítico.

Resposta fraca:

“Eu pensaria em uma arquitetura altamente disponível e resiliente para garantir confiabilidade.”

Parece forte, mas ainda é vazia.

Resposta melhor:

“Para mim, confiabilidade aqui não é só dizer que o sistema fica no ar. É garantir que o checkout continua funcionando com previsibilidade num nível compatível com o impacto de receita. Eu pensaria em como medir sucesso real do fluxo, em que tipo de degradação é aceitável e em que custo operacional vale pagar para proteger isso. Se eu falar de alta disponibilidade sem dizer qual comportamento crítico estou protegendo e como isso é medido, a resposta fica bonita demais e útil de menos.”

Essa resposta funciona porque mostra:

  • diferença entre disponibilidade e confiabilidade
  • foco no fluxo que importa
  • medição
  • trade-off

Erros comuns

  • Tratar disponibilidade e confiabilidade como sinônimos.
  • Usar número agressivo sem contexto de medição e custo.
  • Falar de resiliência sem dizer como o sistema falha ou se recupera.
  • Ignorar o impacto de produto ao discutir confiabilidade.
  • Vender arquitetura como se complexidade não tivesse preço.

Como um senior pensa

Quem amadureceu costuma pensar assim:

“Confiabilidade boa não é a que soa mais robusta na apresentação. É a que protege o comportamento certo, com medição honesta e custo justificável.”

Essa lente é muito boa.

Porque ela impede dois excessos:

  • prometer mais do que o sistema realmente entrega
  • simplificar demais um problema operacional real

Senioridade aqui não é superestimar robustez.

É falar com precisão sobre limite, risco e expectativa.

O que o entrevistador quer ver

Quando esse tema aparece, o avaliador normalmente está tentando entender se você:

  • diferencia disponibilidade de confiabilidade
  • conecta confiabilidade com experiência real do produto
  • reconhece custo e trade-off
  • evita discurso de arquitetura performática
  • fala com honestidade sobre falha, medição e recuperação

Resposta forte costuma mostrar:

  1. qual fluxo importa mais
  2. como você definiria confiabilidade para esse caso
  3. como medir isso
  4. que custo ou trade-off aceitaria para proteger esse comportamento

Se isso aparece, a resposta já sobe bastante.

Confiabilidade não é dizer que o sistema aguenta tudo. É deixar claro o que ele precisa sustentar, com que consistência e a que preço.

Quando a resposta parece bonita demais para um sistema real, geralmente está faltando contexto ou honestidade.

Resumo rápido

O que vale manter na cabeça

Checklist de pratica

Use isto ao responder

Você concluiu este artigo

Parte da trilha: Trilha para entrevistas de senior full stack (14/14)

Próximo artigo Distributed tracing: o que é e como usar para depurar sistema Artigo anterior Bug intermitente: por onde começar

Continue explorando

Artigos relacionados