Conversor de Homoglifos e Caracteres Confundíveis

Conversor de Homoglifos — Detectar e Limpar Unicode

A conversão é o melhor esforço: confusão mapeada e dobramento NFKC são determinísticas, mas alguns Unicode legítimos não serão sinalizados.

Seu texto

Colar ou digitar – os resultados são atualizados conforme você digita (levemente rebatidos para entradas longas).

0 caractere analisado
0 suspeito
Preservar Unicode legível
Modo de conversão
Original (caracteres suspeitos marcados)

Caracteres suspeitos na visualização original são sublinhados e rotulados como “susp.” além de realçar a cor.

Saída limpa
Análise de personagem

Nenhum personagem para analisar ainda. Cole o texto acima para ver um detalhamento de homoglifos e confusões.

Detecte caracteres Unicode visualmente confundíveis e converta para ASCII mais seguro ou Unicode normalizado. Grátis no navegador.

O que este conversor homoglifo faz

Um conversor homoglifo detecta caracteres Unicode que podem parecer letras ou dígitos latinos comuns (confusíveis) e mostra como eles foram normalizados ou substituídos. Você também pode executar Generate homoglyphs para criar strings determinísticas semelhantes a paródias a partir de ASCII simples para teste. Este conversor gratuito de confusão e verificador de confusão unicode é executado inteiramente em seu navegador - use-o como uma ferramenta de normalização unicode, limpador de texto falso ou conversor de caracteres semelhantes para segurança e moderação.

Como usar esta ferramenta de normalização unicode

  1. Cole ou digite o texto que deseja inspecionar na área de entrada.
  2. Escolha Preservar Unicode Legível, Strict ASCII Fallback ou Gerar homóglifos dependendo se você está limpando texto colado ou construindo amostras de teste a partir de ASCII.
  3. Compare o original (com destaques) e a saída lado a lado; revise a tabela de análise para pontos de código e motivos.
  4. Use Copiar texto de saída para copiar o resultado ou Limpar para redefinir.

Modos de conversão: Unicode legível vs unicode para ASCII vs gerar

  • Preservar Unicode legível aplica primeiro o mapa confundível agrupado e, em seguida, a normalização NFKC quando altera um caractere. A saída ainda pode conter letras não ASCII que não foram sinalizadas.
  • Strict ASCII Fallback usa as mesmas regras de detecção, mas prefere substituições ASCII do mapa. Os personagens que não estão no mapa permanecem como estão, a menos que o NFKC os altere; este modo é mais rigoroso e melhor para fluxos de trabalho de limpeza de texto falso.
  • Gerar homoglifos percorre sua entrada da esquerda para a direita e substitui cada letra ou dígito ASCII por um único homoglifo determinístico do mesmo mapa agrupado (inverso da limpeza). Os caracteres sem um substituto escolhido permanecem ASCII.

O que é considerado suspeito aqui

Nos modos de limpeza, um caractere é sinalizado quando é conhecido como confundível com uma substituição definida ou quando a normalização NFKC o altera (por exemplo, dígitos de largura total). No modo de geração, “suspeito” marca cada posição onde uma letra ou dígito ASCII foi substituída. Esta não é uma auditoria completa de segurança Unicode – apenas regras determinísticas.

Casos de uso comuns

  • Verificando nomes de usuário, domínios ou ataques homóglifos falsificados em strings coladas.
  • Revisão de moderação e confiança e segurança de truques de personagens semelhantes.
  • Depuração do desenvolvedor de problemas de codificação junto com uma visualização do detector homoglifo.

Limitações e notas de segurança

O mapa incluído abrange cirílico comum, grego e sósias de largura total - nem todo Unicode pode ser confundido. O modo de geração é apenas para testes autorizados; não o use para enganar as pessoas ou contornar proteções. Os resultados são determinísticos e não pontuações de risco baseadas em ML. Sempre combine com a revisão humana para decisões de alto risco.

Privacidade

Todas as detecções e conversões são executadas localmente em JavaScript após o carregamento da página. Nenhum texto é enviado a um servidor para processamento.

Perguntas frequentes

O que é um homóglifo?

Um homoglifo é um caractere que se parece com outro caractere de uma escrita ou codificação diferente, como um “а” cirílico que se assemelha ao “a” latino. Os invasores os usam em domínios, nomes de usuário e mensagens falsificados. Esta ferramenta apresenta esses caracteres com pontos de código e substituições.

Como isso é diferente da normalização Unicode?

A normalização Unicode (por exemplo, NFKC) dobra a compatibilidade e as variantes de largura de maneira padrão. Esta ferramenta combina NFKC com um pequeno mapa explícito e confuso para que você veja por que cada caractere foi sinalizado - útil além de uma passagem simples da ferramenta de normalização Unicode.

O modo ASCII estrito alterará o texto legítimo que não seja em inglês?

Strict ASCII Fallback substitui caracteres que aparecem no mapa de confundíveis incluído ou alterados em NFKC. Outras letras não ASCII permanecem inalteradas. O texto legítimo ainda pode mudar se contiver esses caracteres mapeados, portanto revise a lista de análise.

Meu texto é enviado para um servidor?

Não. Após o carregamento da página, a detecção e a conversão usam apenas JavaScript. Este conversor de confundibles não envia o texto colado para análise.

Isso pode capturar todas as paródias?

Não. A cobertura é determinística e baseada em mapas, e não em aprendizado de máquina. Ajuda com truques comuns de personagens semelhantes, mas não é uma auditoria de segurança completa.

O que o modo Gerar homóglifos faz?

Ele substitui letras e dígitos ASCII em sua entrada por sósias determinísticas do mesmo mapa agrupado usado para limpeza – útil para criar strings de teste em ambientes autorizados (por exemplo, controle de qualidade de moderação). Não é para personificar ou ignorar proteções.