O que é um Caractere em um Computador?
Um caractere é uma letra, número, pontuação, espaço, tabulação, ou quebra de linha em um texto no computador, entre outras coisas. Caractere é o termo para a unidade básica em um texto no formato de sequência de caracteres (também chamado de uma cadeia de caracteres, ou character string em Inglês).
Um exemplo simples: no texto Viva 2024!
temos 10 caracteres: Viva
possui 4, o espaço é um, 2024
possui 4, e ponto de exclamação é outro. Em geral, tudo que você digita é um caractere. Exceto que letras acentuadas contam como um caractere apenas: é
é 1 caractere.
Em um texto simples, quebras de linha são um caractere. Isto é, quando você aperta a tecla enter
e o texto vai
para
a
próxima
linha,
isso é um caractere. Esse tipo de caractere costuma ser representado em código usando um caractere de escapamento como \
, e.g. Primeira linha\nSegundo linha
seria um código dizendo que existe um caractere \n
(do Inglês newline, "nova linha") no meio das duas linhas. Outro exemplo é \t
, que é o código para o caractere de tabulação, inserido quando apertamos a tecla tab
. Nesse sistema de código, o caractere para a barra (\
) é representado pela barra escapando ela mesma: \\
, logo C:\\pasta\\foto.jpg
seria um código de texto escapando o caminho de arquivo C:\pasta\foto.jpg
.
Na codificação ASCII, todo caractere de um texto é representado por 1 byte, e existem apenas 255 caracteres. Logo XYZ
seriam 3 caracteres ou 3 bytes, e X\nY
(ou seja, contendo uma quebra de linha) seriam 3 caracteres ou 3 bytes também. Na codificação UTF-8, que é a padrão na maior parte do mundo, 1 caractere pode ter de 1 a 4 bytes de tamanho. Ou seja, se você tiver um arquivo de 100 bytes, ele terá exatamente 100 caracteres em ASCII, ou de 25 a 100 caracteres em UTF-8.
Quando falamos de caracteres, letras minúsculas e maiúsculas são considerados caracteres diferentes. Isto é, quando tornados em bytes, o byte que representa o a
minúsculo é diferente do byte que representaria o A
maiúsculo.
Deixe um comentário