O que é um Código de Texto?
Um código de texto (em Inglês: text code) é um código que codifica dados como texto, no formato de texto, e não em formato binário ou formato numérico (embora hajam alguns códigos de texto compostos inteiramente de números). Códigos de texto são usados em computadores por que seres humanos podem os ler e os escrever, até mesmo manualmente. Enquanto você vai usando o computador, há muitas vezes que você pode dizer para o computador fazer algo através de digitar um texto, ou copiar e colar um texto. Nesses casos, algumas vezes esse texto é um código de texto. Isso significa que haveria um programa de computador responsável por decodificar esse texto em algo útil para o computador.
Exemplos
Alguns exemplos de código de texto são:
- Nomes de domínio, e.g.
www.example.com
. - URLs, e.g.
https://www.example.com/pagina?q=pesquisa#fragmento
. - Caminhos de arquivo, e.g.
C:\pasta\foto.jpg
,/home/eu/Fotos/foto.jpg
,~/Fotos/foto.jpg
. - Operadores de pesquisa, e.g.
site:reddit.com "o auto da compadecida" -memes
. - Endereços de e-mail, e.g.
[email protected]
. - Código HTML, e.g.
<a href="#">link</a>
. - Código BB, e.g.
[url=www.example.com]link[/url]
. - Código Markdown, e.g.
*itálico*
,**negrito**
. - Outro código de rede social, e.g.
:emoji:
,@menção
,#hashtag
. - Códigos hexadecimais de cores, e.g.
#ff0000
,#F00
. - Códigos de números não-decimais, e.g.
0b1010
,0xff
. - Bytes escritos como números hexadecimais, e.g.
f0 2b da 31
. - Endereços de memória endereçável por byte, e.g.
BAADF00D
,BADC0FFEE0DDF00D
. - Padrões glob, e.g.
*.jpg|*.jpeg|*.png|*.gif
. - Padrões regex, e.g.
^.*\.(jpe?g|gif|png)$
.
Características Notáveis
Tipos diferentes de código de texto possuem propósitos diferentes, mas há algumas características comuns entre eles.
Alguns códigos de texto são usados para identificar coisas, tais como URLs, caminhos de arquivo, e endereços de e-mail. Em alguns casos, esse código pode diferenciar entre maiúsculas e minúsculas (i.e. ser case-sensitive). Por exemplo, nomes de domínio não diferenciam entre maiúsculas e minúsculas (são case-insensitive). Com isso, www.example.com
e WWW.EXAMPLE.COM
significam a mesma coisa. No Windows, caminhos de arquivo são case-insensitive. Isso significa que você não pode ter um arquivo chamado foto.jpg
e outro chamado FOTO.JPG
na mesma pasta. No Linux, eles são case-sensitive, e com isso você pode ter dois arquivos com o mesmo nome, um escrito em letras minúsculas e o outro com letras maiúsculas, no mesmo diretório.
Quando é possível incluir texto arbitrário dentro de um código de texto, esse código de texto tende a possuir caracteres especiais, também conhecidos como caracteres reservados, que não podem ser usados diretamente no texto arbitrário, e um método para incluí-los chamado de escapamento. Por exemplo, em Markdown, *
é um caractere especial que formata texto como itálico ou negrito. Para digitar *
sem fazer com que isso aconteça, você teria que digitar \*
. Feito isso, dizemos que o asterisco foi "escapado." De maneira similar, em regex, .
é um caractere especial que significa "qualquer caractere," logo para usar .
em regex é necessário escapá-lo como \.
. Em URLs, caracteres são escapados com porcentos. Por exemplo, URLs não podem ter caracteres de espaço nelas, então para usar espaços eles são escapados como %20
.
Um código de texto pode ser feito inteiramente de números. Tudo que você digita no computador é texto, isto é, são dados on formato de texto, incluindo os números que você digita. Para o computador fazer cálculos com números, ele precisa de números em formato numérico. Consequentemente, toda vez que você digita um número que é somado, subtraído, multiplicado, etc., existe um programa de computador que precisa rodar para converter o texto que você digitou em números que a CPU é capaz de usar em cálculos. Do ponto de vista da CPU, os números que você digita são códigos de texto até serem convertidos.
Deixe um comentário