O que é Tipo de Arquivo no Computador?
Tipo de arquivo (em Inglês: file type) é algo como "arquivo de texto," "arquivo de imagem," "arquivo de vídeo," etc., referente a qual tipo de dados estão codificados como bytes em um arquivo no computador.
Todo arquivo no computador contém dados como bytes. Cada byte é uma série de 8 bits. Cada bit é 0
ou 1
. Isso significa que um arquivo de 100 bytes seria nada mais que uma série de 800 bits 0101011100001100101...
em sequência.
Não é possível saber apenas pelos bits o que está contido no arquivo. Quando abrimos um arquivo em um editor de texto ou de imagens, um programa interpreta os bits no arquivo como sendo de texto ou de imagem. É possível "abrir" qualquer arquivo em qualquer programa, porém, ao tentar interpretar os bits, o programa provavelmente falhará, pois não estariam em um formato que faz sentido para o programa.
Por exemplo, alguns formatos de arquivo sempre começam com os mesmos bits. Logo, se um arquivo não começar de uma certa forma, o programa poderá concluir que não é um arquivo do tipo correto. Isso se aplica a arquivos PNG por exemplo. Porém nem todo formato possui algo do tipo. Um arquivo de texto simples pode começar de qualquer maneira. Além disso, é teoricamente possível para um arquivo que não está no formato PNG começar com os mesmos bits que um arquivo PNG começaria. Logo não é possível depender dos bits de dentro do arquivo para saber qual o tipo dos dados.
Para resolver isso temos metadados: dados do arquivo que não estão "dentro" do arquivo, mas externos de algum modo. Por convenção, tipos de arquivos são identificados por um código de texto chamado de extensão do arquivo contida no nome do arquivo.
Por exemplo, imagens no formato PNG possuem a extensão .png
, e no formato WEBP tem a extensão .webp
. Logo, podemos saber que um arquivo cujo nome é imagem.png
é uma imagem PNG, e um arquivo cujo nome é imagem.webp
é uma WEBP.
No Windows, a extensão de arquivo não é visível por padrão, logo os dois arquivos parecerão ter o mesmo nome na mesma pasta, "imagem
," só que com tipos diferentes. O tipo de arquivo que aparece no Windows é derivado da extensão encontrada no nome, isto é, a extensão está presente, ela é apenas escondida para arquivos conhecidos por padrão. Observe também que não é possível para dois arquivos terem o mesmo nome da mesma pasta normalmente, já que cada caminho de arquivo precisa ser único.
Em alguns casos, um tipo de arquivo é baseado em outro tipo só que possui uma extensão diferente para distingui-lo. Isso é comum em programação de computadores, onde todo arquivo de código é um arquivo de texto simples (.txt
), porém a extensão usada varia de acordo com a linguagem de código do arquivo. Um arquivo contendo código na linguagem C teria a extensão .c
(ou .h
se for um "cabeçalho," header). Um arquivo em Python seria .py
. Em Javascript seria .js
. E assim por diante. Todos esses arquivos poderiam ser abertos e editados sem problemas no Bloco de Notas que vem instalado por padrão no Windows, embora existam editores de código especializados para editá-los. Outro caso comum são arquivos de configuração, geralmente .ini
, que alguns jogos de video-game usam para armazenar as configurações de usuário, e que alguns usuários podem editar manualmente para definir valores que a interface gráfica do jogo não permitira. Finalmente, há também arquivos sem extensão cujo tipo é conhecido por convenção, e.g. README
("me leia"), e arquivos que só possuem extensão, e.g. .gitignore
, chamados de dotfiles (esses são mais comuns em sistemas Linux).
MIME
Um outro método de se classificar tipos de arquivo são tipos MIME (MIME types). Por exemplo, image/png
é o código MIME para uma imagem PNG.
Esse método é usado na Internet. Toda vez que seu navegador acessa uma URL, o navegador baixa um arquivo de um servidor, e o servidor diz para o navegador qual o tipo de arquivo com esse código MIME.
Por exemplo, se você acessar a URL https://www.google.com/
, o arquivo enviado contém dados de uma página HTML. Normalmente, páginas HTML teriam a extensão de arquivo .html
, mas nessa URL não consta tal URL. Logo o servidor diz ao navegador que os dados são do tipo text/html
.
Normalmente, URLs de imagens possuem extensões, e.g. https://www.example.com/imagem.jpg
. Isso faz você pensar que a URL é de uma imagem no formato JPG. Porém, qual o tipo de dados dessa URL depende inteiramente no servidor. Por exemplo, na Wikipedia, há páginas HTML para falando sobre as imagens JPG e essas página possuem URLs terminando no mesmo nome de arquivo incluindo a extensão.
Se você acessar https://commons.wikimedia.org/wiki/File:Mona_Lisa,_by_Leonardo_da_Vinci,_from_C2RMF_retouched.jpg
, você verá que isso é uma página HTML, e não uma imagem.
Da mesma forma, é possível para uma URL terminar sem extensão e enviar para o navegador uma imagem JPG. Isso é comum redes de distribuição de conteúdo (CDN). Por exemplo, você pode ter uma URL https://www.example.com/1235245261
e o servidor dizer para o navegador que os dados são do tipo image/jpeg
. Nesse caso o navegador irá tentar interpretar os dados como uma imagem JPG.
Deixe um comentário