Avançar para o conteúdo principal

Padrões de codificação de carateres

Olá pessoal. Hoje vou falar-vos sobre os padrões de codificação de carateres.

Até à década de 60 a maioria dos sistemas de computadores tinha uma forma particular de representar os carateres alfanuméricos. Cada marca de computador e, até, cada modelo usava um código próprio para representar uma letra, número e todos os símbolos que usamos. Nessa mesma altura surgiu a necessidade de os computadores comunicarem, ou seja, trocarem informações. Deste modo surgiram os padrões de codificação de carateres

Uma codificação de caracteres é um padrão de relacionamento entre um conjunto de carateres com um conjunto de outra coisa, como por exemplo números ou pulsos elétricos com o objetivo de facilitar o armazenamento de texto em computadores e a sua transmissão através de redes de telecomunicação. Algumas das formas de representação são o código ASCII e o código Unicode.




Tabela de código ASCII

A tabela de código ASCII surgiu devido à necessidade de criar um padrão que fosse utilizado por todos os computadores. A tabela ASCII utilizava conjuntos de 7 bits para representar 128 carateres, muitos deles adequados apenas à língua inglesa, por ter sido desenvolvida os Estados Unidos. 

A ISO (Internacional Standard Organization) adotou o código ASCII como norma internacional, com a designação ISO 646, e ampliou-o, passando a incluir um conjunto de carateres de outros idiomas. Para conseguir esta ampliação, tiveram de ser utilizados conjuntos de 8 bits (1 byte), permitindo representar 256 carateres, ou seja, aos 128 carateres iniciais foram acrescentados mais 128.

No entanto, os 256 carateres continuavam a ser insuficientes para englobar todos os carateres dos vários idiomas, sendo, por isso necessário criar variantes regionais e por isso foram normalizados os conjuntos de carateres e 8 bits, agrupando as variantes de idiomas relacionados geograficamente.




Com o código ASCII podemos representar várias coisas como palavras e imagens.
Na seguinte imagem, podemos observar o meu nome escrito em código ASCII com a fonte "stop".
  



A conversão de duas imagens para código ASCII:

 


  





Unicode

Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente.O Unicode possui o objetivo explícito de transcender as limitações de codificações de carácter tradicionais, como as definidas pelo padrão ISO 8859, que possuem grande uso em vários países mas que permanecem em sua maioria incompatíveis umas com as outras. 

Os códigos disponibilizados pela Unicode permitem representar conjuntos até 4 bytes (32 bits) para codificar os caracteres utilizados pelos idiomas modernos e as formas clássicas de alguns idiomas. Codificam, entre outros, caracteres acentuados, símbolos de pontuação, símbolos técnicos e matemáticos e outros símbolos gráficos.

O Unicode é hoje utilizado em sistemas operativos, e-mails, páginas Web; Fontes, entre outros.



A imagem seguinte representa a codificação Unicode para o alfabeto latino



Espero que já saibam melhor o que são os padrões de codificação de carateres nomeadamente o código ASCII e o código Unicode. Um abraço e até ao próximo post.👋




Webgrafia: 

https://pt.wikipedia.org/wiki/Codifica%C3%A7%C3%A3o_de_caracteres

https://pt.wikipedia.org/wiki/Unicode


Imagens:

https://br.pinterest.com/pin/820569994589455569/

https://www.pinterest.ch/pin/396035360970320908/?amp_client_id=CLIENT_ID(_)&mweb_unauth_id={{default.session}}&from_amp_pin_page=true

https://support.microsoft.com/en-us/office/insert-ascii-or-unicode-latin-based-symbols-and-characters-d13f58d3-7bcb-44a7-a4d5-972ee12e50e0

Comentários