761 Shares 5266 views

Le codage des informations textuelles sur l'ordinateur

Ordinateur – un appareil sophistiqué avec lequel vous pouvez créer, convertir et stocker des informations. Cependant, l'ordinateur ne fonctionne pas pour nous de façon très compréhensible – graphique, le texte et les données numériques sont stockées sous forme de tableaux binaires numéros. Dans cet article, nous examinerons comment le codage des informations texte.

Ce qui nous est le texte d'un ordinateur – une séquence de caractères. Chaque symbole représente un certain ensemble de zéros et de uns. Sous les symboles destinés non seulement majuscules et minuscules lettres du latin alphabet, mais aussi des signes de ponctuation, signes arithmétiques, des caractères spéciaux, des symboles et même espace spéciaux.

Le codage binaire des informations textuelles

En appuyant sur une certaine touche sur le contrôleur interne envoie un signal électrique qui est converti en un code binaire. Code est associé à un certain symbole, qui est affiché à l'écran. Pour la soumission à l'alphabet latin dans un système international de codage ASCII format numérique a été créé. Il requiert 1 octet pour enregistrer un symbole consiste donc la séquence de huit symbole de zéros et des uns. L'intervalle d'enregistrement – 00000000 à 11111111, à savoir le codage des informations de texte à l'aide de ce système permet de représenter 256 caractères. Dans la plupart des cas, cela suffit.

ASCII est divisé en deux parties. Les 127 premiers caractères (de 00000000 à 01111111) sont internationaux et sont des symboles et des lettres spécifiques de l'alphabet anglais. La deuxième partie – l'extension (10000000 à 11111111) – est destiné à représenter l'alphabet national, dont l'écriture est différent du latin.

informations texte de codage en ASCII est construit sur le principe de la séquence de plus en plus, à savoir, plus le nombre de séquence de lettres, plus la valeur de son code ASCII. Les chiffres et une partie russe de la table sont construites sur le même principe.

Cependant, dans le monde, il existe plusieurs types d'encodage pour les caractères cyrilliques. Le plus commun – est KOI-8 (encodage huit bits qui a été utilisé dans les années 70 dans le premier système d'exploitation Unix ruifitsirovannyh), ISO 8859-5 (mis au point par le Bureau international de normalisation), le CP 1251 (codage de l'information textuelle utilisée dans la moderne OS Windows), ainsi que l'encodage 2 octets d'Unicode, qui peut être utilisé pour introduire 65.536 caractères. Une telle variété de codages en raison du fait qu'ils ont été mis au point à des moments différents, pour différents systèmes d'exploitation et des considérations différentes. À cause de cela, ont souvent des difficultés lors du transfert du texte d'un milieu à un autre – à partir d'un décalage codant pour l'utilisateur verra un ensemble d'icônes confuses. Comment puis-je remédier à cette situation? Dans Word, par exemple, lorsqu'un document est ouvert, un message sur des problèmes avec l'affichage du texte et propose plusieurs options pour transcoder.

Ainsi, le codage et le traitement de l'information textuelle dans les entrailles de l'ordinateur – le processus est difficile et prend du temps organisé. Tous les symboles de tout alphabet sont seulement une certaine séquence de chiffres du système binaire, une cellule – c'est un octet d'information.