893 Shares 8780 views

code ASCII (code standard américain pour l'échange d'information) – l'encodage de texte de base pour l'alphabet latin

Selon l'Union internationale des télécommunications, en 2016 Internet avec plus ou moins utilisent régulièrement trois et un demi-milliard de personnes. La plupart d'entre eux ne pensent même pas que tous les messages qui leur sont envoyés via un PC ou gadgets mobiles, ainsi que des textes qui sont affichés sur les écrans de toutes sortes, en fait, est une combinaison de 0 et 1. Ce qu'on appelle la représentation codée de l'information. Il fournit et facilite la mise en œuvre de son stockage, le traitement et la transmission. En 1963, le code ASCII américain a été mis au point, qui fait l'objet de cet article.

Présentation de l'information dans l'ordinateur

En termes de tout texte électronique informatique est un ensemble de caractères individuels. Parmi eux, ne sont pas seulement la lettre, y compris la capitale, mais aussi des signes de ponctuation, chiffres. De plus, des symboles spéciaux sont utilisés « = », « et », « ( » et des espaces.

Une pluralité de symboles qui composent le texte, appelé alphabet, et le nombre – puissance (désigné par N). Pour déterminer l'expression N = 2 ^ b, où b – nombre de bits d'information ou d'un poids de symbole particulier.

Il a prouvé que la puissance de 256 caractères vous permet alphabet de soumettre tous les caractères nécessaires.

Depuis 256 est un 8 degré deux, le poids de chaque caractère est de 8 bits.

Unité de mesure 8 bits est appelé 1 octet, donc nous disons que le code binaire de caractère dans le texte qui est stocké sur votre ordinateur, occupe un octet de mémoire.

Comment est l'encodage

Tout texte saisi dans la mémoire du PC par les touches du clavier, sur lequel étaient écrits des numéros, des lettres, des signes de ponctuation et d'autres symboles. En mémoire , ils sont transmis en code binaire, par exemple, chaque symbole est mis en correspondance avec le code décimal familier pour une personne de 0 à 255, ce qui correspond à un code binaire – .. De 00000000-11111111.

caractère d'octet codage permet au processeur effectue un traitement de texte, se référer à chaque caractère séparément. En même temps, les 256 caractères est suffisant pour représenter toute information de caractère.

Codage des caractères ASCII

Cette abréviation signifie le code anglais standard américain pour l'échange d'information.

Même à l'aube de l'informatique, il est devenu évident qu'il est possible de trouver une variété de façons de coder l'information. Cependant, pour transférer des informations d'un ordinateur à l'autre était nécessaire de développer une norme unique. Ainsi, en 1963 il y avait une table ASCII aux États-Unis. Il ne importe quel alphabet informatique de caractères est attribué un numéro de séquence dans la représentation binaire. Dans un premier temps, le code ASCII est utilisé uniquement aux États-Unis, et est devenu plus tard une norme internationale pour le PC.

Table des matières

codes ASCII sont divisées en 2 parties. La norme internationale est considérée comme seule la première moitié de la table. Il comprend un code à partir du numéro de séquence de 0 (00000000 codées) à 127 (code 01111111).

numéro de série

N

Codage texte ASCII

symbole

0 – 31

0000 0000 – 0001 1111

Caractères avec N de 0 à 31 sont appelés gestionnaires. Leur fonction est de « guider » le processus de sortie de texte à un dispositif de surveillance ou d'impression, un bip sonore, etc.

32-127

0010 0000 – 0111 1111

Symboles avec N 32-127 (une partie standard de la table) – lettres majuscules et minuscules de l'alphabet latin, les numéros 10 Nye, des signes de ponctuation et divers supports, commerciaux et autres personnages .. Symbole 32 indique un espace.

128-255

1000 0000 – 1111 1111

Symboles avec N 128-255 (une partie alternative de la page de table ou code) peuvent avoir une variété d'options, dont chacun a son propre numéro. La page de code utilisé pour définir alphabets nationaux, qui sont différents du latin. En particulier, il est réalisé avec l'aide du code ASCII pour les caractères russes.

Tableau de codage en majuscules et lettres minuscules se suivent par ordre alphabétique et numéros – valeurs ascendantes. Ce principe est valable pour l'alphabet russe.

caractères de contrôle

table de codage ASCII a été initialement conçu pour la réception et la transmission d'informations sur ce ne sont plus utilisés par le dispositif comme un téléscripteur. À cet égard, le jeu de caractères utilisé comme inclus non imprimables commandes pour commander le dispositif. Ces commandes ont été utilisées dans ces techniques de messagerie pré-ordinateur comme le code Morse, et ainsi de suite.

Le symbole « téléscripteur » le plus courant est le NUL (00 « zéro »). Il est encore utilisé dans la plupart des langages de programmation, ce qui indique le signe de la fin de la ligne.

Où le codage ASCII utilisé

American Standard Code exige non seulement le clavier de saisie de texte. Il est également utilisé dans le tableau. En particulier, les images du programme Maker Art ASCII représentent différents spectre d'extensions de codage de caractères ASCII.

Ces produits sont disponibles en deux types: éditeurs graphiques exécution de la fonction en convertissant une image en texte et convertit les « images » dans les graphiques ASCII. Par exemple, connu est un excellent exemple Smiley symbole de codage.

ASCII peut être utilisé lors de la création du document HTML. Dans ce cas, vous pouvez entrer dans un jeu de caractères et un symbole correspondant à ce code apparaît lors de l'affichage de la page sur l'écran.

ASCII est nécessaire pour la création de sites multilingues, comme des signes qui ne font pas partie d'une table nationale particulière, remplacé par ASCII codes.

certaines caractéristiques

Pour coder les informations de texte en ASCII a été initialement utilisé 7 bits (un est resté vide), mais aujourd'hui elle travaille comme 8 bits.

Les lettres, qui sont situés dans les colonnes sont au-dessus et au-dessous, diffèrent les uns des autres que par un seul bit. Cela réduit considérablement la complexité du test.

application ASCII dans Microsoft Office

Si nécessaire, ce type d'information texte de codage peut être utilisé dans les éditeurs de texte de Microsoft, tels que le Bloc-notes et Office Word. Cependant, lors de la saisie dans ce cas, vous ne pouvez pas utiliser certaines fonctions. Par exemple, vous ne serez pas en mesure de mener à bien gras comme le caractère ASCII ne conserve que le sens de l'information, en ignorant sa forme et sa forme générale.

standardisation

L'organisation a adopté la norme ISO 8859. Ce groupe définit le codage de huit bits pour différents groupes linguistiques. En particulier, la norme ISO 8859-1 – est le ASCII étendu, ce qui est une table pour les États-Unis et en Europe occidentale. Une ISO 8859-5 – est la table utilisée pour l'alphabet cyrillique, y compris la langue russe.

Pour des raisons historiques à la norme ISO 8859-5, il est utilisé pour un court laps de temps.

Pour la langue russe au moment de codage effectivement utilisé:

  • CP866 (Code Page 866) ou DOS, qui est souvent appelé alternatif le codage GOST. Il a été activement utilisé jusqu'au milieu des 90-s du siècle dernier. À l'heure actuelle, presque jamais utilisé.
  • KOI-8. Le codage a été développé dans les années 1970-80, et au moment où il est une norme commune pour les messages électroniques en RUNET. Il est largement utilisé dans la famille OS Unix, y compris Linux. version "russe" de KOI-8, appelé KOI-8R. En outre, il existe des versions pour d'autres langues cyrilliques comme l'ukrainien.
  • Code Page 1251 (CP 1251, Windows – 1251). Développé par Microsoft pour fournir un soutien pour la langue russe dans l'environnement Windows.

Le principal avantage de CP866 première norme était de préserver les caractères pseudo-graphiques dans les mêmes positions que dans le ASCII étendu. Cela vous permet d'exécuter du texte sans changement du programme, la production étrangère, comme le célèbre commandant de Norton. A ce stade, CP866 est utilisé pour les programmes conçus pour Windows, qui fonctionnent en mode texte plein écran ou dans des zones de texte, y compris dans les FAR Manager.

textes informatiques écrits dans le codage CP866, ces derniers temps sont assez rares, mais il est utilisé pour les noms de fichiers russes dans « Vindous ».

"Unicode"

À l'heure actuelle, cet encodage est la plus répandue. Codes « Unicode » sur le terrain. La première (de 0000 à U + U + 007F) comprend un ensemble de caractères ASCII avec des codes. Suivi par les personnages de terrain de différentes littérature nationale, ainsi que des signes de ponctuation et des symboles techniques. De plus, une partie du code « Unicode » est réservé en cas de la nécessité d'inclure de nouveaux personnages dans l'avenir.

Maintenant, vous savez que chaque caractère ASCII est représenté sous la forme d'une combinaison de 8 zéros et des uns. Layman, cette information peut sembler inutile et sans intérêt, mais vous ne voulez pas savoir ce qui se passe « dans le cerveau » de votre ordinateur!