267 Shares 3763 views

ASCII, caractères: description, tableau des codes et des types

Comme on le sait, l'ordinateur stocke des informations sous forme binaire, présentant comme une séquence de uns et de zéros. Pour traduire l'information sous une forme appropriée pour la consommation humaine, chaque séquence unique de chiffres lorsque l'affichage remplacé par le caractère correspondant.

L'un des systèmes de corrélation des codes binaires à imprimer et caractères de contrôle est ASCII.

Au niveau actuel de développement de la technologie informatique de l'utilisateur n'a pas besoin de connaître le code pour chaque symbole particulier. Cependant, la compréhension générale de la façon dont le codage est effectué, est extrêmement utile, et pour certaines catégories de spécialistes et tous nécessaires.

Créer ASCII

Dans la forme originale du codage, il a été mis au point en 1963, puis 25 ans mis à jour deux fois.

Dans la version originale de la table de caractères ASCII comprend 128 caractères, version étendue est apparu plus tard, où les 128 premiers caractères sont enregistrés et codes impliqués avec le huitième bit mis en correspondance des symboles précédemment absents.

Au fil des ans, cet encodage est le plus populaire dans le monde. En 2006, la première place a pris latine en 1252, et à la fin de 2007 et détient actuellement une position de leader fermement Unicode.

représentation ASCII informatique

Chaque ASCII caractère a son propre code composé de 8 caractères, ce qui représente un zéro ou un. Le nombre minimal de cette représentation est zéro (huit zéros dans le système binaire), qui est la source du premier élément de la table.

code binaire maximal à une version ASCII de l'original est nul + sept unités, et dans la version étendue – huit unités, connectées comme le huitième bit.

caractères de contrôle

Les caractères de contrôle sont appelés signes qui ne sont pas une représentation graphique et est utilisé pour l'organisation du texte, la gestion des périphériques, etc. Ils peuvent indiquer le début ou la fin du texte, des onglets, la génération d'un signal sonore, diverses opérations pour ATS (téléscripteur – .. Machine pour la transmission de données canal électrique) de résolution des données de dispositif de sortie, etc. l'action d'annulation.

Dans le tableau de caractères ASCII positions 0 à 31, et 127 sont affectés à des caractères de contrôle. Total de 33 points.

Les caractères restants

Les 95 postes restants sont réservés aux signes de ponctuation et des opérations mathématiques, des chiffres décimaux, les lettres de l'alphabet, différent registre: « A » et un « A » majuscule correspondent à l'horizontale à différents codes dans la table des caractères ASCII.

le nombre de caractères dans la table

Si une personne est engagée dans le développement de logiciels, ou d'effectuer d'autres tâches du domaine des technologies de l'information, il est nécessaire de connaître le nombre d'un certain nombre de caractères ASCII.

Comme mentionné ci-dessus, la position de 0-31 et 127 prennent des caractères de contrôle. Numéro 32 est attribué à un espace, numéro 33-47 et 58-64 sont réservés pour les opérations de ponctuation et de mathématiques de base.

les lettres majuscules latines classés par ordre alphabétique et sont numérotés de 65 e 90 e. Les lettres minuscules sont également disposés dans l'ordre alphabétique, de leurs positions – à partir de 97 e à 122 e. Les nombres restants (91-96 et 123-126) associés aux supports et entretoises, caractéristique oblique et droite, ainsi que certains des signes diacritiques.

Tableau complet des symboles dans une représentation graphique pratique peut être vu dans l'image ci-dessus. La figure ci-dessous montre le nombre de signes dans le tableau de caractères ASCII russe.

ASCII étendu

Depuis la version originale du codage a été développé, basé sur le membre américain, il n'y a pas été prévu non seulement différents types d'écriture et alphabets nationaux, mais même une utilisation pratique des diacritiques, activement utilisés dans les langues européennes.

8 bits a été impliqué pour la formation de l'encodage étendu. Cette version comprend des symboles de alphabets européens nationaux et transcription phonétique, éléments graphiques, utilisés pour les tables de dessin, un certain nombre de symboles mathématiques.

Certains caractères ASCII sont rarement utilisés aujourd'hui. En particulier, cela s'applique aux caractères qui sont utilisés pour dessiner des tables, comme dans les années depuis le développement de l'encodage étendu, des moyens beaucoup plus pratique de la représentation graphique des tables ont été introduites.

variantes nationales encodage

Avant l'avènement de la version étendue ASCII pour afficher les caractères internationaux utilisés codage version reconditionnée, où placer les lettres latines ont été placés russe, grec, caractères arabes.

Deux codes de la table sont réservées pour la commutation entre la norme US-ASCII et son objectif national.

Après l'ASCII est devenu ne comprend pas 128 et 256 caractères, pour diffusion Option codage, dans lequel la version originale de la table a été enregistrée dans les 128 premiers codes avec zéro bit 8. Les signes littérature nationale stockée dans la moitié supérieure de la table (position 128-255-e).

Pour connaître les codes de caractères ASCII directement l'utilisateur n'est pas nécessaire. Développeur de logiciels est généralement suffisant pour connaître le nombre de l'élément dans le tableau pour calculer le code, le cas échéant, en utilisant le système binaire.

langue russe

Suite au développement au début des années 70-s de codages pour les langues scandinaves, chinois, coréen, grec, etc., créer leur propre version de engagée et l'Union soviétique. Bientôt développé version du codage 8 bits appelé KOI8, en préservant les 128 premiers codes de caractères ASCII et attribue le même nombre de postes dans les lettres de l'alphabet et caractères nationaux supplémentaires.

Avant l'introduction de l'Unicode KOI8 dominé dans le segment russe de l'Internet. Il y avait des variantes de codage pour le russe, et pour l'alphabet ukrainien.

problèmes ASCII

Étant donné que le nombre d'éléments dans le tableau même étendu ne dépasse pas 256, la possibilité d'accueillir un seul encodage plusieurs absents de scripts différents. Dans les années 90 il y avait un problème dans RUNET « oups, les ordures » lorsque le texte des caractères ASCII russes sont affichés correctement tapé.

Le problème était l'écart des codes des différentes options ASCII autre. Rappelons que dans les positions 128-255 peuvent être placés différents signes, et lorsque vous modifiez un caractère cyrillique à l'autre, toutes les lettres du texte ont été remplacés par d'autres ayant le même nombre dans un autre code de version.

état actuel

Avec l'avènement de la popularité ASCII Unicode a faibli.

La raison réside dans le fait que les nouveaux jeux de caractères autorisés à contenir des signes de langues presque toutes écrites. Dans ce cas, les 128 premiers caractères ASCII correspondent au même caractère Unicode.

En 2000, a été le plus populaire à code ASCII sur Internet et utilisé par 60% des pages Web indexées « Google ». Déjà en 2012, la proportion de ces pages a chuté à 17%, et le lieu de l'encodage le plus populaire a pris Unicode (UTF-8).

Ainsi, ASCII est une partie importante de l'histoire des technologies de l'information, mais son utilisation à l'avenir semble peu prometteur.