Zum Inhalt springen

Datenrettung in Deutschland zum Festpreis!

100% kostenlose Analyse

Festpreis-Garantie

Wiederherstellung aller marktüblichen Datenträger

Startseite > Datenrettung Lexikon > Anfangsbuchstabe C > Charset

Charset Definition & Begriffserklärung

CharsetBei einem Charset handelt es sich um eine Art Übersetzungstabelle, mit deren Hilfe Zeichen aus Bitfolgen dargestellt werden können. Dabei bedeutet Charset selbst einen definierten Zeichensatz, beispielsweise das Alphabet oder die Zahlen 0 bis 1, die über die Computertastatur eingegeben werden können.

Der Begriff Charset ist eng verbunden mit der Zeichenkodierung, bei der eine Zuordnung von Buchstaben und Ziffer, sowie Sonderzeichen innerhalb eines bestimmten Zeichensatzes gegeben ist. Generell werden im Computerbereich sämtliche Zeichen über einen bestimmten Zahlenwert kodiert, die sich dann für die Speicherung oder Übertragung eignen.

So wird beispielsweise das deutsche Ü im ISO-8859-1-Zeichensatz mit dem dezimalen Wert 220 dargestellt. Beim EBCDIC-Code wird über den Wert 220 die geschweifte Klammer } kodiert. Für eine richtige Zeichendarstellung muss folglich auch die jeweilige Zeichenkodierung bekannt sein. Der Zahlenwert reicht hierfür nicht aus.

Datenrettung zum Festpreis

Wir analysieren Defekte an allen gängigen Datenträgern aller Hersteller - kostenlos und unverbindlich.

Sie erhalten anschließend ein Festpreis-Angebot für die Wiederherstellung Ihrer Daten. Kosten fallen nur an, wenn Sie uns beauftragen und wir Ihre Daten retten können!

100% kostenlose Analyse anfordern!

Charset Geschichte

Die Ursprünge der Zeichenkodierung liegen bereits in der Antike. Schon immer waren Rauchzeichen und Trommelzeichen weithin bekannt. Selbst das 1648 entwickelte Signalflaggensystem in der Marine gehörte zur Zeichenkodierung. 1837 wurde der weltweit bekannte Morsecode entwickelt. Der erste Zeichensatz wurde 1870 von Jean-Maurice-Emile Baudot entwickelt. Er basierte auf einem 5er-Code-Alphabet für einen Synchrontelegraphen. Der Baudot-Code war auch die Grundlage für den definierten Zeichensatz des Commité Consultatif International Telegraphique et Telephonique, kurz CCITT.

Ebenfalls auf der Grundlage von Baudot begann die Umsetzung der Zeichenkodierung in binäre Bitfolgen, als die ersten Computer ihren Siegeszug antraten. Um die aus Bitfolgen bestehenden Zeichen darstellen zu können, mussten Übersetzungstabellen als Charsets geschaffen werden. Generell lassen sich die verschiedenen Zeichenkodierungen durch elektrische, optische oder akustische Signale transportieren. Die binäre Darstellung und Verarbeitung bietet jedoch den Vorteil, dass ein solcher Charset wesentlich sicherer übermittelt werden kann, als die anderen Varianten.

Im Jahr 1963 wurde der erste 7-Bit ASCII-Code  von der American Standards Association definiert. Es sollte eine Vereinheitlichung der Zeichenkodierung stattfinden. IBM führte 1964 eine eigene 8-Bit-Zeichenkodierung ein, dem EBCDIC. Beide Kodierungen werden bis heute in der Computertechnik angewandt.

Für jede Sprache ein eigener Charset

Jede Sprache besteht aus einem eigenen Zeichensatz und besitzt ihre eigenen diakritischen Zeichen für die Betonung und Darstellungsweise. Aus diesem Grund wurden verschiedene Charsets definiert. So hat der ISO-Standard 8859 sämtliche Charsets für die europäischen Staaten, der arabischen Welt, Hebräisch und sogar Thai definiert.

1991 veröffentlichte das Unicode Consortium eine erste Fassung der Norm ISO 10646, auch als Unicode bekannt, bei der alle Zeichen aller Sprachen in einer Codeform definiert wurden. In EDV-Anlagen muss daher vor der Verarbeitung elektronischer Texte festgelegt werden, mit welchem Charset gearbeitet wird.

Ein schönes Beispiel stellt die Kopfzeile einer HTML-Webseite dar, in der unter  mit UTF-8 die am weitesten bekannte 8-Bit Kodierung für Unicodezeichen definiert wird. Ebenso hätte aber auch mit charset=“ISO-8859-1“ der für europäische Staaten geltende Zeichensatz definiert werden können. Auch wenn Charsets eindeutig definiert worden sind, setzt dies jedoch nicht voraus, dass diese auch richtig auf dem Bildschirm dargestellt werden können. Für die richtige grafische Umsetzung muss auch für jeden Charset eine passende Schriftart installiert sein.

Häufige Fragen und Antworten

Was ist ein Charset?

Ein Charset ist eine Art Übersetzungstabelle, die Bitfolgen in Zeichen darstellen kann. Dabei handelt es sich um einen definierten Zeichensatz, der beispielsweise Buchstaben, Zahlen und Sonderzeichen enthält. Mit Hilfe des Charsets können diese Zeichen über die Computertastatur eingegeben werden. Ein Charset ist eng mit der Zeichenkodierung verbunden, bei der die Zuordnung von Zeichen zu bestimmten Zahlenwerten erfolgt.

Wozu dient ein Charset?

Ein Charset dient dazu, Zeichen aus Bitfolgen darzustellen. Es ermöglicht die korrekte Übertragung und Speicherung von Zeichen, indem es eine eindeutige Zuordnung von Zeichen zu bestimmten Zahlenwerten bietet. Ein passendes Charset stellt sicher, dass die Zeichen korrekt angezeigt und verarbeitet werden können. Für jede Sprache gibt es in der Regel einen eigenen Charset, um die spezifischen Zeichen einer Sprache darstellen zu können.

Wie sind Charsets historisch entstanden?

Die Ursprünge der Zeichenkodierung und damit der Charsets liegen bereits in der Antike. Unterschiedliche Zeichensysteme wie Rauchzeichen, Trommelzeichen und Signalflaggen wurden entwickelt, um Botschaften zu übermitteln. Mit der Entwicklung von Telegrafie und Computern wurden Übersetzungstabellen als Charsets geschaffen, um Zeichen aus Bitfolgen darzustellen. Der erste Zeichensatz wurde 1870 von Jean-Maurice-Emile Baudot entwickelt. Später wurden weitere Zeichensätze wie der ASCII-Code und der EBCDIC-Code definiert, die bis heute in der Computertechnik angewendet werden.

Welche Rolle spielen Charsets für verschiedene Sprachen?

Charsets spielen eine wichtige Rolle für verschiedene Sprachen, da jede Sprache in der Regel einen eigenen Zeichensatz besitzt. Charsets ermöglichen die korrekte Darstellung und Verarbeitung der spezifischen Zeichen einer Sprache. Der ISO-Standard 8859 definiert beispielsweise Charsets für europäische Staaten, die arabische Welt, Hebräisch und weitere. Das Unicode Consortium hat mit dem Unicode-Standard eine Norm geschaffen, bei der alle Zeichen aller Sprachen in einer Codeform definiert sind. Vor der Verarbeitung elektronischer Texte muss festgelegt werden, welcher Charset verwendet wird, um die richtige Zeichendarstellung sicherzustellen.

Quelle für Ihr Zitat: Obenstehende Definition darf in kommerziellen und nicht kommerziellen Publikationen (somit auch in Hausarbeiten, Foren, Social Media Seiten) ohne Rückfrage zitiert werden. Kopieren Sie einfach den nachfolgenden Link für Ihr Zitat:

https://www.it-service24.com/lexikon/c/charset/

Bildnachweis: iStock.com/trutenka
Folgende Artikel könnten ebenfalls interessant für Sie sein: