Software-Tipps

Strukturierte Datenformate


Unterstützte strukturierte Datenformate

Was sind strukturierte Daten?

Mithilfe von Computern können Texte oder Tabellen bearbeitet werden. Für den Computer sind diese Texte aber unstrukturiert und ohne weitere Zusätze wie sogenannte Marker nicht zu „verstehen“. Erst die Auszeichnung bzw. Markierung und der in der Regel damit verbundene logische und meist auch hierarchische Aufbau eines Dokuments sorgen für die „Verständlichkeit“. Strukturierte Daten werden dabei in einem bestimmten, definierten Format strukturiert. Es gibt verschiedene Formate für die Strukturierung von Daten. Nicht jede Software kann jedes strukturierte Datenformat lesen und bearbeiten.

Wo werden strukturierte Daten eingesetzt?

Es gibt viele Bereiche, in denen strukturierte Daten besonders relevant sind. Meist wird im Zusammenhang mit strukturierten Daten die Strukturierung von Webseiteninhalten genannt. Mit entsprechenden Markern ausgezeichnet können die Inhalte der Internetseiten von Suchmaschinen besser verstanden werden.

Strukturierte Daten werden aber nicht nur für die Auszeichnung von Internetinhalten genutzt, sondern zum Beispiel auch für den Austausch von Daten zwischen Systemen bzw. zwischen verschiedenen Programmen. Strukturierte Datenformate wie z.B. CSV können von einer Vielzahl an Programmen als Import und Export Format gelesen bzw. ausgegeben werden.

Wichtige strukturierte Datenformate und Beispiele:

  • Binäre Datenbankformate - Dateiendungen z.B.: .dbf, .ism
    • BinäreBetriebliche Software und Branchenlösungen sind meist datenbankgestützt.1 Daten werden dabei in Felder aufgeteilt, wobei mehrere Felder einen Datensatz bilden. Datensätze stehen in Tabellen und werden mit anderen Datensätzen verknüpft. Dieses Daten werden in binären Datenbankdateien abgelegt und verarbeitet. DBF, ISM, (Oracle, SQL-Lite, IBM DB2, …).
  • CSV - Comma-separated values - Dateiendung .csv
    • CSV - Comma-separated valuesWie der Name es bereits beinhaltet, wird in einer .csv Datei für die Abgrenzung der Datenfelder (der Spalten) das Komma verwendet. Abhängig von der jeweiligen Software oder den individuellen Einstellungen können als Trennzeichen auch Semikolon, Tabulator- oder Leerzeichen sowie der Doppelpunkt verwendet werden. Zur Trennung der Datensätze wird der Zeilenumbruch genutzt. CSV-Dateien werden in der Regel für Tabellen oder Listen verwendet. CSV-Dateien können mit jedem Texteditor bearbeitet werden. Tabellenkalkulationsprogramme und Datenbanksysteme können in der Regel CS-Dateien im- und exportieren. Beim Im- und Export können Einstellungen für die Codierung, die Trennzeichen etc. vorgenommen werden.
  • Data Interchange Format Dateiendung .dif
    • Data Interchange FormatDas Data Interchange Format ist ein Industrie-Standard, der insbesondere dem Austausch von Daten zwischen Tabellenkalkulationsprogrammen dient. Daten im .dif Format können auch mit einem Texteditor geöffnet werden. Die .dif Datei ist in Header und Daten unterteilt.
  • Datev
    • Datev-SoftwareMit Datev-Software arbeiten vor allem Steuerberater, Wirtschaftsprüfer und Rechtsanwälte. Eine Exportfunktion, ein Datentransfer in ein Datev-Format, ermöglicht so einen reibungslosen Datenaustausch zwischen den einzelnen Lösungen.
  • EDIFACT (Electronic Data Interchange for Administration, Commerce and Transport)
    • EDIFACTEDIFACT ist ein branchenübergreifender internationaler Standard für das Format elektronischer Daten im Geschäftsverkehr. Es existieren zahlreiche branchenspezifische Subsets. Hierzu zählen z.B. EANCOM, EDIFICE, EDITRANS oder ODETTE. Zum Standardkonzept gehören einheitliche Nachrichtentypen. EDIFACT ist unabhängig vom Übertragungsprotokoll.
      Marktübersicht über EDI-Software
  • Excel - Dateiendung .xlsx, .xlsm, .xlsb, xltx, .xll, xlam
    • Excel ist ein Tabellenkalkulationsprogramm für Microsoft Windows und Mac OS. Excel-Tabellen eignen sich zur Verwaltung von großen Datenmengen wie etwa Statistischen Funktionen. Es besitzt unter anderem Sortier- und Filterfunktionen und ermöglicht den Einsatz von Formeln, um umfangreiche Berechnungen durchzuführen und darzustellen. Excel kann verschiedene Dateiformate lesen und speichern, im- und exportieren. Hierzu zählen verschiedene Textformate und Formate anderer Tabellenkalkulations- und Datenbankprogramme.

  • INI - Format zur Speicherung von Konfigurationsdateien
    • INI-FormatDas INI-Format ist ein in der Windows-Welt sehr verbreitetes Format zur Speicherung von Konfigurationsdateien einer Software. Es bestimmt über Abschnitte und Schlüssel/Wert-Paare interne Programm-/Softwarekonfigurationen. Weitere verbreitete Formate zur Speicherung von Konfigurationswerten sind YAML, JSON oder XML.
  • JavaScript Object Notation (JSON) - Dateiendung .json
    • JSON ist ein Programmiersprachen unabhängiges kompaktes Datenformat. Es wird zur Übertragung und zur Speicherung strukturierter Daten benutzt. Es kommt insbesondere bei Webanwendungen und mobilen Apps in Verbindung mit Ajax, JavaScript oder WebSockets zum Einsatz.
  • SQL (Strukturierte SQL2 -Anweisungen)
    • SQLDie SQL-Dateien enthalten Anweisungen im SQL-Sprachdialekt, welche mit einer Datenbank interagieren können. Ein Gremium, bestehend aus Vertretern des ISO (Internationale Organisation für Normung), des IEC (Internationale Elektrotechnische Kommission) sowie u. a. des Deutschen Instituts für Normung e.V. (DIN) und des American National Standards Institute (ANSI), kümmert sich um die Standardisierung von SQL.
  • XML - Dateiendung .xml
    • XML (Extensible Markup Language) wird häufig im Zusammenhang mit aktuellen Internetkomponenten verwendet. Die Standardzeichenkodierung eines XML-Dokuments ist UTF-8. Systeme, die XML bearbeiten, müssen sowohl UTF-8 als auch UTF-16 beherrschen. Falls ein Datenaustausch über das Internet erfolgen soll, ist XML ein wichtiger Punkt, der bei der Auswahl der Software abgeklärt werden muss. Viele formale Sprachen bedienen sich mittlerweile der XML Syntax.

      Fragen Sie den Hersteller, ob Daten in ein so genanntes XML-Format exportiert werden können. Alternativ wäre eine Transfer von PDF nach XML möglich. Mittels XML-Dateien werden heute Daten zwischen unterschiedlichen Computersystemen ausgetauscht. XML kommt überwiegend im Internet zum Einsatz.3

1 Während früher hauptsächlich Dateiverarbeitungssysteme im Einsatz waren, sind es heute hierarchische, relationale oder Netzwerk-Datenbanken
2 Steht für Structured Query Language, welche eine Datenbank-Abfragesprache zur Definition und Manipulation von Datenbeständen ist.
3 vgl. auch Wikipedia: Extensible Markup Language, aufgerufen am 30.09.2022
vgl. auch Gabler Wirtschaftslexikon: XML, aufgerufen am 30.09.2022
Abkürzungen:
.dbf: DataBaseFiles
DBF: DataBaseFiles
IBM: International Business Machines
EDIFACT: Electronic Data Interchange for Administration, Commerce and Transport
EANCOM: EAN + Communication
ODETTE: Organisation for Data Exchange by Tele-Transmission in Europe
.xlsx: Microsoft Excel Open XML Spreadsheet
.xlsm: Excel Spreadsheet Xml macro-enabled
OS: Operating System
JSON: Java-Script Object Notation
XML: Extended Markup Language
SQL: Structured Query Language
ISO: Internationale Organisation für Normung
IEC: International Electrotechnical Commission
a.: anno
e.V.: eingetragener Verein
DIN: Deutsche Institut für Normung
ANSI: American National Standards Institute
UTF-8: Unicode Transformation Format 8
PDF: Portable Document Format
vgl.: vergleiche