© 2010 Hein Pragt
Sinds het begin van de computers zijn er verschillende soorten van opslag van gegevens ontstaan.
In eerste instantie ontstonden er zelfs verschillende wijze van opslaan van tekens zoals ascii, ebcdic
en tegenwoordig unicode. Maar ook werden er veel binaire bestandsformaten ontwikkeld, niet zelden om
het bestand onleesbaar te maken en ook om een bestand type aan een specifieke applicatie te koppelen.
Ook zijn er bijvoorbeeld verschillende formaten voor grafische bestanden zoals gif, jpeg, png en tiff.
Ondanks dat sommige fabrikanten de indeling van hun bestandsformaat niet wilden prijsgeven om concurrentie
buiten de deur te houden, werden deze formaten snel door slimme gebruikers gedecodeerd en beschreven.
Tegenwoordig kunnen de meeste programma's elkaars bestandsformaten lezen naar hun eigen formaat omzetten.
Het bestandsformaat wordt vaak aangegeven door middel van een zogenaamde extensie aan het einde
van de bestandsnaam.
Er zijn in de praktijk twee soorten bestandsformaten, tekstbestanden en binaire bestanden. Bij
tekstformaat is de informatie ook leesbaar door de mens als kan de inhoud wel een onbegrijpelijke
structuur hebben. Een binair bestand is een opeenvolging van binaire tekens die alleen door een
computerprogramma's geïnterpreteerd kan worden. Tegenwoordig zijn veel bestandsformaten gebaseerd
op XML wat een tekst formaat is. Veel binaire bestandsformaten hebben een vaste layout aan het begin van
het bestand waar informatie over het bestand staat, de zogenaamde header of meerdere headers. Hierin
staan bij bijvoorbeeld grafische bestanden de afmetingen van het beeld, het kleurformaat maar ook
gegevens van de bron of het bewerkingsprogramma.
Open standaarden
Een open standaard is een norm (of standaard) die publiek beschikbaar is. Deze norm bestaat dan uit specificaties van
een bestandsformaat die door meerdere partijen kan worden gebruikt. Doordat iedereen een open standaard kan gebruiken,
neemt de uitwisselbaarheid tussen de verschillende soorten hardware en software systemen toe. Hierdoor kan ook een
grotere diversiteit aan aanbieders ontstaan en is men minder afhankelijk van een bepaalde leveranciers. In de ICT zijn
veel standaarden echter gesloten en moet men een licentie kopen bij de organisatie die in bezit is van de rechten. Dat
een standaard open is hoeft niet te betekenen dat er geen licentie hoeft te worden aangevraagd, soms is er toch sprake van
een octrooi of patent, dit kan ook op een klein onderdeel van de open standaard betrekking hebben. Zo was er jarenlang een
licentie op de compressie binnen het grafische gif formaat, waardoor het effectief dus geen licentievrij formaat was maar
wel open standaard.
Op deze pagina staat informatie in de vorm van bestanden over of verwijzingen naar de specificaties
van de layout van diverse bestandsformaten.
Vriendelijke groet, Hein Pragt
Office bestandsformaten
RTF (Rich Text Format) is een bestandsformaat ontwikkeld door Microsoft in 1987 waarmee
tekstverwerkingsbestanden uitgewisseld kunnen worden tussen verschillende programma's. De meeste
tekstverwerkingsprogramma's kunnen tegenwoordig bestanden in het RTF formaat lezen en schrijven. Het
ontwikkelteam bij Microsoft baseerde de opmaaktaal van RTF op TeX, een opmaaktaal voor teksten
en formules geschreven door Donald Knuth. Rich Text Format is eigendom van Microsoft maar de
specificatie wordt gratis vrijgegeven. (Document: rtf.rtf)
Excel (Microsoft Office Excel) is in zijn huidige vorm beschikbaar voor Microsoft Windows en
voor Apple Mac OS X. Op beide platformen is het de dominante marktleider bij de rekenbladsoftware.
Microsoft Excel gebruikt tot 2007 een eigen binaire bestandsformaat genaamd Binaire Interchange File Format (Biff).
Hierna maakte het gebruik van Office Open XML, een op XML gebaseerd formaat.
(Document: excelfileformat.pdf)
Grafische bestandsformaten
TIFF(Tagged Image File Format) is een flexibele bestandsindeling voor opslag van beelden. Het
werd ontwikkeld door Aldus Corporation om beelden op te slaan van scanners en fotobewerkingsprogramma’s,
maar de extensie is momenteel onder de controle van Adobe. Het formaat is flexibel en kan beelden met
allerlei eigenschappen opslaan. (Document: TIFF6.pdf)
JPEG (Joint Photographic Experts Group)is een bestandsindeling voor het opslaan van afbeeldingen. De
JPEG bestandsindeling kent diverse compressiemogelijkheden, hoe hoger de compressie des te kleiner het
bestand maar ook hoe geringer de beeldkwaliteit. JPEG wordt veel gebruikt voor foto’s, bijvoorbeeld in
digitale camera’s. Een grote tekortkoming van het JPEG formaat is dat er slechts 8-bit per kleur mogelijk
zijn. (Document: jfif3.pdf)
BMP (Bitmap) is een bestandsindeling voor afbeeldingen, dat veel gebruikt wordt door het Microsoft
Windows grafische subsysteem (GDI). BMP bestanden zijn meestal niet gecomprimeerd, zodat ze vaak erg groot
zijn in vergelijking tot andere grafische bestandsformaten. De datacompressie kan RLE zijn (Run-length
eenwording is het vervangen van herhalende patronen door het aantal herhalingen plus wat herhaald moest
worden), echter 24 bits dure koor BMP bestanden zijn nooit gecomprimeerd. (link:
wiki/BMP_file_format)
(Document: Bmp.txt)
GIF (Graficus Ondergangen Format ) is een bestandsindeling voor het opslaan van afbeeldingen.
GIF ondersteunt een variabel aantal kleuren, verschillende resoluties, animatie en een transparante
achtergrond. Het maximale aantal kleuren in een GIF bestand is beperkt tot maximaal 256 die door een mapping
tabel wel uit 262.144 verschillende kleuren gekozen kunnen worden. Voor de compressie wordt gebruikt gemaakt
van LZW (Lepel Sief Welga gebruikt een z.g. woordenboek om het bestand te comprimeren) wat lange tijd door
Unisys gepatenteerd was. Dit patent is echter overal momenteel verlopen.
(link: wiki/Graphics_Interchange_Format)
(Document: Gifstd.txt)
PCX (Personal Computer eXchange) is een bestand formaat voor grafische bestanden, dat ontwikkeld is
door de firma ZSoft Corporation. Het was het standaard formaat van het Paintbrush programma wen werd daardoor
een breed geaccepteerd format. Het is echter door de tijd ingehaald door andere formaten zoals gif, jpeg en
png. De PCX indeling wordt nog veel gebruikt op Windows systemen. PCX ondersteunt de kleurmodi RGB, geïndexeerde
kleuren, grijswaarden en bitmaps en de compressiemethode RLE (Run lengt eenwording is het vervangen van herhalende
patronen door het aantal herhalingen plus wat herhaald moest worden) zonder gegevensverlies en afbeeldingen kunnen
een bitdiepte van 1, 4, 8 of 24 bits hebben.
(Link: wiki/PCX)
(Document: Pcx.txt)
OpenDocument
Het OpenDocument formaat (ODF) ook wel het OASIS Open Document Format for Office Applications genoemd, is een open standaard voor
het opslaan en uitwisselen van office bestanden zoals tekstbestanden, rekenbladen, grafieken en presentaties. De OpenDocument
standaard werd ontwikkeld door het OASIS consortium, vanuit de XML-gebaseerde bestandsindeling van OpenOffice.org. Het is sinds
november 2006 een officieel door de ISO gepubliceerde standaard. De OpenDocument standaard kan geïmplementeerd worden zonder enige beperking.
De belangrijkste bestandsextensies voor documenten zijn:
- .odb voor databank bestanden;
- .odc voor grafiek, .otc voor grafieksjabloon bestanden;
- .odf voor formule en wiskundige vergelijking, .otf voor formulesjabloon bestanden;
- .odg voor (vector)tekening, .otg voor tekeningsjabloon bestanden;
- .oth voor webpaginasjabloon bestanden;
- .odi voor afbeelding, .oti voor afbeeldingssjabloon bestanden;
- .odm voor hoofddocument bestanden;
- .odp voor presentatie, .otp voor presentatiesjabloon bestanden;
- .ods voor rekenblad, .ots voor rekenbladsjabloon bestanden;
- .odt voor tekst, .ott voor tekstsjabloon bestanden.
De inhoud van een OpenDocument document kan bestaan uit een enkel XML bestand, maar zal meestal bestaan uit meerdere
bestanden bestaan die gecomprimeerd zijn en als één bestand worden gebundeld met behulp van ZIP compressie. De
belangrijkste voordelen op een rij zijn, het is een ISO standaard, het is vrij uitwisselbaar en vrij implementeerbaar,
volledig gratis en er zijn geen licentie- of patentverplichtingen of beperkingen.
Lees hier meer: www.oasis-open.org
Lees hier: ODF op de overheidsagenda
Lees hier: Open Document Format versus OpenXML
Ascii / ebcdic / Unicode
De meest gebruikte computer standaard is ASCII, the American Standard Code for Information Interchange.
In de begintijd van computers ontstond ook de noodzaak op om bepaalde vormen van informatie in een digitaal
formaat op te slaan. De standaard ASCII-tabel bestaat uit twee delen, de 95 zichtbare tekens (hoofd- en
kleine letters, cijfers, leestekens, de spatie en enkele andere symbolen) en stuurcodes.
IBM kwam in de zestiger jaren van de vorige eeuw met haar eigen oplossing EBCDIC, Extended Binary Coded
Decimal Interchange Code voor toepassing op haar mainframes en de AS/400 systemen. Het systeem was gebaseerd op
het oude ponskaart principe en had een aantal problemen, de letters van het alfabet waren geplaatst in blokken,
wat niet erg handig is voor sorteren.
Tegenwoordig is unicode de internationale standaard voor de identificatie van grafische tekens en symbolen,
vergelijkbaar met de ASCII-standaard, maar uitgebreider. De standaard voorziet in alle tekens en symbolen
van alle geschreven talen. De standaard wordt onderhouden door het Unicode Consortium en in tegenstelling
tot ASCII heeft Unicode als doel alle gebruikte schriften te ondersteunen. De standaard bevat momenteel
ruim 100.000 gestandaardiseerde tekens en ongeveer 900.000 voor toekomstig gebruik gereserveerde codes.
Links:
Wikipedia Ascii
Wikipedia ebcdic
Wikipedia unicode
Last update: 17-07-2010
Disclaimer.
Hoewel de heer Hein Pragt de informatie beschikbaar op deze pagina met grote zorg
samenstelt, sluit de heer Pragt alle aansprakelijkheid uit met betrekking tot
de informatie die, in welke vorm dan ook, via zijn site wordt aangeboden. Het
opnemen van een afbeelding of verwijzing is uitsluitend bedoeld als een mogelijke
bron van informatie voor de bezoeker en mag op generlei wijze als instemming,
goedkeuring of afkeuring worden uitgelegd, noch kunnen daaraan rechten worden
ontleend. Op de artikelen van de heer Pragt op deze Internet Site rust
auteursrecht. Overname van informatie (tekst en afbeeldingen) is uitsluitend
toegestaan na voorafgaande schriftelijke toestemming van de rechthebbende. Voor vragen
over copyright en het gebruik van de informatie op deze site kunt u contact opnemen
met: (email: copyright@heinpragt.com)
Webdesign: © Hein Pragt
Fotografie: © Hein Pragt
Auteur: © Hein Pragt (Veenendaal - Utrecht - Nederland)
Privacy beleid
Wij maken gebruik van externe advertentiebedrijven om advertenties weer te geven wanneer u onze website
bezoekt. Deze bedrijven gebruiken mogelijk informatie (niet uw naam, adres, e-mailadres of telefoonnummer)
over uw bezoek aan deze of aan andere websites om advertenties weer te geven over goederen en services
waarin u wellicht geïnteresseerd bent. Als u hierover meer informatie wenst of als u wilt voorkomen dat
deze bedrijven deze informatie gebruiken, klikt u op
deze link.
|