|
Heinpragt.com
(c) Hein Pragt |
Taalfoutje melden! | Mijn
|
|
|
|
|
Pagina menu XML voor managers
© 2006 Hein PragtDeze artikelen zijn bedoeld voor managers, projectleiders en andere personen die strategische beslissingen moeten nemen op het gebied van informatiebeheer binnen hun organisatie over het onderwerp XML. Inhoud Wat is XML
XML is een door het World Wide Web Consortium (W3C) aanbevolen standaard voor het beschrijven van gestructureerde data. Als zodanig stelt XML communicerende partijen in staat gegevens uit te wisselen via een flexibel formaat, dat onafhankelijk is van applicaties en platformen en programmeertalen. XML is een generieke markup taal, dit wil zeggen, met behulp van XML kan een document worden voorzien van codes (tags) voor het structureren van de data in dit document. Een XML document is een document dat is gestructureerd in een bepaalde indeling. De gebruikte indeling kan willekeurig zijn maar ook strikt afhankelijk zijn van een document type definitie. Aangezien deze DTD niet verplicht is mag de indeling ook willekeurig zijn zolang maar aan de basis regels van XML voldaan is. Dit is de grote kracht maar ook een zwakte van XML. Een standaard kommagescheiden bestand met een enkele geldige tag eromheen is ook geldige XML. Het is duidelijk dat met de data waarschijnlijk verder niets te beginnen valt. De waarde van XML is gebaseerd op drie belangrijke eigenschappen:
Deze eigenschappen maken XML tot een krachtige standaard die voor zeer uiteenlopende doeleinden gebruikt kan worden. De structuur van een XML document
Een belangrijk voordeel van XML documenten is dat ze zowel leesbaar zijn voor machines als voor mensen. Een XML document bestaat namelijk uit normale tekst. Hieronder staat een globale beschrijving van de structuur van een XML document. Elementen
Een XML document bestaat uit gestructureerde data, deze is ondergebracht in zogeheten elementen. Elk element heeft een type, inhoud en eventueel attributen. De inhoud mag leeg zijn, kan uit tekst bestaan of weer uit andere elementen bestaan. Dit is een eenvoudig voorbeeld van een XML document met slechts één element. <voornaam>Hein</voornaam> Dit element heeft als type 'voornaam', en als inhoud de tekst 'Hein'. De inhoud van een element moet altijd worden omsloten door zogenaamde tags. Een element begint met een begin tag en eindigt met een eind tag. Een begin tag is een woord omgeven door '<' en '>' tekens, terwijl een eind tag hetzelfde woord is met een '/' teken ervoor. Elementen kunnen ook weer uit andere elementen bestaan. <naam> <voornaam>Hein</voornaam> <achternaam>Pragt</achternaam> </naam> Dit document bestaat uit drie elementen, waarbij het element 'naam' is samengesteld uit 'voornaam' en 'achternaam'. Op deze manier kunnen willekeurige gegevens worden gestructureerd. Voorwaarde is wel dat alle elementen goed genest (in de correcte volgorder staan en in de goede volgorde afgesloten worden) zijn. Attributen
Elementen kunnen ook attributen hebben, hiermee kan extra informatie worden opgeslagen bij een element. <inkoopprijs valuta="euro">10.45</inkoopprijs> Attributen worden meestal gebruikt om extra informatie te geven over de data. In een DTD kan ook een attribuut lijst opgenomen worden zodat er maar een beperkt aantal controleerbare attributen mogelijk zijn. Document type beschrijving
Door middel van een schema of DTD kunnen we de structuur van een XML document vastleggen. Een DTD vormt een soort grammatica van een XML document. De DTD kan in het XML document zelf worden opgenomen. In dit geval is een XML document dan zelfbeschrijvend omdat het document zijn eigen definitie bevat. Een DTD voor het vorige naam voorbeeld zou er zo uit kunnen zien: <!ELEMENT naam (voornaam, achternaam)> <!ELEMENT voornaam (#PCDATA)> <!ELEMENT achternaam (#PCDATA)> #PCDATA staat voor de inhoud van het element en is tevens de laagste stap in de DTD. Het element voornaam kan dus geen subelementen bevatten. Het element naam is samengesteld uit andere elementen, namelijk een element voornaam gevolgd door een element achternaam. Binnen naam mag ook geen tekst staan, alleen maar de twee elementen voornaam en achternaam. Op deze wijze dwingen we een structuur af via een DTD. Een XML parser kan de structuur van het XML document controleren met behulp van deze DTD. De geschiedenis van XML
De oorsprong van SGML ligt bij IBM, waar Charles Goldfarb in 1969 een onderzoek deed naar hergebruik van documenten en scheiding van structuur en opmaak. IBM gaf heel veel verschillende soorten documentatie uit, waardoor de standaard ook erg complex werd. Hij begon het project met de naam GML die in 1974 overging in SGML (Standard Generalized Mark-up Language) waarna het in 1986 een ISO (8879) standaard werd. SGML was heel krachtig maar ook heel complex. Het eerste gebruik was op het vlak van het elektronische publiceren. Vanuit deze standaard ontstond in 1991 HTML (Hyper Text Mark-up Language). Tim Berners-Lee en Anders Berglund bedachten een tag gebaseerde taal om wetenschappelijke documenten van het CERN in Genève gemakkelijker toegankelijk te maken. Hij ontwikkelde ook de eerste webbrowser, WorldWideWeb genaamd. Binnen HTML was er wel een scheiding tussen structuur en opmaak maar de opmaak van de structuurdelen lag wel vast. Ook waren er tags die alleen de opmaak beschreven zoals vet en cursief. Dit was eigenlijk tegen de regels van SGML in maar werd de standaard op het World Wide Web. De ontwikkeling van XML startte in 1996. Twee jaar later werd XML als Recommendation door het W3C vastgelegd. Het W3C (World Wide Web Consortium) combineerde de kracht van SGML met de eenvoud van HTML tot XML. Het is een vereenvoudigde subset van SGML waarbij enkele complexe zaken weggelaten zijn. De specificatie van XML is minder dan een tiende van de SGML specificatie. XML heeft echter wel 80 procent van de functionaliteit van SGML bereikt met 20 procent van de complexiteit van SGML. Vanuit de XML standaard zijn de laatste jaren vele andere XML gebaseerde standaarden ontwikkeld en XML is op weg de standaard voor alle documenten te worden. De voordelen van XML
De valkuilen van XML
Verklarende woordenlijst#PCDATA(Parsed Character Data) De feitelijke data van een element.
ActiveXEen set technologieën waarmee softwareonderdelen kunnen samenwerken in een netwerkomgeving, onafhankelijk van de taal waarin de onderdelen zijn gemaakt.
ADO(ActiveX Data Objects) Een interface voor gegevenstoegang waarmee clientprogramma's gegevens in een bestands- of servergebaseerde database kunnen openen en manipuleren.
AppletEen programma dat in de programmeertaal Java is geschreven en dat kan worden opgenomen in een HTML-pagina. Java-applets kunnen worden gedownload en uitgevoerd door een webbrowser.
ASCII(American Standard Code for Information Interchange) Een coderingsschema dat gebruik maakt van 255 tekens inclusief letters, cijfers, leestekens, besturingstekens en andere symbolen. ASCII is een standaard voor het overbrengen van gegevens tussen verschillende typen hardware- en softwaresystemen.
ASP.NETEen set technologieën binnen het raamwerk van Microsoft .NET waarmee webprogramma's en XML-webservices kunnen worden ontwikkeld. Webservers die compatibel zijn met ASP.NET kunnen als host fungeren voor webservices en webprogramma's uitvoeren.
ASP(Active Server Pages) Een scripttechnologie voor scripts die op de server worden uitgevoerd waarmee dynamische interactieve webtoepassingen kunnen worden gemaakt. Een ASP-bestand is een document dat scripts bevat die door een ASP-compatibele webserver kunnen worden uitgevoerd.
BestandEen hoeveelheid informatie met een naam die op een computer opgeslagen is, de Engelse term voor bestand is file.
BrowserEen programma dat HTML-bestanden interpreteert, opmaakt als webpagina's en weergeeft. U kunt een webbrowser gebruiken om van de ene webpagina naar de andere te gaan door middel van hyperlinks.
CertificaatEen digitaal ondertekend document dat wordt uitgegeven door een certificeringsinstantie waarmee u internet verkeer kunt beveiligen.
CGI(Common Gateway Interface) Een standaardmethode om de functionaliteit van webservers uit te breiden door programma's of scripts op een webserver uit te voeren als reactie op aanvragen van webbrowsers.
CSSEen specificatie die is ontwikkeld door het World Wide Web Consortium waarin wordt gedefinieerd hoe aan webpagina's opmaakmodellen gekoppeld kunnen worden. Deze opmaakmodellen definiëren de weergave en de opmaak van inhoud van webpagina's.
DAO(Data Access Objects) Een interface voor gegevenstoegang die communiceert met Microsoft Jet en ODBC-compatibele gegevensbronnen voor het maken van verbinding met databases.
DatabaseEen bestand of server die records met gegevens bevat die zijn georganiseerd met de mogelijkheid deze gegevens gemakkelijk te kunnen zoeken, bijwerken, sorteren en combineren.
DHTML(Dynamic HTML) Een uitbreiding van HTML waarmee u webpagina's meer interactief kunt maken. Webpagina's waarin DHTML wordt gebruikt kunnen dynamisch worden gewijzigd en bijgewerkt als reactie op acties van gebeuikers, zonder dat de pagina's na elke actie opnieuw vanaf een server hoeven te worden geladen.
DOM(Document Object Model) Dit is een object-georiënteerde benadering van gestructureerde documenten zoals HTML-, XHTML- en XML-documenten waarbij de onderdelen (en de eigenschappen van elk onderdeel) van het document afzonderlijk benaderd kunnen worden.
DomeinnaamEen logische naam waarmee een computer systeem (meestal webserver) gezocht kan worden. Door een zogenaamde DNS (Domain Name Server) zal deze naam omgezet worden in een IP adres.
DTD(Document Type Definition) Documenttype definitie is een schema taal die oorspronkelijk bij SGML gebruikt werd. Een DTD kan onder meer aangeven, wat voor soort tags en in welke volgorder deze in een XML document mogen voorkomen.
ERP(Enterprise Resource Planning)In het Nederlands is 'bedrijfsinformatiesysteem’ de beste omschrijving. Een ERP-systeem ondersteunt alle bedrijfsprocessen in een organisatie zoals de inkoop, verkoop en de administratie waarbij tussen alle afdelingen gegevens worden uitgewisseld.
FAQFAQ is een samentrekking van de woorden 'Frequently Asked Questions'. Dit zijn lijsten met veel gestelde vragen over een bepaald onderwerp waarop een antwoord wordt gegeven.
FirewallEen combinatie van hardware en software waarmee een netwerk of computersysteem kan worden beveiligd. Een firewall blokkeert ongewenste toegang tot een beveiligd netwerk.
FTP(File Transfer Protocol) Een protocol waarmee bestanden via een netwerk of internet van en naar externe computersystemen kunnen worden overgebracht.
GIF(Graphics Interchange Format)Een gecomprimeerde bestandsindeling die veel gebruikt wordt om kleurafbeeldingen weer te geven.
HTML(Hypertext Markup Language) De standaardopmaaktaal voor documenten op het World Wide Web. HTML is een subset van Standard Generalized Markup Language (SGML).
HTTP(Hypertext Transfer Protocol) Een protocol waarmee webbrowsers webpagina's en informatie van servers op het World Wide Web kunnen ophalen.
HTTPS(Hypertext Transfer Protocol Secure) Een protocol waarmee webbrowsers webpagina's en informatie op een veilige manier van servers op het World Wide Web kunnen ophalen. HTTPS biedt de mogelijkheid om gegevens te coderen.
HyperlinkEen verwijzing in de vorm van tekst, een afbeelding of een ander pagina--element naar een webpagina of bestand. Hyperlinks vormen op het World Wide Web de belangrijkste manier om tussen webpagina’s en websites te navigeren.Een hyperlink wordt ook wel een koppeling genoemd.
InternetDe wereldwijde verzameling van computers, netwerken en gateways die via TCP/IP-protocollen met elkaar communiceren.
IntranetEen netwerk binnen een organisatie waarvoor internettechnologieën en -protocollen worden gebruikt, maar dat alleen beschikbaar is voor bijvoorbeeld de werknemers van een bedrijf.
IP(Internet Protocol) Een TCP/IP-protocol waarmee gegevens in pakketten worden verdeeld die van de afzender naar de bestemming worden verzonden waar ze weer worden samengevoegd tot de oorspronkelijke gegevens.
ISP(Internetprovider) Een bedrijf dat services voor internetaansluitingen aanbiedt aan privé-personen, bedrijven en andere organisaties.
JavaEen objectgeoriënteerde programmeertaal die is ontwikkeld door Sun Microsystems. Programma's die in Java zijn geschreven zijn onafhankelijk van het platform en kunnen dus worden uitgevoerd op elk type computer.
JavaScriptEen scripttaal die kan worden gebruikt om functionaliteit aan een webpagina toe te voegen of een webpagina of website te verfraaien. JavaScript-scripts kunnen worden uitgevoerd op zowel de client als de servercomputer.
JPEG(Joint Photographic Experts Group) Een gecomprimeerd afbeeldings bestandsindeling waarmee kleurenafbeeldingen met een hoge resolutie worden weergegeven.
JVM(Java Virtual Machine) Een programma dat Java applets en programma's kan uitvoeren.
MATHML(Mathematical Markup Language) Toepassing van XML voor wiskundige en wetenschappelijke notaties.
MSXMLDe XML parser van Microsoft, ingebouwd in Interne Explorer 5.0 en hoger.
ODBC(Open Database Connectivity) Een standaardmethode om gegevens uit te wisselen tussen databases en programma's.
OpmaakprofielEen set opmaakkenmerken voor tekst of andere pagina-elementen.
Parser(Engelse to parse is ontleden) Dit is een computerprogramma, of component van een programma, dat de grammaticale structuur van een invoer volgens een vastgelegde grammatica analyseert (parseert).
PCX(PC Paintbrush) Een grafische bestandsindeling waarbij de grafische gegevens eenvoudig worden gecomprimeerd. Deze indeling wordt gebruikt door oudere versies van Windows Paintbrush.
PNG(Portable Network Graphics) Een bestandsindeling voor gecomprimeerde afbeeldingen die vergelijkbaar is met de GIF-indeling. PNG is een open standaard en was het antwoord op het patent dat na jaren ineens opdook voor de GIF indeling.
PPP(Point-to-Point Protocol) Een internetstandaard voor het verzenden van gegevens via seriële verbindingen tussen computers.
ProtocolEen set regels en standaarden die computers in staat stellen om te communiceren.
ProxyserverEen internetserver die fungeert als toeganspoort voor verschillende computer systemen.
RDBMS(relationeel databasebeheersysteem) Een databasebeheersysteem waarin gegevens in verwante rijen en kolommen worden geordend zoals in het relationele model is gedefinieerd. MYSQL, Microsoft SQL Server en Oracle zijn bekende voorbeelden.
SAX(Simple API (Application Programming) Interface) Dit is een beschrijving van interface om XML op een event-gebaseerde manier te verwerken.
ScriptEen programmeertaal waarmee een set instructies naar een programma zoals een webbrowser kan worden gestuurd. Een script wordt rechtstreeks uitgevoerd door een programma waarmee de taal van het script kan worden gelezen.
SelectorIn de opmaakprofieldefinitie CSS opmaakmodel is dit het patroon voor een HTML of XML element dat aan een bepaalde set opmaakeigenschappen en waarden is gekoppeld.
SGML(Standard Generalized Markup Language) Een taal waarmee elementen en gegevens in een document kunnen worden georganiseerd en van een code voorzien. SGML geeft alleen de structuur aan, niet de opmaak op.
SOAP(Simple Object Access Protocol) Een protocol voor het uitwisselen van informatie middels HTTP en XML tussen systemen van het zelfde of andere Operating Systemen.
SQL(Structured Query Language) Een veelgebruikte opvraag en programmeertaal voor databases.
SSL(Secure Sockets Layer) Een standaard die door Netscape Communications is ontwikkeld om gegevens te coderen en veilig over internet te verzenden.
TCP(Transmission Control Protocol) Netwerksoftware waarmee de overdracht van gegevenspakketten via internet wordt geregeld.
TIFF(Tagged Image File Format) Een grafische indeling met hoge resolutie op basis van codes die veel gebruikt wordt voor het scannen, de opslag en de uitwisseling van afbeeldingen.
UDDI(Universal Description, Discovery, en Integration) Dit is een XML gebaseerde registry voor ondernemingen op het internet met als doel interoperability van systemen voor e-business, het is vergelijk baar met het Telefoonboek of Gouden Gids.
UNIXEen multitasking-besturingssysteem voor meerdere gebruikers dat diverse vormen en implementaties kent. Veel webservers draaien op UNIX-systemen.
URL(Uniform Resource Locator) Een uniek adres dat de locatie van een pagina, bestand of andere bron op internet identificeert. Een internetadres bestaat meestal uit vier delen: het protocol waarmee toegang gezocht wordt tot de bron, bijvoorbeeld http://, het servertype, de servernaam, die vaak de naam is van de organisatie die de bron onderhoudt, en een achtervoegsel dat meestal het type organisatie definieert dat de bron onderhoudt.
VariabeleLetters of een naam waarmee numerieke waarden, tekens, tekenreeksen of geheugenadressen worden aangeduid. Bij het schrijven van programmacode gebruikt een programmeur variabelen om gegevens weer te geven. Wanneer het programma wordt uitgevoerd, worden de variabelen vervangen door de echte gegevens.
VB(Visual Basic) Een programmeertaal die Microsoft ontwikkeld voor het maken van Windows-toepassingen.
VBA(Visual Basic for Applications) Een subset van de programmeertaal Microsoft Visual Basic.
VBSCRIPT(Visual Basic Scripting Edition) Een scripttaal die kan worden gebruikt om functionaliteit aan een webpagina of website toe te voegen.
VcardvCard is een open standaard voor het bewaren van adresgegevens.
VML(Vector Markup Language) Een op XML gebaseerde taal waarmee tweedimensionale vectorafbeeldingen kunnen worden gemaakt in HTML- of XML-documenten.
W3C(World Wide Web Consortium) Een consortium van commerciële en educatieve instituten dat toezicht houdt op onderzoek en normen propageert voor alle gebieden die verband houden met het World Wide Web.
WEBDAV(Web-based Distributed Authoring and Versioning) Een toepassingsprotocol dat verwant is met HTTP waarmee auteurs die gebruikmaken van verschillende computers bestanden op het World Wide Web kunnen publiceren en beheren.
WebserviceEen webservice is een API waardoor webapplicaties met elkaar kunnen communiceren. Hierdoor kunnen bepaalde taken uitgevoerd worden door andere servers en websites. Webservices worden meestal ontwikkeld in XML.
WSDL(Web Services Definition Language) Dit specificeert welke functionaliteit een Web Service aanbiedt, welke datatypen en security een Web Service gebruikt en waar de Web Service zich bevindt.
WWW(World Wide Web) Het grafische multimediagedeelte van internet. De meest gebruikelijke bestanden op het World Wide Web zijn HTML-documenten oftewel webpagina's.
WYSIWYGStaat voor 'What You See Is What You Get' (wat u ziet is wat u krijgt). Met een WYSIWYG-weergave ziet u hoe uw webpagina of document er in uiteindelijke uit zal zien.
XML(Extensible Markup Language) Een subset van SGML (Standard Generalized Markup Language), een taal voor het maken van datastructuren waarmee gegevens tussen programma's, servers en organisaties kunnen worden gedefinieerd, verzonden, gevalideerd en geïnterpreteerd.
XSL(Extensible Stylesheet Language) Een op XML gebaseerde taal voor het maken van opmaakprofielen waarmee XML-documenten in andere soorten documenten kunnen worden omgezet.
XSLT(Extensible Stylesheet Language Transformations) Een taal waarmee XML-documenten in andere XML-documenten kunnen worden omgezet, dit is een subset van XLS (Extensible Stylesheet Language).
|
|
Disclaimer. |