CODEERMACHINES EN CRYPTOGRAFIE
The Gold-Bug / De Goudkever
Home


Over The Gold-Bug

Originele tekening The Gold-Bug door Felix O. C. Darley

In 1840 publiceerde Edgar Allan Poe een stuk in Alexander's Weekly Messenger, een krant in Philadelphia, waar hij de lezers vroeg hun eigen cryptogrammen in te sturen die hij dan zou ontcijferen. Initieel ontving hij cryptogrammen uit Philadelphia, maar weldra kwamen ze uit alle hoeken van de Verenigde Staten. Hij publiceerde de cryptogrammen en hun oplossingen in vijftien edities van Alexander's Weekly Messenger.

Het jaar daarop publiceerde Poe het essay "A Few Words on Secret Writing" in Graham's Magazine, waarin hij ook de respons op zijn wedstrijd beschrijft. Dit essay bevatte ook het beroemde citaat dat "het menselijke vernuft geen vercijfering kan bedenken die het menselijke vernuft niet kan oplossen".

In de 19de eeuw waren geheimschrift en cryptografie voor de meeste mensen een onbekende en mysterieuze kunst, en Poe had plots een enorme interesse in cryptografie opgewekt bij het grote publiek. Dankzij Poe's publicaties werden cryptogram puzzels zeer populair in kranten en weekbladen. Geïnspireerd door het succes van de cryptogrammen en de grote interesse in zijn essay besliste hij een kortverhaal te schrijven waar cryptografie in voorkwam.

Nadat hij The Gold-Bug (De Goudkever) schreef diende hij het kortverhaal in voor een schrijfwedstrijd. Hij won de hoofdprijs en 100$. Het verhaal werd op 21 juni 1843 gepubliceerd in de Philadelphia's Dollar Newspaper en wordt aanzien als de eerste belangrijke publicatie in populaire niet-technische literatuur dat cryptografie in zijn verhaallijn bracht. The Gold-Bug bevat een gedetailleerde beschrijving hoe men een cryptogram moet oplossen met letter-frequentie analyse. Het verhaal werd een enorm succes en hielp cryptografie populair te maken in de 19de eeuw.

Edgar Allan Poe's The Gold-Bug is even iconisch voor cryptografie in de literatuur als David Kahn's The Codebrekers is voor historische publicaties. Het werd zijn meest gelezen en bekendste verhaal. Veel lezer hebben hun eerste stappen in cryptografie gezet na het lezen van zijn verhaal, en enkelen werden zelfs belangrijke codebrekers, zoals de beroemde cryptoloog William Friendman. Heel wat schrijvers werden geïnspireerd door Poe om vercijferde berichten en codes in hun eigen boeken te verwerken. Poe wordt ook beschouwd als een van de pioniers in detective- en mysterieverhalen.

It is a curious fact that popular interest in this country in the subject
of cryptography received its first stimulus from Edgar Allan Poe.


Lt. Col. William F. Friedman 1936

Het verhaal Top

William Legrand woont op Sullivan's Island nabij Charleston in South Carolina om te ontsnappen aan enkele tegenslagen. Legrand ontdekt een goudglanzende kever die hij uitleent aan een kennis. Wanneer zijn vriend, de verteller van het verhaal, hem bezoekt, beschrijft Legrand de kever met een doodskop op zijn rug en tekent een afbeelding van de kever op een stuk papier. Korte tijd later vraagt Legrand zijn vriend om zo snel mogelijk terug te komen.

Wanneer zijn vriend aankomt legt Legrand uit dat hij een geheime boodschap in onzichtbare inkt heeft ontdekt na per ongeluk de tekening van de goudkever te verhitten. Nadat hij het bericht ontcijferde, nodigt hij zijn vriend uit om mee op expeditie te gaan in het woud, om een schat te zoeken nabij enkele rotsen. Uit angst dat Legrand zijn verstand heeft verloren, stemt de bezorgde vriend ermee in hem te vergezellen.

Het cryptogram, ontdekt door Legrand:

Image by Dirk Rijmenants - Cipher Machines & Cryptology
Een afdrukbare versie is beschikbaar in txt formaat.

 


Edgar Allan Poe 1849

The Gold-Bug is niet enkel een verhaal over de ontdekking van een verborgen schat maar ook een prachtige introductie in cryptografie en codebreken. Het prikkelt de nieuwsgierigheid van de lezer en Poe geeft een gedetailleerde uitleg hoe het cryptogram moet opgelost worden. Daarbij geeft hij ook de oplossing. Het bericht zelf ontcijferen is echter nog spannender dan te lezen hoe Legrand het doet in het verhaal. Kan ik je, net als Poe indertijd, uitdagen om Legrands bericht te ontcijferen dat meer dan 160 jaar geleden werd samengesteld?

Het bericht ontcijferen Top

In plaats van eenvoudigweg Poe's verhaal te lezen geven we jou de kans geven om het helemaal zelf te doen. Het kan nuttig zijn om eerst The Gold-Bug te lezen omdat het verhaal informatie kan bevatten om het cryptogram te helpen ontcijferen. Lees echter niet verder dan waar het cryptogram staat! Niet vals spelen door verder te lezen. The Gold-Bug zoeken op het internet zal ook de pret bederven. Denk eraan dat het bericht in het Engels is geschreven!

Het bericht is vercijferd met mono-alfabetische substitutie, waarbij men alle letters van het alfabet vervangt door andere symbolen of letters. We kunnen alle mogelijke combinaties berekenen voor de 26 letter van het alfabet. De eerste letter wordt vervangen door één van 26 symbolen of letters, inclusief zichzelf. De tweede door één van de 25 overige, enzovoort. De berekening 26 x 25 x 24…x 3 x 2 x 1 of 26! geeft 403.291.461.126.605.635.584.000.000 verschillende manieren om de 26 letters te vervangen door 26 symbolen of letters. Hoe is het mogelijk om zo'n cryptogram op te lossen? Eeuwenlang leek substitutie-vercijfering onbreekbaar...maar het is eenvoudiger dan het lijkt.

Hoewel er triljarden mogelijkheden zijn om een set symbolen aan letters toe te wijzen, zijn er slechts een paar manieren om klinkers en medeklinkers te combineren in een natuurlijke taal. Strikte regels bepalen welke lettercombinaties mogelijk en welke verboden zijn. De syntaxis schrijft voor in welke volgorde woorden geschreven moeten worden en welke vervoegingen gebruikt dienen te worden. Wanneer we letters vervangen door andere letters of symbolen volgen deze symbolen nog steeds de strikte regels en creëren dus patronen die we kunnen detecteren. Net als bepaalde lettercombinaties onmogelijk zijn (SMG, AZK...) zo zullen bepaalde symbolen elkaar mijden. Net als bepaalde klinkers steeds in een set van medeklinkers past (BR?ND, VL?T...) zo zullen sommige symbolen elkaar aantrekken. Maar hoe beginnen we hieraan?

Het geheime wapen is letter-frequentie analyse, de basis van alle codebreken. Elke taal heeft zijn eigen typische verdeling van letters in een tekst. In het Engels, de taal van het vercijferde bericht, is de letter E veruit de dominantste letter met gemiddeld 12,7 procent. Als we enkele van de meest gebruikte klinkers or medeklinkers kunnen lokaliseren in een vercijferde tekst, of we vinden terugkerende combinaties van symbolen, dan geven de regels van de taal ons sterke aanwijzingen naar de woorden waarin ze gebruikt werden of de letters die ze voorstellen.

Hieronder vind je de Engelse letterfrequentie-tabel, geordend van meest frequent links tot minst frequent rechts. Poe gebruikte een oudere iets andere tabel. Frequentietabellen kunnen echter in een gegeven taal verschillen, afhankelijk van onderwerp, stijl en de lengte van de tekst. Poe gebruikte geen spaties, of een symbool voor spatie, in de vercijferde tekst. In gewone tekst komt de spatie veel vaker voor dan de letter E, en zou duidelijk opvallen.

Om u een idee te geven hoe duidelijk de verschillen in letter-frequenties zijn, laat ons eens kijken naar het aantal keren enkele letters voorkomen op deze Nederlandstalige webpagina die u nu leest: E=1940 N=874 A=578 G=274 U=174 Z=87 Q=19. Let wel, dit is in het Nederlands. De Engelse taal, gebruikt in het verhaal van The Gold-Bug, heeft een andere taalspecifieke statistische distributie van letters.

Neem voor Legrands bericht een blad met ruitjes en schrijf daarop de geheime tekst met symbolen. Laat een lege regel tussen elke rij symbolen om je oplossingen eronder te schrijven met potlood (makkelijk te corrigeren met gom). Tel vervolgens hoe vaak elk symbool in het cryptogram voorkomt en schrijf de resultaten, gerangschikt van meest frequent naar minst frequent, onder de letters in de tabel met Engelse letterfrequentie-verdeling (zie rechts). Dit geeft een eerste ruwe indicatie van de letter-frequentie verdeling van de symbolen en de letters ze mogelijk kunnen vertegenwoordigen.

Je zult merken dat één symbool er duidelijk uitspringt. Dat is de eerste belangrijke aanwijzing, want het vertegenwoordigt de letter E, de meest voorkomende letter in het Engels. Dat is de eerste letter die je overal in de tekst in potlood onder dat symbool kunt schrijven, en ook onder de letter E in de letter-frequentie tabel. Maak ook een tweede tabel met alle symbolen en de bijbehorende letters die je al hebt gevonden.

Probeer dan terugkerende combinaties van symbolen te vinden in het cryptogram. Enkele van de meest gebruikte woorden in het Engels, in volgorde van frequentie, zijn de letters THE, OF, TO, AND, IN. Zoek naar terugkerende combinaties van drie of twee symbolen die die woorden zouden kunnen vertegenwoordigen. Je zou elke THE vrij gemakkelijk moeten kunnen vinden. Als dat zo is, heb je de oplossing gevonden voor nog twee veelgebruikte letters. Let wel, niet elke combinatie van drie symbolen zal de woorden THE of AND vertegenwoordigen. Maak ook een tabel met alle symbolen en de reeds gevonden corresponderende letters.

Wanneer je woorden aanvult met een voor de hand liggende letter, kan je ook andere woorden vinden of aanvullen. Als je bijvoorbeeld de letters T en E al hebt geïdentificeerd, en je komt het fragment T?EE tegen, is het niet moeilijk om de ontbrekende letter R te vinden, vooral als je de context al kent. De klinker-combinaties (AA, EE, OO…) komen vaak voor, maar niet veel verschillende woorden bevatten zulke letter-paren. Probeer die woorden te vinden. Als het niet meteen lukt, probeer dan nog onbekende letters van het alfabet totdat je iets leesbaars vindt. Elke nieuwe bevestigde letter zal je ook helpen om andere delen van de tekst te reconstrueren.

Wees geduldig. Het kan even duren eer de woorden voor je verschijnen, en sommige lettercombinaties blijken misschien onjuist te zijn. Hoe meer letters je echter vindt, hoe sneller je nieuwe letters of woorden identificeert. Voor je het weet is de volledige tekst ontcijferd. Letterfrequentie-analyse is een krachtig hulpmiddel in de cryptografie, en op het internet zijn letterfrequentie-tabellen voor Nederlands en veel andere talen te vinden.

Veel geluk... en zorg dat je niet gebeten wordt door de kever!

Opmerking: in de originele editie werd één symbool "(" niet afgedrukt nabij het einde van het bericht, net na ‡9;48; hoewel Legrand net dat ontbrekende symbool beschrijft om te helpen bij het vinden van een woord. Aangezien het verhaal naar dat symbool refereert is het onwaarschijnlijk dat het met opzet werd weggelaten en is het waarschijnlijk verloren tijdens het drukken.

Downloads Top

Meer over Letter-frequenties en Edgar Allan Poe (off-site, opent in nieuwe tab) Top

Meer over manuele vercijfering Top

  • Handcijfers Verschillende technieken om berichten te vercijferen met pen en papier.

Web Analytics Made Easy -
StatCounter

© Dirk Rijmenants 2004. Last changes: 26 Februari 2026

Home