|
It is a curious fact that
popular interest in this country in the subject |
Lt. Col. William F. Friedman 1936 |
William Legrand woont op Sullivan's Island nabij Charleston in South Carolina om te ontsnappen aan enkele tegenslagen. Legrand ontdekt een goudglanzende kever die hij uitleent aan een kennis. Wanneer zijn vriend, de verteller van het verhaal, hem bezoekt, beschrijft Legrand de kever met een doodskop op zijn rug en tekent een afbeelding van de kever op een stuk papier. Korte tijd later vraagt Legrand zijn vriend om zo snel mogelijk terug te komen.
Wanneer zijn vriend aankomt legt Legrand uit dat hij een geheime boodschap in onzichtbare inkt heeft ontdekt na per ongeluk de tekening van de goudkever te verhitten. Nadat hij het bericht ontcijferde, nodigt hij zijn vriend uit om mee op expeditie te gaan in het woud, om een schat te zoeken nabij enkele rotsen. Uit angst dat Legrand zijn verstand heeft verloren, stemt de bezorgde vriend ermee in hem te vergezellen.
| Het
cryptogram, ontdekt door Legrand:
|
|
The Gold-Bug is niet enkel een verhaal over de ontdekking van een verborgen schat maar ook een prachtige introductie in cryptografie en codebreken. Het prikkelt de nieuwsgierigheid van de lezer en Poe geeft een gedetailleerde uitleg hoe het cryptogram moet opgelost worden. Daarbij geeft hij ook de oplossing. Het bericht zelf ontcijferen is echter nog spannender dan te lezen hoe Legrand het doet in het verhaal. Kan ik je, net als Poe indertijd, uitdagen om Legrands bericht te ontcijferen dat meer dan 160 jaar geleden werd samengesteld?
In plaats van eenvoudigweg Poe's verhaal te lezen geven we jou de kans geven om het helemaal zelf te doen. Het kan nuttig zijn om eerst The Gold-Bug te lezen omdat het verhaal informatie kan bevatten om het cryptogram te helpen ontcijferen. Lees echter niet verder dan waar het cryptogram staat! Niet vals spelen door verder te lezen. The Gold-Bug zoeken op het internet zal ook de pret bederven. Denk eraan dat het bericht in het Engels is geschreven!
Het bericht is vercijferd met mono-alfabetische substitutie, waarbij men alle letters van het alfabet vervangt door andere symbolen of letters. We kunnen alle mogelijke combinaties berekenen voor de 26 letter van het alfabet. De eerste letter wordt vervangen door één van 26 symbolen of letters, inclusief zichzelf. De tweede door één van de 25 overige, enzovoort. De berekening 26 x 25 x 24 x 3 x 2 x 1 of 26! geeft 403.291.461.126.605.635.584.000.000 verschillende manieren om de 26 letters te vervangen door 26 symbolen of letters. Hoe is het mogelijk om zo'n cryptogram op te lossen? Eeuwenlang leek substitutie-vercijfering onbreekbaar...maar het is eenvoudiger dan het lijkt.
Hoewel er triljarden mogelijkheden zijn om een set symbolen aan letters toe te wijzen, zijn er slechts een paar manieren om klinkers en medeklinkers te combineren in een natuurlijke taal. Strikte regels bepalen welke lettercombinaties mogelijk en welke verboden zijn. De syntaxis schrijft voor in welke volgorde woorden geschreven moeten worden en welke vervoegingen gebruikt dienen te worden. Wanneer we letters vervangen door andere letters of symbolen volgen deze symbolen nog steeds de strikte regels en creëren dus patronen die we kunnen detecteren. Net als bepaalde lettercombinaties onmogelijk zijn (SMG, AZK...) zo zullen bepaalde symbolen elkaar mijden. Net als bepaalde klinkers steeds in een set van medeklinkers past (BR?ND, VL?T...) zo zullen sommige symbolen elkaar aantrekken. Maar hoe beginnen we hieraan?
Het geheime wapen is letter-frequentie analyse, de basis van alle codebreken. Elke taal heeft zijn eigen typische verdeling van letters in een tekst. In het Engels, de taal van het vercijferde bericht, is de letter E veruit de dominantste letter met gemiddeld 12,7 procent. Als we enkele van de meest gebruikte klinkers or medeklinkers kunnen lokaliseren in een vercijferde tekst, of we vinden terugkerende combinaties van symbolen, dan geven de regels van de taal ons sterke aanwijzingen naar de woorden waarin ze gebruikt werden of de letters die ze voorstellen.
Hieronder vind je de Engelse letterfrequentie-tabel, geordend van meest frequent links tot minst frequent rechts. Poe gebruikte een oudere iets andere tabel. Frequentietabellen kunnen echter in een gegeven taal verschillen, afhankelijk van onderwerp, stijl en de lengte van de tekst. Poe gebruikte geen spaties, of een symbool voor spatie, in de vercijferde tekst. In gewone tekst komt de spatie veel vaker voor dan de letter E, en zou duidelijk opvallen.
Om u een idee te geven hoe duidelijk de verschillen in letter-frequenties zijn, laat ons eens kijken naar het aantal keren enkele letters voorkomen op deze Nederlandstalige webpagina die u nu leest: E=1940 N=874 A=578 G=274 U=174 Z=87 Q=19. Let wel, dit is in het Nederlands. De Engelse taal, gebruikt in het verhaal van The Gold-Bug, heeft een andere taalspecifieke statistische distributie van letters.
Neem voor Legrands bericht een blad met ruitjes
en schrijf daarop de geheime tekst met symbolen. Laat een
lege regel tussen elke rij symbolen om je oplossingen
eronder te schrijven met potlood (makkelijk te corrigeren
met gom). Tel vervolgens hoe vaak elk symbool in het
cryptogram voorkomt en schrijf de resultaten,
gerangschikt van meest frequent naar minst frequent,
onder de letters in de tabel met Engelse
letterfrequentie-verdeling (zie rechts). Dit geeft een
eerste ruwe indicatie van de letter-frequentie verdeling
van de symbolen en de letters ze mogelijk kunnen
vertegenwoordigen.
Je zult merken dat één symbool er duidelijk uitspringt. Dat is de eerste belangrijke aanwijzing, want het vertegenwoordigt de letter E, de meest voorkomende letter in het Engels. Dat is de eerste letter die je overal in de tekst in potlood onder dat symbool kunt schrijven, en ook onder de letter E in de letter-frequentie tabel. Maak ook een tweede tabel met alle symbolen en de bijbehorende letters die je al hebt gevonden.
Probeer dan terugkerende combinaties van symbolen te vinden in het cryptogram. Enkele van de meest gebruikte woorden in het Engels, in volgorde van frequentie, zijn de letters THE, OF, TO, AND, IN. Zoek naar terugkerende combinaties van drie of twee symbolen die die woorden zouden kunnen vertegenwoordigen. Je zou elke THE vrij gemakkelijk moeten kunnen vinden. Als dat zo is, heb je de oplossing gevonden voor nog twee veelgebruikte letters. Let wel, niet elke combinatie van drie symbolen zal de woorden THE of AND vertegenwoordigen. Maak ook een tabel met alle symbolen en de reeds gevonden corresponderende letters.
Wanneer je woorden aanvult met een voor de hand liggende letter, kan je ook andere woorden vinden of aanvullen. Als je bijvoorbeeld de letters T en E al hebt geïdentificeerd, en je komt het fragment T?EE tegen, is het niet moeilijk om de ontbrekende letter R te vinden, vooral als je de context al kent. De klinker-combinaties (AA, EE, OO ) komen vaak voor, maar niet veel verschillende woorden bevatten zulke letter-paren. Probeer die woorden te vinden. Als het niet meteen lukt, probeer dan nog onbekende letters van het alfabet totdat je iets leesbaars vindt. Elke nieuwe bevestigde letter zal je ook helpen om andere delen van de tekst te reconstrueren.
Wees geduldig. Het kan even duren eer de woorden voor je verschijnen, en sommige lettercombinaties blijken misschien onjuist te zijn. Hoe meer letters je echter vindt, hoe sneller je nieuwe letters of woorden identificeert. Voor je het weet is de volledige tekst ontcijferd. Letterfrequentie-analyse is een krachtig hulpmiddel in de cryptografie, en op het internet zijn letterfrequentie-tabellen voor Nederlands en veel andere talen te vinden.
Veel geluk... en zorg dat je niet gebeten wordt door de kever!
Opmerking: in de originele editie werd één symbool "(" niet afgedrukt nabij het einde van het bericht, net na 9;48; hoewel Legrand net dat ontbrekende symbool beschrijft om te helpen bij het vinden van een woord. Aangezien het verhaal naar dat symbool refereert is het onwaarschijnlijk dat het met opzet werd weggelaten en is het waarschijnlijk verloren tijdens het drukken.
© Dirk Rijmenants 2004. Last changes: 26
Februari 2026
| Home |