PROG0480 - The mechanical Internet
Telecommunications got an early start in France, where inventor Claude Chappe built a series of towers between Lille and Paris in 1792. Each tower was topped with a set of movable wooden arms that could be arranged to represent symbols. If each operator viewed his neighbor through a telescope, a symbol could pass through 15 stations covering 120 miles in only 9 minutes, giving France a valuable communications advantage over the surrounding powers during the sensitive period of the revolution.
This mechanical form of the Internet avant la lettre even makes an appearance in The Count of Monte-Cristo (Alexandre Dumas, 1844, original French title: Le Comte de Monte-Cristo):
They passed to the third story; it was the telegraph room. Monte Cristo looked in turn at the two iron handles by which the machine was worked. "It is very interesting," he said, "but it must be very tedious for a lifetime."
"Yes. At first my neck was cramped with looking at it, but at the end of a year I became used to it; and then we have our hours of recreation, and our holidays."
"Holidays?"
"Yes."
"When?"
"When we have a fog."
Expanded into a network of 534 stations, the system worked well, but it was expensive, with skilled operators manning towers set every 10-30 kilometers, and the messages were far from private. Finally the electrical telegraph killed it — Sweden abandoned the last commercial semaphore line in 1880. By then, depressed by illness and the conviction that others were stealing his ideas, Chappe had long since killed himself.
Assignment
Define a class Chappe that can be used to represent networks of telecommunication towers in Python. The objects of this class should at least support the following methods.
- An initialization method that takes the location of a text file as its argument. You may assume that the text files makes use of a Unicode character set with UTF-8 encoding (see below). The file describes a network of towers that may communicate with each other. Each line of the file contains the names of two neighboring towers (indicated by the name of the city where the towers are located), separated from each other by a tab.
- A method neighbours that takes the name of a tower (city) as its argument. The function must return the set containing the names of the neighboring towers (cities) in the network of the given tower (city).
- A method hubs that takes two names of towers (cities) as its arguments. The method must return an integer that indicates the minimal number of times a symbol must be transmitted from one tower to a neighboring tower in the network, to sent the message between the two given towers. If a message cannot be sent between the two given towers — because they belong to two disconnected subnetworks — the function must return the value -1.
If the name of a tower is passed to the method neighbours or hubs that does not belong to the network represented by the object, an AssertionError must be raised with the message city not in network.
Algorithm
You can use the following algorithm to find the shortest path between tower1 and tower2 in a network:
- Initialize $U$ = [tower1] as a list of towers whose neighbors still need to be processed, and $P$ = {tower1:0} as a dictionary that maps each processed tower onto the shortest distance from that tower to tower1.
- Remove the first tower from $U$ and process its neighbors in the network by appending each unprocessed neighbor to $U$ and adding to $P$ the shortest distance from that unprocessed neighbour to tower1.
- Keep repeating step 2 until a neighbors is reached that equals tower2 (figure out yourself how to obtain the distance to tower1) or until $U$ is empty (meaning that tower2 could not be reached from tower1).
Unicode files
Unicode is a computing industry standard for the consistent encoding, representation and handling of text expressed in most of the world's writing systems. The standard consists of a set of code charts for visual reference, an encoding method and set of standard character encodings, a set of reference data computer files, and a number of related items, such as character properties, rules for normalization, decomposition, collation, rendering, and bidirectional display order (for the correct display of text containing both right-to-left scripts, such as Arabic and Hebrew, and left-to-right scripts).
Unicode can be implemented by different character encodings. The most commonly used encodings are UTF-8, UTF-16 and the now-obsolete UCS-2. UTF-8 uses one byte for any ASCII character, all of which have the same code values in both UTF-8 and ASCII encoding, and up to four bytes for other characters. To open a Unicode file in Python, you can pass the encoding used to the optional parameter encoding of the built-in function open. For example, in order to read the information from the Unicode text file france.txt that makes use of UTF-8 encoding, the file can be opened in the following way:
>>> open('france.txt', 'r', encoding='utf-8')
Example
In the following interactive session we assume that the text file chappe.txt is in the current directory. This file contains a description of the network of towers that is graphically represented below. Note, for example, that the network has no connection between Avignon and Marseilles. As a result, no messages can be communicated between Lille and Marseille (they belong to two disconnected subnetworks).
>>> network = Chappe('chappe.txt') >>> network.neighbours('Lille') {'Paris', 'Bruxelles', 'Dunkerque', 'Boulogne'} >>> network. neighbours ('Paris') {'Tours', 'Dreux', 'Tonerre', 'Lille'} >>> network.neighbours('Brest') {'St Brieux'} >>> network.neighbours('Londres') Traceback (most recent call last): AssertionError: city not in network >>> network.hubs('Lille', 'Lille') 0 >>> network.hubs('Lille', 'Tours') 2 >>> network.hubs('Lille', 'Toulouse') 11 >>> network.hubs('Lille', 'Montpellier') 9 >>> network.hubs('Lille', 'Perpignan') 11 >>> network.hubs('Lille', 'Marseille') -1 >>> network.hubs('Lille', 'Londres') Traceback (most recent call last): AssertionError: city not in network
Telecommunicatie kreeg in Frankrijk een vroege start toen uitvinder Claude Chappe in 1792 een reeks torens bouwde tussen Rijsel en Parijs. Bovenaan elke toren werd een constructie van beweegbare houten armen aangebracht. Deze armen konden zo geschikt worden dat ze een bepaald symbool voorstelden. Als de operatoren door middel van een telescoop de opstelling van naburige torens in de gaten hielden, dan kon een symbool in 9 minuten over de 15 torens langs het 200 kilometer lange traject doorgestuurd worden. Tijdens de gevoelige periode van de revolutie gaf deze vorm van communicatie aan Frankrijk een enorm voordeel tegenover de omliggende machten.
Deze mechanische vorm van het Internet avant la lettre kreeg bijvoorbeeld een vermelding in De graaf van Monte-Cristo (Alexandre Dumas, 1844, originele Franse titel: Le Comte de Monte-Cristo):
Ze gingen naar de derde verdieping en bereikten zo de kamer van de telegraaf. Monte Cristo keek heen en weer naar de twee ijzeren handvatten waarmee de machine bediend werd. "Dit is uiterst interessant", zei hij, "maar het lijkt me een zeer tijdrovende bezigheid."
"Ja. In eerste instantie kreeg ik steeds een stijve nek door ernaar te kijken. Maar naar het einde van het jaar toe begon ik eraan gewend te raken. En toen kregen we eerst een paar uur ontspanning, en daarna zelfs een heuse vakantie."
"Vakantie?"
"Ja"
"Wanneer?"
"Toen de mist begon op te komen."
De Chappe semafoorlijn groeide op zijn hoogtepunt uit tot een netwerk van 534 torens. Het systeem werkte zeer goed, maar was ontzettend duur door de nood aan goed opgeleide operatoren die om de 10-30 kilometer een toren moesten bemannen. Bovendien kon de berichtgeving moeilijk geheim gehouden worden.
De opkomst van de elektrische telegraaf betekende uiteindelijk het doodvonnis van de Chappe-lijn. Zweden doekte de laatste commerciële semafoorlijn op in 1880. Tegen die tijd had Claude Chappe — depressief door ziekte en de overtuiging dat anderen zijn idee hadden gestolen — zichzelf al lang van kant gemaakt.
Opgave
Definieer een klasse Chappe waarmee een netwerk van telegraaftorens kan voorgesteld worden in Python. De objecten van deze klassen moeten minstens de volgende methoden hebben.
- Een initialisatiemethode waaraan de locatie van een tekstbestand moet doorgegeven worden. Je mag ervan uitgaan dat het tekstbestand de Unicode tekenset gebruikt met UTF-8 codering (zie hieronder). Dit bestand beschrijft een netwerk van torens die met elkaar kunnen communiceren. Elke regel van het bestand bevat de namen van twee naburige torens (aangegeven met de naam van de stad waar de torens zich bevinden), van elkaar gescheiden door een tab.
- Een methode buren waaraan de naam van een toren (stad) moet doorgegeven worden. De methode moet een verzameling teruggeven met de namen van alle naburige torens (steden) van de gegeven toren.
- Een methode tussenstations waaraan twee namen van torens (steden) moeten doorgegeven worden. De methode moet een natuurlijk getal teruggeven, dat aangeeft hoeveel keer een symbool minimaal moet doorgestuurd worden van een toren naar een naburige toren in het netwerk, om het bericht door te sturen tussen de twee gegeven torens. Indien het bericht niet kan doorgestuurd worden tussen de twee gegeven torens — omdat die behoren tot twee subnetwerken die niet met elkaar verbonden zijn — dan moet de functie de waarde -1 teruggeven.
Als aan de methoden buren of tussenstations de naam van een toren wordt doorgegeven die niet tot het netwerk behoort, dan moet de methode een AssertionError opwerpen met de boodschap stad behoort niet tot netwerk.
Algoritme
Om de kortste route te vinden tussen toren1 en toren2 in een netwerk, kan je als volgt te werk gaan:
- Initialiseer $U$ = [toren1] als een lijst met torens waarvan de buren nog moeten verwerkt worden, en $P$ = {toren1:0} als een dictionary die elke verwerkte toren afbeeldt op de kortste afstand van die toren tot toren1.
- Verwijder de eerste toren uit $U$ en verwerk zijn buren in het netwerk door elke onverwerkte buur achteraan toe te voegen aan $U$ en de kortste afstand van toren1 tot elke onverwerkte buur toe te voegen aan $P$.
- Blijf stap 2 herhalen totdat er een buur bereikt wordt die gelijk is aan toren2 (bedenk zelf hoe je dan aan de afstand komt tot toren1) of totdat $U$ leeg is (wat aangeeft dat toren2 niet kon bereikt worden vanuit toren1).
Unicode bestanden
Unicode is een internationale standaard voor de codering van binaire codes naar grafische tekens en symbolen, vergelijkbaar met de ASCII-standaard. De Unicode tekenset is echter veel uitgebreider dan de 256 symbolen van de ASCII-tekenset. Unicode ondersteunt een aantal mogelijke coderingen voor de tekenset, die aangeven hoe de symbolen binair voorgesteld worden. Als je in Python een Unicode bestand wilt openen, dan kan de gebruikte codering doorgegeven worden aan de parameter encoding van de ingebouwde functie open. Om bijvoorbeeld informatie te lezen uit het Unicode bestand chappe.txt dat gebruikt maakt van UTF-8 codering, kan het bestand als volgt geopend worden:
>>> open('chappe.txt', 'r', encoding='utf-8')
Voorbeeld
Bij onderstaande voorbeeldsessie gaan we ervan uit dat het bestand chappe.txt zich in de huidige directory bevindt. Dit bestand bevat een omschrijving van het netwerk van torens dat hieronder grafisch wordt weergegeven. Merk hierbij op dat er bijvoorbeeld geen verbinding is tussen Avignon en Marseille, waardoor er geen berichten kunnen verstuurd worden tussen Lille en Marseille (ze behoren tot twee verschillende subnetwerken).
>>> netwerk = Chappe('chappe.txt') >>> netwerk.buren('Lille') {'Paris', 'Bruxelles', 'Dunkerque', 'Boulogne'} >>> netwerk.buren('Paris') {'Tours', 'Dreux', 'Tonerre', 'Lille'} >>> netwerk.buren('Brest') {'St Brieux'} >>> netwerk.buren('Londres') Traceback (most recent call last): AssertionError: stad behoort niet tot netwerk >>> netwerk.tussenstations('Lille', 'Lille') 0 >>> netwerk.tussenstations('Lille', 'Tours') 2 >>> netwerk.tussenstations('Lille', 'Toulouse') 11 >>> netwerk.tussenstations('Lille', 'Montpellier') 9 >>> netwerk.tussenstations('Lille', 'Perpignan') 11 >>> netwerk.tussenstations('Lille', 'Marseille') -1 >>> netwerk.tussenstations('Lille', 'Londres') Traceback (most recent call last): AssertionError: stad behoort niet tot netwerk
Added by: | Peter Dawyndt |
Date: | 2014-06-07 |
Time limit: | 10s |
Source limit: | 50000B |
Memory limit: | 1536MB |
Cluster: | Cube (Intel G860) |
Languages: | PY_NBC |
Resource: | None |