Μετάβαση στο περιεχόμενο

GeoNames

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Η παγκόσμια πυκνότητα των γεωγραφικών αντικειμένων της βάσεως GeoNames όπως ήταν το 2006.

H GeoNamesGeoNames.org) είναι μια γεωγραφική βάση δεδομένων την οποία μπορεί να επιμεληθεί ο κάθε χρήστης και είναι διαθέσιμη και προσβάσιμη από διάφορες υπηρεσίες web, υπό μια άδεια της Creative Commons. Ως ιστότοπος ιδρύθηκε στα τέλη[1] του 2005.

Το σύνολο δεδομένων της GeoNames δεν πρέπει να συγχέεται από τον παρόμοιας ονομασίας [2] GEOnet Names Server του αμερικανικού δημοσίου, ωστόσο η GeoNames αντλεί δεδομένα από αυτόν.

Η βάση και οι υπηρεσίες web

[Επεξεργασία | επεξεργασία κώδικα]

Η βάση δεδομένων GeoNames περιέχει σήμερα 25 εκατομμύρια τοπωνύμια, που αν ληφθούν υπόψη οι συνωνυμίες, αντιστοιχούν σε περισσότερα από 11,8 εκατομμύρια διαφορετικές γεωγραφικές οντότητες (δηλαδή πόλεις, ποτάμια, βουνά, νησιά, κλπ.).[3] Το σύνολο αυτών των οντοτήτων κατηγοριοποιούνται σε μία από εννέα τάξεις και περαιτέρω κάτω από έναν από 645 κωδικούς χαρακτηριστικού. Πέρα από την ονομασία του τοπωνυμίου σε διάφορες γλώσσες, τα αποθηκευμένα δεδομένα περιλαμβάνουν τις γεωγραφικές συντεταγμένες, το υψόμετρο πάνω από την επιφάνεια της θάλασσας, τον πληθυσμό, τη διοικητική υποδιαίρεση χώρας στην οποία ανήκει το κάθε τοπωνύμιο και ταχυδρομικούς κώδικες. Το σύνολο των γεωγραφικών συντεταγμένων που δίνονται βασίζονται στο Παγκόσμιο Γεωδαιτικό Σύστημα 1984 (WGS84).

Τα δεδομένα της GeoNames είναι προσβάσιμα δωρεάν μέσω διάφορων υπηρεσιών Web και μιας ημερήσιας εξαγωγής της βάσεως δεδομένων.[4]

Ο πυρήνας της βάσεως δεδομένων GeoNames προέρχεται από επίσημες δημόσιες πηγές, των οποίων η ποιότητα ποικίλλει. Μέσα από μια διεπαφή wiki οι χρήστες μπορούν να επιμεληθούν και να συντάξουν ή να εμπλουτίσουν τη βάση, διορθώνοντας ονομασίες, ενημερώνοντας τις τοποθεσίες, προσθέτοντας νέες οντότητες και επισκοπώντας τις υπάρχουσες.[5]

Σημασιολογική ολοκλήρωση στον παγκόσμο ιστό

[Επεξεργασία | επεξεργασία κώδικα]

Η κάθε γεωγραφική οντότητα στην GeoNames αντιπροσωπεύεται από έναν πόρο στον παγκοσμιο ιστό, που ταυτοποιείται από έναν σταθερό URI. Αυτός ο URI παρέχει πρόσβαση με content negotiation, είτε στη σελίδα HTML του wiki, είτε σε περιγραφή RDF της οντότητας, με χρήση στοιχείων της οντολογίας της GeoNames.[6] Αυτή η οντολογία περιγράφει τα χαρακτηριστικά των γεωγραφικών οντοτήτων της GeoNames με χρήση OWL, των τάξεων και των κωδικών που περιγράφονται SKOS γλώσσα. Μέσω URL που παραπέμπουν σε λήμματα της Wikipedia συνδεδεμένα με περιγραφές RDF, τα δεδομένα της GeoNames είναι συνδεδεμένα με δεδομένα της DBpedia και άλλα RDF Linked Data.

Ακρίβεια και βελτιώσεις

[Επεξεργασία | επεξεργασία κώδικα]

Καθώς συμβαίνει και σε άλλα πληθοποριστικά εγχειρήματα, η διεπαφή συντάξεως/επιμελείας της GeoNames επιτρέπει στον καθένα να εγγραφεί και να τροποποιήσει τα δεδομένα της βάσεως δεδομένων και επομένως είναι δυνατό να εισαχθούν ψευδείςe πληροφορίες και να παραμείνουν έτσι χωρίς να ενοπισθεί η ανακρίβειά τους ώστε να διορθωθούν, ιδίως αν αφορούν τόπους όπου δεν υπάρχουν συχνές αναζητήσεις. Ο Dirk Ahlers (2013) μελέτησε αυτές τις ανακρίβειες και τις ταξινομεί σε: απώλεια ακριβείας από στρογγυλεύσεις στις γεωγραφικές συντεταγμένες (π.χ. εξαιτίας περικοπής δεκαδικών ψηφίων ή μικρής διακριτικής ικανότητας γεωκωδικοποίηση σε κάποιες περιπτώσεις), λανθασμένους κωδικούς οντοτήτων, σχεδόν ταυτόσημους τόπους και την τοποθέτηση τόπων εκτός των διακηρυγμένων κρατών τους. Η χειρωνακτική διόρθωση αυτών των ανακριβειών είναι κουραστική και ευεπίφορη στη δημιουργία νέων λαθών (εξαιτίας του μεγάλου μεγέθους της βάσεως δεδομένων), ενώ μπορεί να απαιτεί και τη συνδρομή ειδικών.

Στη σχετική βιβλιογραφία υπάρχουν πολύ λίγες εργασίες με θέμα την αυτοματοποιημένη διόρθωση τέτοιων ανακριβειών. Οι Singh & Rafiei (2018) μελετούν το πρόβλημα του αυτόματου εντοπισμού του εύρους των τοποθεσιών σε μια γεωγραφική βάση δεδομένων και των εφαρμογών της για τον εντοπισμό αντιφατικών δεδομένων και τη βελτίωση της ποιότητας της βάσεως δεδομένων. Ο υπολογισμός των πληροφοριών ορίων μπορεί να βοηθήσει στον εντοπισμό αντιφάσεων, όπως στα σχεδόν ταυτόσημα μέρη και την τοποθέτηση τόπων όπως πόλεις υπό λάθος ανώτερες κατηγορίες, όπως επαρχίες ή χώρες. Οι Singh και Rafiei αποδεικνύουν ότι οι πληροφορίες ορίων που προέρχονται από την εργασία τους μπορούν να μετακινήσουν περισσότερο από το 20% των τοποθεσιών στην GeoNames σε καλύτερες θέσεις στη χωρική ιεραρχία και ότι η ακρίβεια αυτών των κινήσεων είναι άνω του 90%.


  1. «Marc Wick: Geek of the Week». Simple Talk. 6 Μαΐου 2009. Ανακτήθηκε στις 1 Ιουλίου 2020. 
  2. «Datasources used by GeoNames in the GeoNames Gazetteer». Ανακτήθηκε στις 20 Αυγούστου 2020. 
  3. «GeoNames web site». Geonames.org. Ανακτήθηκε στις 8 Σεπτεμβρίου 2018. 
  4. «GeoNames API». ProgrammableWeb. Αρχειοθετήθηκε από το πρωτότυπο στις 26 Νοεμβρίου 2018. Ανακτήθηκε στις 8 Σεπτεμβρίου 2018. 
  5. «How can I help ?». GeoNames Forum. GeoNames. Ανακτήθηκε στις 11 Αυγούστου 2018. 
  6. «GeoNames ontology». Geonames.org. Ανακτήθηκε στις 15 Δεκεμβρίου 2013. 

Εξωτερικοί σύνδεσμοι

[Επεξεργασία | επεξεργασία κώδικα]