Benutzer:Matthiasb/Geographische Lemmata
Brainstorming
[Bearbeiten | Quelltext bearbeiten]Die Argumente sind bekannt und wurden zur Genüge debattiert. Hier möchte ich versuchen, der Problematik auf den Grund zu gehen. Vorweg: eine Ortsunterscheidung wie auf EN durch Kommata einzuführen, habe ich nicht vor – dazu ist es zu spät, selbst wenn man das wollte. Ich habe folgende Liste offline vorbereitet, wobei ich hoffte das mich die Erinnerung nicht trügt und möglichst wenige der Beispiellinks ins rote führen ;-)
Verschiedene Unterscheidungsmethoden sind etwa:
- U.S. Post Office, bspw. U.S. Post Office Goshen, d.h. <Lemma + Ortsname>. Das war in dem Fall möglich, weil in den meisten Fällen das Gebäude so eine Inschrift hat. In dem Fall war/ist eine Klammer nur in Einzelfällen notwendig.
- Trinity Episcopal Church, die es in vielen Orten gibt, bspw. Trinity Episcopal Church (Charleston) wobei ich in Fällen von Ortsgleichheit die Unterscheidung per <Lemma (Ortsname, Staat)> vorgesehen habe. -> Klammerergänzung weicht vom Ortslemma ab.
- Unterscheidung durch strenges Klammerlemma, was wir in einigen Kategorien hatten, Beispielsweise Kategorie:Universität (Kansas City (Kansas)). Nach dieser Theorie würde es heißen Amherst (New York (Town)) oder Amherst (Town (New York)) oder Amherst (Town) wenn die Amhersts in den anderen Bundesstaaten nicht als Town sondern als City statuiert sind und nicht Amherst (Town, New York). NRHP-Objekte werden grundsätzlich per Klammerlemma kategorisiert – hier stehen nach strenger Lemmatisierung Kategorie:Registered Historic Place (Amherst (New York (Town))) vs. Kategorie:Registered Historic Place (Amherst (Town (New York)) vs. Kategorie:Registered Historic Place (Amherst (Town)) oder Kategorie:Registered Historic Place (Amherst (Town, New York)) neben Kategorie:Registered Historic Place (Amherst (Massachusetts)). -> Mehrfachklammerung ist vom Tisch.
Hinzu gibt Sonderfälle wie etwa New York City (Kategorie:New York City vs. New York (Bundesstaat) vs. Kategorie:New York, wo niemand ein New York, New York will ;-) obwohl das formalpostalisch eine korrekte Ortsangabe ist. Oder es gibt Fälle wie Sacramento, das irgendwer vor einigen Wochen von Sacramento (Kalifornien) dahin geschoben hat (BKL II).
- Nach strenger Regelung wäre etwa wie folgt zu kategorisieren:
- weil es in Portland (Maine) keine Universität gibt. Sinnvoll?
- Theoretisch denkbar wäre auf dieselbe Weise eine zufällige Namensgleichheit in einer Unterkategorie, obwohl in den zugehörigen Oberkategorien keine Namensgleichheit besteht. (etwa ähnlich zu Kategorie:Dominikaner (also Angehöriger des Dominikanerordens) vs. Kategorie:Person (Dominikanische Republik), was eigentlich auch Dominikaner heißen müßte, nach der üblichen Ableitung auf -er für die Bürger aus dem Karibikstaat.
- BKL-II-Konstrukte können zu Chaos führen, wenn bspw. Jacksonville (North Carolina) betreffende Einträge mal schnell in Kategorie:Jacksonville abgelegt werden, wenn der Link nicht rot ist.
- Die Zahl der US-Orts-Artikel, die ohne Klammerlemma existieren, bei denen aber möglicherweise doch Namensgleichheiten vorliegen, sollte nicht unterschätzt werden. Alleine bei der Ohio-Stub-Aktion wurden zwei oder drei solche Fälle festgestellt. (Derzeit haben in DE etwa 5000 US-Orte einen Artikel, es existieren jedoch mindestens 35.000 Gemeinden im weiteren Sinne des Wortes, die Zahl von Ortsteilen und/oder gemeindefreien Siedlungen ist der WP (auch in EN) nicht bekannt. Hinzu kommen mögliche Namensgleichheiten zu anderen geographischen Objekten, die auch in EN noch keinen Artikel haben. In den USA können Orte die gleichen Namen haben wie andere geographische Objekte, darunter Berge oder Flüsse, die meistens als Hausberg oder hier in den nächstgrößeren mündender Fluß namengebend für die Siedlung ist. Dabei ist es durchaus möglich, daß der Klassifizierungsbestandteil River oder Mount auch im Namen des Ortes verwendet wird. (Ein Extrembeispiel wäre Beaver Creek mit seinen Hunderten von Inkarnationen.
Exkurs: Usancen der Lemmafindung für geographische Objekte (am Beispiel Beaver Creek)
[Bearbeiten | Quelltext bearbeiten]Name des Features: Beaver Creek Featureklasse: Gewässer Bundesstaat: Alaska Borough: XY County nein Lemma mehrdeutig? ––> Beaver Creek | | ja v nein Featureklasse einheitlich? -––––––––––––––––- | | | ja | v | Unterscheidung nach politischer | Verwaltungseinheit | | | v | Lemma in <Bundesstaat> mehrdeutig? | | | | | nein | ja | v | | Beaver Creek (Alaska) v | | | Lemma in County mehrdeutig? | | | | | nein | ja | v | | Beaver Creek (XY County) | | v v Vorfluter ist mehrdeutig? | | | ja nein | v v Unterscheidung nach Beaver Creek (Yukon River) anderen Kriterien | | v Lage unterscheidet sich ---> Beaver Creek (Yukon River rechts) in Fließrichtung? ja | | nein v Lage in verschiedenen Verwaltungseinheiten ---> Beaver Creek (Yukon River, Kanada) | ja vs. Beaver Creek (Vereinigte Staaten, Kanada) | nein v zusätzliche Unterscheidung durch andere Merkmale, bspw.: Beaver Creek (K-town), falls es kein anderes K-town mit einem Beaver Creek gibt, sonst erfolgt Unterscheidung etwa: Beaver Creek (Yukon River bei K-town)
In dem obigen Beispiel wird das korrekte Lemma im konkreten Fall fett dargestellt. Beispiele für solche Problemfälle wären Bebra (Begriffsklärung), Smith Creek oder Little River. (in letzterem Little River (Snowy River, New South Wales) vs. Little River (Snowy River, Victoria).
Es hat sich in der letzten Zeit ein Konsens abgezeichnet, Flüsse auch dann nach dem Vorfluter zu unterscheiden, wenn zwar eine subnationale Unterscheidung notwendig ist, aber innerhalb der Verwaltungseinheit keine Mehrdeutigkeit vorliegt, insbesondere beim Vorliegen eines Grenzflusses oder falls der Fluss in eine andere Verwaltungseinheit fließt. Also Kettle River (Blueberry River) statt Kettle River (östliches Minnesota) (in dem Fall aber auch zur Unterscheidung vom Ort Kettle River (Minnesota), der ebenfalls im Osten Minnesotas liegt, nämlich an diesem Fluss.
Die Lemmafindung für einen Ort unterscheidet sich:
Name des Features: Beaver Creek Featureklasse: Ort Bundesstaat: Alaska Borough: XY County nein Lemma mehrdeutig? ––> Beaver Creek | | ja v nein Featureklasse einheitlich? ––––––––––––––––----- | | | ja | v v Unterscheidung nach politischer Lemmaprimat für Gemeinden Verwaltungseinheit | | | v nein | Lemma in <Bundesstaat> mehrdeutig? ----------->| | | | ja | | | v | Lemma in County mehrdeutig? | | | | | nein | ja | v | | Beaver Creek (XY County) | v | Beaver Creek (Alaska) | v Unterscheidung nach anderen Kriterien möglich etwa: [[Beaver Creek (<Gewässername>)]], falls es kein gleichnamiges Gewässer mit dem Vorfluter [[<Gewässername>]] gibt; [[Beaver Creek (bei <Ortsname>)]] (nicht [[Beaver Creek (<Ortsname>)]], weil das Beaver Creek zum Stadtteil von [[<Ortsname>]] macht; [[Beaver Creek (<XY Township>)]] in Bundesstaaten, in denen es Townships gibt. (Dieser Versuch ist etwa in Ohio vermutlich nicht erfolgreich, da es da Township-Namen mit gleich dutzendfacher Mehrdeutigkeit gibt.)
Lemmaprimat für Orte Gemeinden heißt, daß bei Mehrdeutigkeit über mehrere Objektklassen hinweg grundsätzlich der Ort die Gemeinde das Lemma mit der Unterscheidung nach politischer Verwaltungseinheit erhält. Beaver Creek (Colorado) ist also ein Ort, für alle Gewässer mit dem Namen Beaver Creek in Colorado muß das Lemma auf andere Weise bestimmt werden. Teilweise ist der Grundsatz des Lemmaprimates für Orte auch so umgesetzt, daß der Ortsname klammerfrei bleibt. Dies erfolgt meist in Fällen, in denen BKL-II-Gründe vorliegen oder Vorlage:Dieser Artikel angewendet werden kann. Beispiel: Opava vs. Opava (Fluss).
Exkurs: Mehrdeutigkeit des Namens auf verschiedenen Verwaltungsebenen
[Bearbeiten | Quelltext bearbeiten]Die Mehrdeutigkeit von Ortsnamen kann durch gleichzeitiges Bestehen von Town, City oder Village mit demselben Namen bestehen. Dieser Fall besteht im Bundesstaat New York - per augenscheinlicher Betrachtung entsprechender EN-Kategorien – mindestens in mehreren Dutzend Fällen. In dieser Weise ist Chester mehrdeutig, da es nicht nur in mehreren Bundesstaaten Orte dieses Namens gibt, sondern es ist in New York selbst mehrdeutig, da es zwei unterschiedlich definierte Orte bezeichnet:
- Amherst (Town, New York)
- Amherst (Village, New York)
- Eine Verkürzung auf Amherst (Town) und Amherst (City) geht m. E. nicht, da auch die Amhersts in anderen Bundesstaaten als Towns oder Citys statuiert sind, es liegt also kein Unterscheidungsmerkmal vor. Die Frage ist in diesem Zusammenhang, welche der folgenden Formen man will:
- Chester (Town, New York)
- Amherst (Village, New York)
- Chester (New York, Town)
- Chester (New York, Village)
- Chester (Town in New York)
- Chester (Village in New York)
- Chester (Town (New York)) -> unerwünschte Mehrfachklammerung
- Chester (Village (New York)) -> unerwünschte Mehrfachklammerung
- Chester (New York (Town)) -> unerwünschte Mehrfachklammerung
- Chester (New York (Village)) -> unerwünschte Mehrfachklammerung
- Logisch begründen kann man alle vorgenannten Formen, die fettmarkierte Form wird von mir seit geraumer Zeit umgesetzt und entspricht der entsprechenden Regelung in Wikipedia:Namenskonventionen. Die zusätzliche Town Chester im Warren County, auch in New York, ist in diesem Beispiel jedoch nicht berücksichtigt. Mehrfachklammern sind allerdings dann gewollt, wenn der Zusatz in der Klammer Bestandteil des amtlichen Namens ist, etwa Halle (Saale) -> Kategorie:Person (Halle (Saale)).
- Eine solche Mehrdeutigkeit besteht in vielen spanisch-sprechenden Staaten, denkbar wäre etwa die folgende Situation :
- San José (Departamento in Mexiko)
- San José (dort liegender Ort)
- San José (gleichnamiger Ort im District San José im Kolumbien
- San José (Distrikt in Kolumbien)
- San José (Distrikt in Peru)
- San José (Ort in diesem Distrikt)
- San José (ein anderer Ort in Peru)
- Diese Situation ist hier konstruiert, die Möglichkeit ist aber real (vgl. en:San José vs. San José) und es ist gerade bei einem solchen Namen nicht unwahrscheinlich, daß künftig noch weitere Orte mit diesem Namen auftauchen.
- Update (noch nicht genau analysiert): Es scheint im Spanischen zumindest in Lateinamerika eine amtliche Ortsnamenskonstruktion wie in Santiago de Chile nicht unüblich zu sein.
- Update (noch nicht genau analysiert): In Portugal heißen Municípios fast immer nach ihrem Hauptort, diese haben in der Regel gleichnamige Ortsteile. Hier besteht auch eine mögliche Konfliktsituation mit gleichnamigen Orten in Brasilien, wo Municípios ebenfalls gleichnamige Ortsteile haben können.
- Update (kopiert aus einer anderen, älteren Diskussion): Die Tabelle gibt einen Vergleich der Verwaltungseinheiten in einzelnen Staaten Südamerikas:
Ecuador Argentinien Peru Guyana Chile Bolivien Uruguay Kolumbien Paraguay Brasilien Venezuela Provincia Provincia Region Region Region Departamento Departamento Departamento Departamento Bundesstaat Bundesstaat Cantone Departamento Provincia Provincia Provincia Municipio Distrito Region Municipio Parroquia Departamento Municipio ISO 3166-2:EC ISO 3166-2:AR ISO 3166-2:PE (!) ISO 3166-2:GY ISO 3166-2:CL ISO 3166-2:BO ISO 3166-2:UY ISO 3166-2:CO ISO 3166-2:PY ISO 3166-2:BR ISO 3166-2:VE
- Man sieht, daß die Verwaltungseinheiten zwar mehr oder weniger identisch benannt sind, allerdings die Ebenen teilweise vertauscht sind; mal sind Departementos Teileinheiten der Provincias, mal ist es umgekehrt. Ergo müßte man das in der Vorlage hart kodieren (mit switch durch den Staat) und den Parameter neutral benennen, etwa Verwaltungsebene 1/2. Auf die 3. Ebene kann man mMn verzichten, da wir da auch meist keine Artikel dazu haben. Die einzige etwas anspruchsvollere Geschichte ist Zuweisung der ISO-Codes für die Geokoordinaten, da die Lösung der Direkteingabe (wie es die Lateinamerika-Box vorsieht) für Ottonormaluser zu umständlich ist. Wie anspruchsvoll, ergibt sich daraus, ob die Namen der ISO-relevanten Gebiete in den betroffenen Staaten mehrdeutig sind oder nicht.