Socknar i Wikidata

redigera

Riksarkivet laddade i veckan ned Wikidata för socknar har du en känsla för hur bra kvaliten är på detta data? - Salgo60 (diskussion) 19 december 2018 kl. 15.36 (CET)[svara]

Jag trodde infon var usel, men nu när jag kollat var den mycket bättre än jag anat, inte minst tack vara dig. De som bara fanns före 1650 saknas väl, och de svåra lär inte ha rätt data. Annars verkar sockenkod, koordinat, mm finnas. Det är väl främst kopplingen till församlingar som saknas.Yger (diskussion) 19 december 2018 kl. 16.24 (CET)[svara]
@Salgo60: Jag är också imponerad av hur "komplett" tabellen från nedanstående fråga är:
Det saknas sockenkod (P777) och SOFI namnregister (P5536) för de första 40–50 objekten listan (som är sorterad just efter sockenkod (P777) och SOFI namnregister (P5536)) men för övrigt är det inte mycket som saknas. Speciellt kul att det finns bild (P18) för så många socknar. Jag kan för lite om socknar för att veta hur många socknar det "ska finnas". Jag ser bara att sockenkod (P777) har värden från "0001" till "3078" med en del "luckor". Det vore trevligt om man någonstans kunde läsa om hur denna sockenkod (P777) är definierad, finns det någon signifikans i siffrorna eller är det bara ett löpnummer? Vem äger/ägde boken där dessa löpnummer antecknades och delades ut? Artikeln Sockenkod är bara en omdirigering till Socken och där står inget om koden. Finns det någon maskinläsbar "källa över alla socknar i Sverige" som man kan matcha WD mot?
Jag konstaterade att 20 socknar hade två geografiska koordinater (P625) där den ena var importerat från Wikimediaprojekt (P143) från cebuanospråkiga Wikipedia (Q837615). Antar att det var resultatet av sammanslagning av två sockenobjekt i WD som uppstått på grund av att Lsjbot skapat sockenartiklar i cebwp utgående från Geonames med dess "grovhuggna" koordinater. Dessa extra koordinater från cebwp har jag raderat för dessa 20 socknar, så nu finns det inget sockenobjekt som har mer än en geografiska koordinater (P625), däremot några som helt saknar geografiska koordinater (P625). Vassända socken (Q19979069), Naglums socken (Q19978210) och Fagerlids socken (Q10493564) har ju koordinater i sina svwp-artiklar så de borde kunna importeras till WD.
--Larske (diskussion) 19 december 2018 kl. 19.14 (CET)[svara]
Jag satte upp lite fler databasvillkor på sockenkod (P777) så det ramlar in lite fel i d:Wikidata:Database_reports/Constraint_violations/P777 nästa gång den körs. Om jag fattar rätt
    • Flik Fakta kommentar Ändrat till fyrställig sockenkod som platskod. Data upplänkade mot Wikidata. Ändrade sameAs-länkar. 2018-02-04 /Ulf Bodin
jag har inte gjort något särskilt strukturerat mer än kopplat ihop med SOFI namnregister (P5536) - Salgo60 (diskussion) 19 december 2018 kl. 19.25 (CET)[svara]
Socknar som upphörde före 1950 kan ofta saknas ATA-kod, och när jag gjorde 6-7 stickprov på de som saknade var de helt i sin ordning. Nu har RAÄ bestämt att ersätta ATAkoderna med en annan kod, och då behöver vi ändra i Wikipedia/Wikidata när vi har en konverteringstabell tillgänglig. Jag fixar koordinater för de tre som saknar.Yger (diskussion) 19 december 2018 kl. 19.27 (CET)[svara]
Jag "samkörde" sockenkod (P777) med pdf-dokumentet som Salgo60 länkade ovan (ATA:s förteckning över städer och socknar) med följande resultat.
  • Ett antal socknar har i ATA två koder, nnnnA och nnnnB, för delar i olika kommuner. Detta finns i något fall i svwp-artikelns infobox med inte i WD. Antagligen inget problem. Gäller koderna 0125, 0126, 0190, 0618, 3049 och 3066)
  • Några sockenkoder i ATA-listan saknas i WD och det bör kanske undersökas om det är några socknar som saknas i WD/WP eller om det är något som inte ska vara med:
    • FALSTERBO i Vellinge kommun, sockenkod 3006
    • LESSEBO i Lessebo kommun, sockenkod 3079
    • LINGBO i Ockelbo kommun, sockenkod 3083
    • NORRAHAMMAR i Jönköpings kommun, sockenkod 0641
    • SÄFFLE i Säffle kommun, sockenkod 2188
  • En sockenkod som finns i WD/WP saknas i ATA-listan:
--Larske (diskussion) 19 december 2018 kl. 20.57 (CET)[svara]
Säffle var en miss som jag fixat. 0861 är korrekt, det är fel i listan i kartsök på RAÄs karta, dyker parish upp om indikerar ATAkoden för det området. Lingsbo tror jag är fel av RAÄ, det är inte en riktig socken. Norrahammar och Lessebo som var köpingar tittar jag på i morgon. Falsterbo är mystiskt, troligtvis fel av RAÄ. Jag är annars mest imponerad hur rätt det verkar vara!Yger (diskussion) 19 december 2018 kl. 21.18 (CET)[svara]
Det visar sig finnas fel i RAÄdata för dessa ovan, så har bara infört för Säffle.Yger (diskussion) 20 december 2018 kl. 07.22 (CET)[svara]
Ovanstående samkörning avsåg endast existensen av en viss sockenkod (P777). Nu har också tittat på namnen på de socknar som har samma sockenkod (P777) i WD som i ATA-listan och då dyker det upp några avvikelser:
Sockenkod Sockennamn i ATA-listan WD-etikett (objekt) Kommentar
0031 HUSBY-SJUHUNDRA Husby-Sjuhundra socken (Q10527321) Troligen fel på WD-etiketten som inte uppdaterats efter en artikelflytt 2015
0092 KUNGSÄNGEN Stockholms-Näs socken (Q10680502) namnet ändrat 1967 enligt not 9 i ATA-listan
0390 YTTESELÖ Ytterselö socken (Q10723863) Borttappat "r" i ATA-listan?
1052 KLIPPAN Gråmanstorps socken (Q10509913) Gråmanstorp redovisas som KLIPPAN i ATA-listan, se not 89.
1236 GUDMUNDTORP Gudmuntorps socken (Q10510292) Borttappat "d" i WD/WP?
1240 GÄSSIE Gessie socken (Q10504549) "ä" eller "e"?
1337 SKANÖR M. FALSTERBO Skanör med Falsterbo stad (Q10669745) OK?
1582 MÖLNDAL Fässbergs socken (Q10500893) Fässberg redovisas som MÖLNDAL i ATA-listan, se not 121.
1652 EGGVENA Remmene socken (Q10650862) bör kollas, förväxlad någonstans?
1753 REMMENE Eggvena socken (Q10480265) bör kollas, förväxlad någonstans?
1783 SURTEBY-KATTUNGA Surteby socken (Q10684178) bör kollas, se not 126 i ATA-listan.
1857 TÖREBODA Björkängs socken (Q10430636) Björkäng redovisas som TÖREBODA i ATA-listan, se not 139.
2057 TIBRO Kyrkefalla socken (Q10551449) Kyrkefalla redovisas som TÖREBODA i ATA-listan, se not 141.
2242 LAXÅ Ramundeboda socken (Q10649548) Ramundebo redovisas som LAXÅ i ATA-listan, se not 163.
2347 FALUN Falu stad (Q10493893) kommunamn i ATA-listan?
2470 HÄRNÖSAND Härnö socken (Q10531730) kommunamn i ATA-listan?
2475 KRAMFORS Gudmundrå socken (Q10510283) Gudmundrå redovisas som KRAMFORS i ATA-listan, se not 198.
3052 NIKOLAI Sankt Nicolai socken (Q10661432) OK?
I några av dessa fall ser det ut som om sockennamnet har blivit samma som kommunnamnet i ATA-listan, men EGGVENA och REMMENE, båda i Herrljunga kommun, bör undersökas då de verkar förväxlade någonstans.
--Larske (diskussion) 19 december 2018 kl. 22.36 (CET)[svara]
Eggevene Remmense fixat, resten är otydliga, mycket trassel med städer/köpingar. Behöver gås igenom när de nya ATA koderna finns framme.Yger (diskussion) 20 december 2018 kl. 07.41 (CET)[svara]

@Salgo60: Jag såg på Kulturnav att texterna från "mina" sockenartiklar dyker upp. Jag har noll koll på vad Kulturnav är för något och har också varit helt okunnig i att våra artiklar och WD objekt används av andra. Har du kunskap om detta, och kan berätta om det? Larskes analys visar ju sedan att kvaliteten är närmast mycket god på dessa WD objekt. Om det är så dessa uppgifter används av andra så kommer ju frågan om vi borde starta en socken WD-fieringsprojekt under 2019? Fornsök kommer under 2019 sluta fungera (och jag inga illusioner att efterträdaren kan ge oss vad den gett oss) och det behövs också en insats för att reda ut de "nya ATAkoderna" som väl också introduceras under nästa år. Om sedan detta projekt enbart skal städa i sockenartiklarna eller också inkludera landskommuner och distrikt och relationerna mellan dessa inklusive församlingarna ser man väl om man börjar gräva i detta.Yger (diskussion) 20 december 2018 kl. 10.19 (CET)[svara]

Vad man gör "tror jag" är med en rad kod tar och hämtar ut några rader text se Extracting Wiki summary länk där jag testar exempel Adelövs församling som skickas tillbaka i en JSON fil som du sedan enkelt lägger in i sidan, jag tror det är det Arkiv DIgital gör nu och det jag tycker Riksarkivet SVAR skall göra se T200181. Min vision är också att precis som vi i Wikipedia kan ha musen över och få en popup, så skulle man kunna göra det utanför WIkipedia och se Wikipedia text i en popup om socknar/församlingar som nämns. Plus även att vi jämför dataseten i Wikidata/Kulturnav TORA... vi borde även lägga på KulturNav-ID (P1248) på våra socknar etc.... hur kvaliten är är jag fel person att uttala mig om....
Kulturnav vad det är är jag lite otrygg med länk men det sitter ihop med program från museer etc. och dom har trevliga dataset sm jag lyft in i Wikidata ex. Tekniska museets uppfinnare Uppfinnare i Sverige (KulturNav) (Q59567131) nu försöker jag få Personer i Nedre Norrland (Hälsinglands Museum) (Q59827313). Jag har haft lite kontakt med Ulf Bodin @ulfbodin på twitter - Salgo60 (diskussion) 20 december 2018 kl. 11.35 (CET)[svara]

Jämföra dataset och synka

redigera

Japp vi borde WDfiera det hela men även hitta ett bra sätt att få synkning mellan Riksarkivet <-> RAÄ <-> Kultrnav <-> ?? på datat. Om jag fattar rätt så håller Abbe98 på och tänker på detta med att synkronisera bild metadata dvs. laddas en bild upp på WIkicommons och får metadata hur lyfter institutionerna "hem" detta se meta:Wikimedia_Commons_Data_Roundtripping... Jag tror att steg 1 är att man hittar gemensamma begrepp och där har Kulturnav gjort en del bl.a. ett dataset ämnesord som kanske bör synkas etc... tekniken finns där men det krävs struktur ch jag hade hoppats Digisam skulle dra i det lasset. Nu skall dom ha ett möte i januari och jag fick inte komma med... dom kan kanske själva ;-).

Rekommenderar att kolla filmerna från LIBRIS användardag dom vill ju bli medlem i detta men det går långsamt kanske för långsamt - Salgo60 (diskussion) 20 december 2018 kl. 11.35 (CET)[svara]

Jag ställde en frågan fråga på LIBRIS användardagen om vi (Wikidata) skall jobba ihop eller fortsätta skicka data video vid 8 min och svaret är vision än så länge men det kan bli lovande, dvs. dom skall lyfta in våra begrepp med socknar/församlingar och katalogisera böcker på dessa begrepp - Salgo60 (diskussion) 20 december 2018 kl. 11.43 (CET)[svara]

Feedback Riksarkivet

redigera

Jag läser knapp email men fick se att vi fått feedback from Riksarkivet. Jag tror jag för länge sedan körde ett verktyg harvest som lyfte ned värdena från WIkipedia artikelns mallar som om kvaliten är god så var den god i mallarna....

Hej Magnus,

Nu har jag kopplat RA's socknar med LM (nya ata-koder) och Wikidata, och sprang på några möjliga konstigheter i wiki, urval efter följande fråga. Jag kan 
berätta/visa dig vid tillfälle hur vi gjort, men principen är varje TORA-punkt (byar etc) har en modern kedja (socken, kommun, län) och en tidigmodern 
kedja (socken, härad, landskap).   

SPARQL Query

  1. flera städer dyker upp flera gånger
  2. följande församling dök upp: Q10723853, Ytterlännäs församling   Fixat Magnus
  3. dessa städer ger inte frågan träff på (dessa räknas som stadsregisterområden av LM och har motsv ata-koder):
  1. andra enheter som saknas

- Salgo60 (diskussion) 20 december 2018 kl. 10.51 (CET)[svara]

tror du att du kan ordna ett möte med honom så vi kan gå igenom och förstå?Yger (diskussion) 20 december 2018 kl. 11.02 (CET)[svara]
det blir i januari... jag har för länge sedan insett min brist på ämnesinkompetens men kan gärna vara den som flyttar data... en fundering jag har är att han inte fick med historisk kommun i Sverige (Q6621272) i sin SPARQL fråga... dvs. vi borde förstå varandras begrepp...- Salgo60 (diskussion) 20 december 2018 kl. 12.11 (CET)[svara]

WD-fieringsprojekt

redigera

Jag har nu skapat Wikipedia:Projekt svenska socknar och börjar med en förstudie, där väl behövliga möten in~te kan bli av förrän efter trettondagsn. Jag börjar med att fråga efter konktaer på facebook.Yger (diskussion) 20 december 2018 kl. 15.08 (CET)[svara]