Wikipediadiskussion:Kategorier/Arkiv 2009

Senaste kommentaren: för 14 år sedan av LittleGun i ämnet Relikkategori

Kategorier relaterade till ett land redigera

Wikipedia:Kategorier#Kategorier relaterade till ett land är ett råd som skiljer sig ganska mycket från hur kategorierna faktiskt ser ut. Man kan urskilja tre olika former bland de existerande kategorierna:

  • "X i land"
  • "Landska X" (vanligt när det gäller personer)
  • "Lands X" (vanligt när det gäller ämbeten som bara kan innehas av en eller ett fåtal personer samtidigt i ett land, t ex ministrar, eller när det gäller indelningar av olika slag, till exempel kommuner)

Undantag från fördelningen förekommer naturligtvis.

Frågan är: finns det någon anledning till att den här fördelningen har uppstått, det vill säga är den på något vis naturlig eller är det bara en artefakt som beror på kategoriträdets delars ålder? Bör den uppmuntras i stället för att motsägas av en ganska central vägledningssida? Var finns diskussionen där den allmänna formuleringen skapades? Var det innan kategorisortering tillkom, så att sorteringsordningen gavs större tyngd än den skulle ges idag? //Essin 2 februari 2009 kl. 22.46 (CET)Svara

Jag är allmänt skeptisk till "Landska X", bland annat av de anledningar som står i råden. Det finns så många icke-intuitiva adjektiviseringar av nationsnamn. Bäst är när man slipper böja nationsnamnet, d v s "X i land", "X från land" och liknande. --bOivİE  3 februari 2009 kl. 08.29 (CET)Svara

Inlägg nedan till och med 4 februari gjordes först på Bybrunnen, och flyttades sedan hit.

För namngivning av kategorier förekommer idag i-form: knappologi i Sverige, adjektivform: svensk knappologi och genitivform: Sveriges knappologi. Somliga invänder mot adjektivformen (svensk) att det blir otydligt om man menar landet, språket eller något mitt emellan. Ibland kan denna otydlighet rentav vara en fördel. För vårt mest näraliggande exempel har vi ju också valet mellan finsk och finländsk.
En nackdel med att försöka genomdriva "den bästa" lösningen (vilken den nu är) över hela linjen, är att det blir väldigt många kategorier att döpa om. Det är ett stort projekt, och vi kanske har viktigare saker för oss. Å andra sidan vore det onekligen praktiskt att ha en enhetlig namngivning. Kanske bör vi då också eftersträva att få den enhetlig med våra grannspråk?
En nackdel med i-formen är att man måste välja om kategorier för öriken ska heta "Sport i Island" eller "Sport på Island". Där är vi inte helt konsekventa. Hur blir det med Irland (9 i, 1 på, 6 genitiv), Jamaica (2 på, 2 adjektiv, 2 genitiv), Kuba (2 i, 4 på, 4 genitiv) och Australien (8 i, 2 adjektiv, 6 genitiv)?
Det är en fördel om alla underkategorier har likadana namn. Av de 221 underkategorierna till kultur efter land hade en fjärdedel adjektiv- eller genitivform och jag såg till att göra detta enhetligt. Det vill säga att jag ändrade från "Greklands kultur" till majoritetsformen "Kultur i Grekland", trots att jag själv föredrar adjektivformen. Men vi har massor av kategorier som heter franska författare och liknande (inte författare i Frankrike), och det fungerar bra. Interwiki-länken går ju ändå till French literature.
Men språkbruket bör gå före enhetligheten, så t.ex. behöver Kategori:Kultur i Haiti Kategori:Kultur i Kuba och Kategori:Kultur i Malta därför ändras till "Kultur på" snarast --Rosp 3 februari 2009 kl. 20.34 (CET)Svara
När det gäller kulturella regioner som arabisk/kurdisk/samisk litteratur blir det krystat om man tvingas uppfinna länder som "litteratur i Kurdistan" eller "litteratur i Sapmi", speciellt som mycket av den litteraturen är skriven i exil. En relaterad fråga är om kulturella yttringar (litteratur, författare) ska kategoriseras efter nationalitet (som en.wp gör) eller efter språk (som de.wp). Ett tag var tillväxten stor i litteratur efter språk, och någon ville döpa om polsk litteratur till polskspråkig litteratur", men den fanatismen tycks ha kommit av sig. Idag är det litteratur efter land som har flest underkategorier (30 mot 20). Engelska Wikipedia gör en klar skillnad mellan categories by nationality (som används för personer och kulturkategorier) och categories by country (som används annars). Då kan man använda adjektivformen för nationalitet (fransk, kurdisk) och behöver inte vara så tydlig med om man menar språket eller landstillhörigheten eller en etnisk tillhörighet. Det är en vaghet som har en styrka. --LA2 3 februari 2009 kl. 19.05 (CET)Svara
Rosp, Haiti räknas väl inte eftersom det inte är namnet på en ö, eller tänker jag fel? Njaelkies Lea (d) 3 februari 2009 kl. 20.35 (CET)Svara
Du har rätt, jag stryker exemplet Haiti, men det kan finnas andra östater --Rosp 3 februari 2009 kl. 20.40 (CET)Svara
Den märkliga i-formen är absolut inte den bästa lösningen. Den blir med en gång märkligt inkonsekvent: "Kultur i Japan" tvingas stå tillsammans med "Samisk kultur" bara därför att Japan samtidigt råkar vara en stat. Men staten Japan innebär inte att japansk kultur slutar existera. Tänk om vi hade artikeln "Makedonsk kultur" och sedan blir Makedonien självständigt. Då måste vi i princip göra en ändring som kommunicerar att makedonsk kultur inte längre finns, nu finns bara "Kultur i Makedonien"...
I någonting är vidare semantiskt skiljt från någontings karaktär eller det som tillhör någonting. Det mest absurda exemplet tycker jag är Monarki i Sverige. Artikeln avser alltså inte monarki i Sverige som allmänt fenomen. Artikeln gäller den specifika institutionen det svenska kungahuset. Det senare kan det definitionsmässigt bara kan finnas ett av. Begreppet "Monarki i Sverige" saknar däremot tillhörighet; om den saudiske kung Fahd med hov bosätter sig i Sverige en tid kunde man inkludera detta hov i "Monarki i Sverige", eftersom det de facto utgör en - av alla existerande - monarkier som befinner sig i Sverige!
Jag misstänker att i-sjukan bygger på en felöversättning. På engelska wikipedia började man skriva "Politics of Sweden" istället för "Swedish politics" och liknande. Något ljushuvud kan ha utsatt detta för Googles automatiska översättning, vilken tidigare översatte "Politics of Sweden" -> "Politik i Sverige". Men det är en felöversättning, som Google nu även har rättat (dock inte fullständigt). Ordet "of" markerar i sammanhanget tillhörighet (ägande) hos subjektet och motsvarar svenskans "av". Det svenska "i", som betecknar spatiala eller temporala relationer, motsvarar istället engelskans "in". På svenska blir däremot både adjektivformen och genitivformen rätt som översättning till "of".
Koios 4 februari 2009 kl. 05.15 (CET)Svara

Snälla Rosp, försök inte låtsas att det finns några snabba och självklara lösningar här. Huruvida det ska heta "i" eller "på" Island är en modefråga, som växlar både i tid och rum. Redan det faktum att du själv kan vackla rörande Haiti är ett tecken på att det är oerhört lätt att vackla och göra misstag. Det som kännetecknar prepositionsformen är kanske just detta, att den lätt leder till misstag. Och om prepositioner ska tillämpas, ska då personerna heta "politiker i Tchad" eller "politiker från Tchad"? (EU-parlamentariker kan vara från Sverige, och jobba för Sverige, men jobba i Bryssel/Strassbourg.) Krig kan beröra ett land utan att landets egna trupper kämpar, och utan att striden utkämpas på landets territorium. Engelska Wikipedia tillämpar namnformen "wars involving Sweden", men "involverande" blir klumpig svenska, så för det mesta används adjektivformen i stället (Svenska krig). Adjektivformen har sina fördelar (som att japansk matlagningskonst inte slutar vid landet Japans gränser), men ibland är det svårt att bilda adjektiv (montenegrinsk, monegaskisk, salvadoransk, tchadisk, Kinshasa-kongolesisk, ...).

Om jag ska formulera en rekommendation är det nog ändå

  • att vi tillämpar adjektivformen där engelska Wikipedia har adjektiv (och talar om "nationality", alltså för personer och kultur): fransk litteratur, japansk matlagning, tchadiska journalister, Kinshasa-kongolesiska pianister, peruanska tv-serier
  • prepositionerna i eller där engelska Wikipedia har detta, t.ex. sport i Grekland, orter i Angola
  • och genitiv-s där engelska Wikipedia har "of" (och talar om "country"): Norges ekonomi, Kongo-Kinshasas bergskedjor, Japans biltillverkare
  • samt att vi inte ändrar några namn om det inte krävs för att åstadkomma enhetlighet. Sålunda får Kultur i Turkiet heta som den gör, trots att första punkten rekommenderar adjektivform för kultur. --LA2 4 februari 2009 kl. 21.08 (CET)Svara
Engelska upplagans principer finns på en:Wikipedia:Naming conventions (categories)#Categories by country och en:Wikipedia:Naming conventions (categories)#Categories by nationality för en mer fullständig översikt. Jag kan tycka att prepositioner är bättre än genitiv för landformer (naturgeografiska objekt), deras existens är ju inte direkt kopplad till staten eller dess institutioner, men i övrigt är enwp:s fördelning inte helt orimlig, och ganska nära den spontant utvecklade praxis som finns på svwp. En invändning mot att använda "Landsk kultur" i stället för "Kultur i land" såg jag på WP:PK för ett tag sedan, nämligen att landsgränser inte alltid utgör kulturella gränser (jag tror att exemplet gällde ett land i Afrika). Jag själv har ingen särskild åsikt om vad som ska väga tyngst, men tycker ändå att det är en så pass viktig invändning att den förtjänar att tas upp även i denna diskussion. //Essin 7 februari 2009 kl. 18.18 (CET)Svara

Dolda kategorier redigera

Jag lade till ett avsnitt om dolda kategorier. Ett användningsområde av dolda kategorier kan vara kategoriseringarna vi gör i kvalitetsgranskningsarbetet och som alltså är mer än hjälp åt redigerarna snarare än åt läsarna. -Som vanligt är det fritt fram att anpassa texten efter verkligheten. -MagnusA 22 april 2009 kl. 08.32 (CEST)Svara

Dolda kategorier (från Bybrunnen) redigera

Hitflyttad från Wikipedia:Bybrunnen#Dolda kategorier. --MagnusA 11 maj 2009 kl. 18.37 (CEST)Svara

Ibland används "Dolda kategorier" genom att lägga in __HIDDENCAT__ eller motsvarande mall. Det verkar främst användas på en del kvalitetskategorier. Exempelvis Kategori:Artiklar föreslagna för infogning. Jag förstår inte vad som är fördelen. För mig verkar det mest som en nackdel. Risken är att många inte hittar dessa kaegorier. Kan någon upplysa mig? /rrohdin 4 maj 2009 kl. 06.39 (CEST)Svara

Går att få dem synliga som standard med hjälp av mina inställningar - diverse.
De syns även under förhandsgranskningen vid redigeringsläge. - Det räcker åtminstone för mig... -- Lavallen 4 maj 2009 kl. 07.49 (CEST)Svara
Jag har påpekat detta tidigare. Om vi vill att mallarna ska ge den typ av spontaninsatser av både nybörjare och vana, som vi räknar med, måste vi se till att kategorierna syns för alla. Inte heller vana användare har dem dessutom i huvudet eller vet om att man måste ändra en inställning för att se dem. Sist undrade jag varför någon raderat kategorin! /Grillo 4 maj 2009 kl. 11.37 (CEST)Svara
Det var en hel del som ligger där, Kategori:Dolda kategorier, förstår inte riktigt vad del skall vara bra för. Ghostrider4 maj 2009 kl. 11.45 (CEST)Svara
Inom mitt lilla specialområde har jag inte sett något spontant arbete av typen utökning (som respons på stubmall) eller mallbyte (som respons på Kat:Sida innehåller ersatt mall). Utan allt sådant har skett som ett resultat av systematiskt arbete av projektmedlemmar. Dock förekommer spontant arbete, men då av typen rättstavning, referensfix, wikilänkning eller typo. - Allt detta har skett utan kvalitets-mallar eller kvalitets-kategorier.
Med den erfarenheten vill jag se så lite av sådana mallar och kategorier som möjligt. Ersatta mallar är märkta i Mall-namnrymden. Det avskräcker förhoppningsvis från nyanvändning vilket, inom mitt närområde, är tillräckligt. Om någon artikel inte är i behov av utökning så är det mer unikt än motsatsen... -- Lavallen 4 maj 2009 kl. 13.04 (CEST)Svara
Dolda kategorier kom.. våren 2008. Det tillägget implementerades väl främst för att folk vilje skilja artikelnamnrymden från Wikipedia- och projekt-namnrymden. Och det tycker jag var en jättebra idé. Fördelarna är att du som inte skriver på Wikipedia inte behöver se alla de kategorier som är "interna" för Wikipedias skribenter. Och för att rensa bland kategorierna på sidorna så att bara de kategorier som har någon slags koppling till artikeln ska synas på sidan. Till exempel: kategorin Substubbar-samtliga är onödig i en substub om en indisk kast, en substub på Wikipedia har inget med en indisk kast att göra... xenus 4 maj 2009 kl. 23.09 (CEST)Svara
Argumentet att folk ska hitta artiklarna, och att det inte ska vara nån klar skiljelinje mellan läsare och skribenter då? Genom att dölja sådant som är "bara för skribenter" hjälper vi aktivt till att se till att folk inte lär sig att de själva kan bidra till Wikipedia. Utöver detta försvårar vi även för aktiva skribenter att hitta kategorierna. Exemplet ovan visar på varför. /Grillo 5 maj 2009 kl. 12.03 (CEST)Svara

Sorteringsordning i kategorier (gemener och versaler)? redigera

Diskussion hitflyttad från Wikipedia:Bybrunnen#Sorteringsordning i kategorier?. --MagnusA 18 maj 2009 kl. 08.33 (CEST)Svara

Om inte jag har blivit alldeles vindögd så är sorteringsordningen i våra kategorier skiftlägesberoende, med alla versaler före alla gemener, snarare än alfabetisk på det sätt jag fick lära mig av fröken Karin i första klass för ett och annat år sedan. D.v.s. versalt Ö sorteras i våra kategorier före gement a. Man lägger kanske inte märke till det så ofta, eftersom alla artiklar får en versal begynnelsebokstav, så grovsorteringen på bokstav blir trots detta rätt. Titta exempelvis på Kategori:Organisationsstubbar-Sverige. I sviten av artiklar om "Sveriges ..." kommer Sveriges Allmänna Handelsförening först, följs av Sveriges Domareförbund o.s.v. till Sveriges Videodistributörers Förening, och först därefter kommer Sveriges advokatsamfund följt av Sveriges entomologiska förening o.s.v. (Ingen av dessa artiklar har en standardsortering specificerad i sig.) Detta måste väl vara alldeles fullständigt felaktigt - sorteringen ska väl vara alfabetisk och inte efter ASCII-kod eller liknande? (Sedan att vissa av de artiklar jag tog som exempel kanske inte är versaliserade på rätt sätt är en annan sak.) Antar att någon behöver gå in och gräva i någon metawiki-kod för att fixa detta, men så här kan vi väl inte ha det? Tomas e 10 maj 2009 kl. 17.21 (CEST)Svara

Här kan man se den exakta ordningen och läsa mer. //Sertion disk.|Bidrag 10 maj 2009 kl. 17.37 (CEST)Svara
Ja, det är dåligt -- MediaWiki är ett stort hack. Tyvärr kommer det nog inte fixas inom den närmaste tiden. Här kan man ge förslag på saker som skall fixas. --Petter 10 maj 2009 kl. 17.55 (CEST)Svara
Riktig bokstavsordning ska dessutom strunta i mellanslag och skiljetecken, men det förstår inte MediaWiki. Svensson, Jan Olof ska sorteras efter Svensson, Jane eftersom O kommer efter E. För att få det riktigt rätt, borde man använda STANDARDSORTERING:Svenssonjanolof med enbart små bokstäver och utan mellanslag. --LA2 10 maj 2009 kl. 20.58 (CEST)Svara
Här vill jag lägga in en protest: jag vill inte se "Svensson, Jane" före "Svens, Ture". I många sammanhang bör man sortera ordvis, också om specialtecken och mellanslag lämnas obeaktade i övrigt. Men bör Anna-Kajsa jämställas med Annakajsa eller Anna Kajsa?
Vad gäller den verkliga sorteringen så måste den säkert göras med verktyg som finns tillgängliga för MediaWiki, att utveckla dem själv är alltför svårt. Se intron till Unicode collation algorithm för några komplikationer. Ett ordentligt programbibliotek för ändamålet borde klara alla varianter av sortering (förutsatt att reglerna kan bestämmas skillt enligt Wikipedia-språk), men det är möjligt att MediaWiki helt enkelt använder Unicode-teckenkoderna (à la ASCII, men så att man använder tecknets kod U+0C4 för Ä, inte UTF-8:s 0x84C3 0x000A)
--LPfi 12 maj 2009 kl. 15.49 (CEST)Svara
Det är möjligt att kommatecknet bör bevaras, men mellanslag och bindestreck tas bort, alltså STANDARDSORTERING:Svensson,Janolof. MediaWiki använder MySQL och MySQL har inbyggt stöd för riktig alfabetisk sortering, men teknikerna på Wikimedia Foundation menar att det inte uppfyller deras krav på hantering av alla miljarder möjliga tecken i Unicode. Strax efter att kategorier infördes, registerades felrapport 164 som klagar på att sorteringen är trasig, och snart fyller den rapporten fem år. Att hårdanvända STANDARDSORTERING är ingen snygg lösning på problemet, men det är en lösning som vi kan börja tillämpa här och nu, i stället för att vänta ytterligare ett år på felrapport 164. --LA2 12 maj 2009 kl. 16.09 (CEST)Svara
Jag kan bekräfta att det är sortering på Unicode-värden som gäller, eller rättare sagt på UTF-8-bytevärden (vilket ger exakt samma resultat). —CÆSAR 12 maj 2009 kl. 16.13 (CEST)Svara
Jag ser nu att en gammal telefonkatalog sorterar Jan Olof före Jane, så jag kanske har haft fel hela tiden. --LA2 12 maj 2009 kl. 16.17 (CEST)Svara
Nej, Du har rätt vad jag vet. Telefonkatalogen har ju ofta en litet "förenklad" variant där alla som heter Persson, Person, Pehrson, Perzon etc kommer tillsammans oavsett stavning, så det är kanske snarare något sådant som spökar? /FredrikT 12 maj 2009 kl. 16.37 (CEST)Svara
Nej. Telefonkatalogen använder ordvis sortering, vilket är helt rätt, och Jan kommer före Jane, liksom alla Svens kommer före Svenssönerna (och nej, detta betyder inte att man behåller kommatecknen och stryker bindestrecken.) De olika stavningsvarianterna är en skild problematik.
Vad gäller MediaWiki så är problemet, som jag förstår det efter att ha läst buggdiskussionen, att användande av MySQLs bättre sorteringsfunktioner betyder ändringar som aktiverar problem som MySQL har på relaterade områden. En mängd temporära lösningar har föreslagits, men en ändring som skulle lösa problemet i högre grad kräver omfattande testning och då löser man hellre en större del av problemet, vilket kräver ännu mer testning och ... och då väntar man tydligen hellre på att MySQL får ordentligt Unicode-stöd – och ännu några år för att ibruktagande av den nya MySQL-versionen är ett stort projekt. Ett sammandrag:
[Comment #73 From Brion Vibber 2008-02-13 00:24:16 UTC]
A couple quick notes:
  • Wikimedia currently runs MySQL 4.0, which has no native Unicode support.
  • MySQL 4.1 and 5.x have not-quite-done UTF-8 support, which is insufficient for storage in the primary tables. In most cases this would be sufficient for a sorting-specific summary table (such as the titlekey table used in the TitleKey extension I whipped up)
  • Collation affects not only sorting, but unique key restraints. This makes a MySQL-based collation unsuitable for the primary table fields, but again would be acceptable in a summary table used for sorting.
  • Some sites are multilingual, which may make an ideal sort order rather difficult to manage. :)
Ett mer omfattande sammandrag: http://www.mediawiki.org/wiki/Bugzilla/164
(Och tack CÆSAR för uppgiften Unicode/UTF-8.)
--LPfi 13 maj 2009 kl. 11.27 (CEST)Svara

Relikkategori redigera

Jag skulle vilja skapa en kategori för platser där det finns kristna reliker. Efter att ha kollat igenom dom artiklar som innehåller ordet relik tycker jag att det räcker med att kategorisera platser för första klassens reliker. Jag hade tänkt mig en för ”kristi pinoredskap” och en för ”delar av helgons kropp”. Det står att man ska vara försiktig med namngivning eftersom det är svårt att byta. Därför ber jag om tips och namnförslag. Ett krux är att platserna som innehåller kristna reliker inte alltid är kristna eller ens religiösa. Det finns en kategori:reliker, den innehåller bara två poster och är väl tänkt för att kategorisera artiklar om relikerna. Lista på reliker finns i användare:LittleGun/relikkategorisering. (Tack för hjälpen Grillo).--LittleGun 17 november 2009 kl. 21.01 (CET)Svara

Jag har skapat kategorierna Platser med del av helgons kropp och Platser med Kristi pinoredskap som underkategorier till Kategori:Reliker--LittleGun 3 december 2009 kl. 08.16 (CET)Svara