Städa Sverige på Ceb redigera

Wikimania 2023 - 309 - August 19 - Duplicating Everywhere All at Once, samt presentation.

Som alltid full av beundran för det städarbete som sker här, och hur det höjer Wikipedia att få bort dubbletter och andra konstigheter. Från sommarens Wikimania hittade jag Användare:Canleys presentation som tittar på problemet på Cebuanospråkiga Wikipedia med artiklar om X land (i exemplet Nya Zeeland) och alla felaktigheter som finns där, och hur han hittat ett sätt att städa och slå ihop samt rapportera till GeoNames för att rätta till där också. Själv vet jag knappt ens var jag skulle börja för motsvarande städinsats, men tänker att någon här kanske är intresserad av att se om det behövs och går att städa upp Sverige på Ceb.Wikipedia. Förutom inspelningen och presentationen finns resurserna på GitHub att ta del av. /Axel Pettersson (WMSE) (diskussion) 15 december 2023 kl. 14.52 (CET)Svara

Tack för länken. Jämfört med Nya Zeeland ser det inte så illa ut för Sverige, åtminstone inte när det gäller antal Wikidataobjekt för respektive land (P17) som har mer än ett värde på egenskapen Geonames-ID (P1566), men det kan ju bero på att vi ännu inte hittat alla dubblettobjekt i Sverige.
land (P17) Antal objekt med något
värde på Geonames-ID (P1566)
Antal objekt med mer än ett
värde på Geonames-ID (P1566)
Andel
(procent)
Nya Zeeland (Q664) 36 175 1 889 5,22
Sverige (Q34) 25 012 40 0,16
Inget av de 40 Sverige-objekten med mer än ett Geonames-ID (P1566) har mer än två värden. Av de 1 889 Nya Zeeland-objekten med mer än ett Geonames-ID (P1566) är det 327 som har tre eller fler värden. Värst är Whanganui River som har 19 värden, detta efter sammanslagningar av lika många objekt i Wikidata, så det är kanske något som ligger i planen att rensa bort, möjligen tillsammans med GeoNames.
--Larske (diskussion) 15 december 2023 kl. 16.20 (CET)Svara
Vad jag minns så hade alla berg i Nya Zeeland dubbelrapporterats in i Geonames (en gång som berg och en gång som kulle) vilket gav en stor mängd dubbletter. Detta framgick av de förgreningssidor som skapade här i svwp. Därför tror jag (utan att ha kollat) att det inte är lika dåligt för Sverige. Kitayama (diskussion) 15 december 2023 kl. 16.36 (CET)Svara

Orter och underdistrikt i Irak redigera

Jag vill flagga för att det råder stor förvirring gällande Iraks underdistrikt (nahiyat). De flesta Lsjbot-skapade artiklarna saknar iw till annat än cebWP, och i några fall där det finns artiklar om underdistrikt på t ex enWP har de iw-länkats till artiklar om orter på svWP. Jag har därför några frågor:

  1. Kan någon som kan arabiska kolla hur bra arWP är på att skilja på orter och underdistrikt? ar:تصنيف:نواحي_العراق verkar vara rätt ställe att börja.
  2. Hur stor är skillnaden mellan orter och underdistrikt i allmänhet? Det verkar som att underdistrikt ofta omfattar många byar, men finns det statistik och separat administration? Förekommer det att underdistrikt i städer bara omfattar själva staden?
  3. Hur bör vi hantera detta på svWP? Bör vi slå ihop artiklar eller göra striktare åtskillnad? Om det senare, bör vi låta artikelnamnet, nuvarande beskrivning på svWP, nuvarande beskrivning på WD eller något annat avgöra om en artikel räknas som ort eller underdistrikt?

Här är en tabell över artiklar som antingen i namngivningen, text och kategori på svWP (oftast pga Geonames men inte alltid) eller kategoriseringen på enWP är märkta som underdistrikt.

//Essin (diskussion) 22 januari 2024 kl. 13.19 (CET)Svara

Channels igen redigera

Jag upptäckte att efter Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2017-03 - 2017-08#Sjökanaler och havskanaler och Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2023#Transportrelaterade platser har det aldrig blivit av att städa upp Special:Länkar hit/Strömfåra. Jag gjorde en kort räd och de kvarvarande är huvudsakligen i Antarktis, Australien och Kanada. Det jobbiga är att de flesta kan beskrivas som sund på svenska, men inte riktigt alla. Många är redan omkategoriserade så jag tror att det skulle vara genomförbart att ta denna Petscan och göra följande ersättningar:

  • = Strömfåra > = Sund
  • <!--H.CHN-->en [[strömfåra]] > ett [[sund]]
  • Den ligger > Det ligger

samt i förekommande fall byta ut Kategori:Sund i Antarktis och Kategori:Vattendrag i Östantarktis mot Kategori:Sund i Östantarktis.

En del inlänkar skulle också försvinna om vi i största allmänhet tog bort listorna över landformer som inleds med "I övrigt finns följande" och är helt meningslösa eftersom landformer är en närmast obegränsad mängd och de allra flesta har blivit rödlänkar. Skulle det kunna botköras? Hur identifierar en regexp slutet på dessa listor? //Essin (diskussion) 8 februari 2024 kl. 15.23 (CET)Svara

Jag testade följande regexp med WP:AWB för att ta bort den inledande raden "I övrigt finns följande ...:" samt alla följande rader som börjar med en * (minst en sådan rad måste finnas) eller är blankrader på (en kopia i Sandlådan av) artikeln Rucava kommun.
  • Find: I övrigt finns följande .*?\: *\n?(\n+\*[^\n]+\n*)+\n+
  • Replace:
Resultatet blev det önskade, se denna diff.
Jag hoppas att följande lista inte innehåller några artiklar som bara "råkar" innehålla en sådan text med en påföljande punktlista som har något helt annat ursprung än Lsjbot.
  • Länk till fråga som ger en lista på (just nu 4 732) artiklar som innehåller texten "I övrigt finns följande ...:".
-- Larske (diskussion) 8 februari 2024 kl. 16.30 (CET)Svara
Tack! Det kanske är säkrast att hoppa över artiklar som saknar {{robotskapad}}. Tyvärr har robottexter infogats i ganska många människoskapade artiklar... //Essin (diskussion) 8 februari 2024 kl. 16.55 (CET)Svara
Dessvärre har mallen robotskapad ofta tagits bort så fort någon har gjort någon manuell justering i artikeln. Jag hade föredragit en lösning med att komplettera mallanropen med några optionella parameter som till exempel "städad_av=<användarnamn>", "städad_datum=<datum>" och "städad_vad=<vad som gjorts>", eller något liknande som gör att man inte tappade bort ursprunget.
De flesta, cirka 97 procent, av träffarna i sökningen ovan har mallen {{robotskapad}}
  • Länk till fråga som ger en lista på (just nu 4 598) artiklar som innehåller texten "I övrigt finns följande ...:" och som använder mallen {{robotskapad}}
  • Länk till fråga som ger en lista på (just nu 134) artiklar som innehåller texten "I övrigt finns följande ...:" som inte använder mallen {{robotskapad}}
-- Larske (diskussion) 8 februari 2024 kl. 17.54 (CET)Svara
Ja, det är inte bara infogningar som är ett problem, utan också ofullständig städning. Det diskuterades här förra året, som du kanske såg. Jag tycker liksom då att alla dessa listor bör tas bort, men 134 artiklar är kanske överkomligt att göra med AWB utan botflagga. De övriga kan alltså hanteras med bot, vilket är glädjande, men för att vara säker på om de bör hanteras med bot skulle jag vilja invänta åsikter från fler personer. Jag vill också höra bu eller bä om det första robotjobbet, i sundskategorierna. //Essin (diskussion) 9 februari 2024 kl. 12.17 (CET)Svara

Botgenererade platser i Mexiko redigera

Det finns ju sedan tidigare konsensus om att lsjbot-genererade geografiartiklar med iw-länk endast till cebwiki ska kunna raderas. I de fall då botskapade versioner på andra språk har dykt upp som "spin-off" på cebwiki, t ex på arzwiki, så har praxis varit att artikeln på svwiki har raderats. Nu har användare MartinogkWP:BOÅ begärt att: " Radera alla Lsjbot genererade sidor för Mexiko som endast har interwikilänkar till andra botskapade sidor på cebuano (ceb/Lsjbot), tatar (tt/Nurbot), tjetjenska (ce/CheWikibot), serbiska (sr/Dcirovicbot) och/eller serbokroatiska (sh/Dcirovicbot). Exempelvis alla artiklar på förgreningssidorna El Gigante och El Pochote, med det finns tusentals fler."

Likaså anmälde användaren fyra artiklar till snabbradering. Artiklarna snabbraderades enligt min mening i enlighet med konsensus och praxis, men Estrellato satte {{Låtvara}} på dem och Yger återställde därför raderingarna. Vi behöver därför ha en diskussion om rådande konsensus också gäller denna typ av artiklar (botskapade på många språk) eller inte. Min åsikt är klar: Radera. Kitayama (diskussion) 4 april 2024 kl. 08.03 (CEST)Svara

Jag gillar inte automatiken i detta, utan ser helst detta tas plats för plats. (och det var inte jag som återställde, jag tog enbart bort snabbraderingsmallen) Yger (diskussion) 4 april 2024 kl. 08.07 (CEST)Svara
Plats för plats är lite svårt - det är frågan om tusentals artiklar av mycket tveksam kvalitet. Jag ser nu att det var Estrellato som återställde. Förlåt! Kitayama (diskussion) 4 april 2024 kl. 08.15 (CEST)Svara
Det rör sig förmodligen om 26856 artiklar (Robotskapade Mexikoartiklar som saknar iw till engelska, spanska, tyska eller franska). Det kan vara något färre om det finns manuell artikel på något annat språk. Kitayama (diskussion) 4 april 2024 kl. 08.24 (CEST)Svara
Då bör det enligt mig skapas ett städprojekt för just detta som leds av en admin, som du gjorde tidigare. Då kan vi sedan kollektivt lite på denna admin som ombesörjer borttag. Att gå via raderamall lämnar borttaget till adminkollektivet, och vi kan inte kräva alla admin är insatta i en detaljfråga som detta Yger (diskussion) 4 april 2024 kl. 08.30 (CEST)Svara
Instämmer helt med att detta inte ska tas via snabbradera och inte heller via WP:BOÅ. Därav att jag skrev en kommentar på BOÅ och hänvisade till denna diskussion. En admin får gärna sätta "Ej utfört" på BOÅ (som icke-admin ska jag inte markera BOÅ-beslut).Kitayama (diskussion) 4 april 2024 kl. 08.33 (CEST)Svara
Om jag har arbetat förgäves med att avbotta över 3500 mexikanska orter hittills då lämnar jag projektet. Så enkelt är det. Jag har snart gjort klart hela delstaten Mexiko, vilket hade klart flest orter av alla delstater. Jag har tidigare föreslagit att orter mindre än 1000 invånare kan omdirigeras till kommunen osv men dessa förslag har mötts av ogillande. Om jag nu ska ha spenderat uppskattningsvis 200 timmar på detta projekt bara för att allt som inte har koppling till annan iw än de botskapade ska raderas, då lämnar jag Wikipedia. Så enkelt är det för mig, faktiskt. Estrellato (diskussion) 4 april 2024 kl. 08.55 (CEST)Svara
Se Kategori:Orter i delstaten Mexiko för referens för vad jag gjort hittills, Kategori:Mexikos öar och så vidare. Jag har tidigare varit för att omdirigera mindre orter till kommunen och låta samt nyskapa artiklar för orter med över 1 000 invånare, och jag kan tänka mig den kompromissen (trots att jag då lagt hundratals timmar på artiklar som nu anses ska bort). Men om allt botgenererat som "saknar iw till engelska, spanska, tyska eller franska) ska bort. Då säger jag adjö. Estrellato (diskussion) 4 april 2024 kl. 09.01 (CEST)Svara
Ingen har föreslagit radering av artiklar som är åtgärdade.--ArildV (diskussion) 4 april 2024 kl. 09.04 (CEST)Svara
Jag har full respekt för ditt arbete med Mexiko och jag böjer mig för dina argument. Just ditt arbete med Mexiko var anledningen till att jag inte rörde Mexiko i "mitt" städprojekt. Jag föreslår därför att vi går på din linje. Kitayama (diskussion) 4 april 2024 kl. 09.06 (CEST)Svara
Det går att argumentera att det redan finns ett städ-projekt. Nämligen detta där användare har gjort en enorm insats med att fixa till artiklar fylla av felaktigheter, tveksamheter, missvisande information och egen forskning. Trots det finns det hundratusentals artiklar kvar efter 7 år. All denna tid som redan lagts ned kunde ha använts till att skriva artiklar som folk faktiskt ville läsa och förbättra artiklar. Nu styrs arbetet över till att åtgärda artiklar som en bot massproducerade utan någon som helst tanke på vilka artiklar som efterfrågades.
Personligen tycker jag att alla bot-märkta geografiartiklar borde raderas, de fyller inte de mest grundläggande krav på våra artiklar och skapar inget värde för våra läsare. För att visa hur tokiga det blir kan vi titta på denna artikel. Först använder boten en indelning som avskaffades i Skottland före andra världskriget, sedan använder boten en egen term ”Rådsområde”, sen påstår boten att denna udde i havet ligger nära havet i väster (hur kan en udde i havet ligga ”nära” havet?), sen berättar boten att (havet) västerut är det relativt platt och sen tycker boten (oklart vad det stödjer sig på) att det är ganska glesbefolkat.
Men det är fullt möjligt att det fortfarande finns konsensus för att inte radera alla bot-artiklar utan att vi ska hålla kvar vid den kompromissen som gjordes. Nämligen att radera bot-artiklar där det saknas icke-botskapade artiklar på andra språk. Och den kompromissen ser jag ingen anledning att ändra och därmed bör de 26000+ artiklarna raderas.
Kraften som det skulle ta att gå igenom dem kan i stället användas till de artiklar där det faktiskt finns artiklar på andra språkversioner, vilket indikerar att platserna existerar och att de tillmäts någon sorts vikt. Vi har inte obegränsade arbetskapacitet på Wikipedia.--ArildV (diskussion) 4 april 2024 kl. 09.04 (CEST)Svara
Mycket bra förslag att ta bort de cirka 26000 artiklar som inte har annat iw än cebwp. Sjunnesson (diskussion) 4 april 2024 kl. 09.20 (CEST)Svara
Det finns bara 190 sådana artiklar - de 26000 artiklarna som omnämnts ovan har endast botskapade artiklar på som mest fem olika språk. Kitayama (diskussion) 4 april 2024 kl. 09.26 (CEST)Svara
Fast det väsentliga är väl att de bara länkar till botskapade artiklar och då borde de 26 000 artiklar jämställas med de som bara har länkar till cebwp.--ArildV (diskussion) 4 april 2024 kl. 11.09 (CEST)Svara
Rätta mig om jag har fel, men är inte de botskapade artiklarna på srWP och shWP baserade på data från statistikmyndigheten? De är i så fall åtminstone mer verifierbara än artiklar på arzWP mfl som har botskapats utifrån Geonames eller Wikidata (och artiklar på stora språk som enWP, deWP och frWP som skapats av människor utifrån Geonames direkt eller indirekt). Om det finns källbelagda data från statistikmyndigheten på Wikidata (för Mexiko och andra länder) skulle en väg framåt kanske vara att med bot ta bort större delen av den nuvarande artikeltexten och lägga in WD-mallar för folkmängd och administrativ tillhörighet.
För övrigt är jag å ena sidan böjd att hålla med Estrellato om att det skulle vara mycket demotiverande i nuläget att radera alla botmärkta artiklar – det borde ha gjorts omedelbart efter att botkörningen stoppades, nu finns det väldigt många artiklar och kategorier som är delvis botstädade. Å andra sidan är en:sunk cost fallacy något vi måste vara medvetna om, botartiklar kan inte vara helt fredade för att någon människa har börjat bearbeta dem. Dock finns det betydligt mer hopplösa artikelsortiment bland botartiklarna än orter i Mexiko, t ex vattendrag i Burundi och små flygfält, så en hårdare raderingslinje bör inte börja där. //Essin (diskussion) 4 april 2024 kl. 10.29 (CEST)Svara
Och med dessa artiklar borta blir det mycket lättare att hitta de botgenererade artiklar som har fler iw än cebwp och åtgärda dessa. Sjunnesson (diskussion) 4 april 2024 kl. 09.23 (CEST)Svara
Nja - det är snabbt gjort att hitta de med Petscan. För detta ändamål behöver inga artiklar raderas. Kitayama (diskussion) 4 april 2024 kl. 09.27 (CEST)Svara
@Kitayama Då är väl problemet att jag inte känner till Petscan. Hur ska jag göra då? Sjunnesson (diskussion) 4 april 2024 kl. 09.37 (CEST)Svara
Verktyget finns här: https://petscan.wmflabs.org/
Exempelrapport: https://petscan.wmflabs.org/?psid=27845265 I detta fall använde jag flikarna Categories (för att välja Robotskapade Mexikoartiklar) och fliken Wikidata (för att hitta alla artiklar som har länk till cebwiki, men max två iw-länkar - eftersom den ena är svwiki så innebär det att det inte finns någon annan iw). Ytterligare förklaringar får vi ta någon annanstans. Verktyget har varit ett måste för att göra den typen av städningar som gjorts. Kitayama (diskussion) 4 april 2024 kl. 09.42 (CEST)Svara
@Sjunnesson, Kitayama: Jag vet inte om ni letar efter samma sak:
  • Sjunnesson skriver om "artiklar som har fler iw än cebwp"
  • Kitayama ger en PetScan fråga som hittar "artiklar som bara har iw till cebwp förutom svwp"
OK, tillsammans utgör väl dessa två mängder hela Kategori:Robotskapade Mexikoartiklar, men det kompliceras en del av att det nu tydligen är ytterligare fem språkversioner som inte ska "räknas som icke-botskapade", nämligen arz, tt, ce, sr och sh, om jag uppfattat det inledande inlägget i tråden rätt.
Det kan vara knepigt att få PetScan att leverera ett svar på vilka artiklar som har iw till någon annan språkversion än dessa "svartlistade". I och med att alla svartlistade inte nödvändigtvis är kopplade till alla objekt kan man inte använda rutan för "Minimum number of sitelinks". Man kan förstås räkna upp ett antal icke-svartlistade sajter i rutan "Has any of these site links". Här är ett exempel på en fråga som hittar 5 042 robotskapade Mexikoartiklar som har interwiki till minst en av åtta icke-svartlistade sajter (en, de, fr, es, pt, nl, da, fi), men det fångar ju inte alla objekt som har länkar till andra icke-svartlistade sajter.
Jag har därför gjort en inventering av samtliga 31 889 robotskapade Mexikoartiklar med avseende på deras interwiki och listat vilka interwikilänkar respektive artikel har och speciellt angivit sådana som inte är svart-listade.
Ett utdrag med de 1 683 artiklar som börjar med A eller Á finns i Sandlådan.
Den kompletta tabellen är för stor för att rymmas på en wikisida. Men om jag skippar kolumnerna för artikelnamn och alla sajtlänkar, de kan ju fås via Wikidata, får den plats.
-- Larske (diskussion) 4 april 2024 kl. 15.56 (CEST)Svara
Som Esrellato ser jag potenatiella utnyttja dessa botstubar till att göra något bättre. Jag stöder ej massradering av dessa (men ok om det görs inmtelligenta raderingar) OCh arildv jag ser största vitsen att de finns och gå länka till och att de har coordinater som ofta är va stort värde Yger (diskussion) 4 april 2024 kl. 09.25 (CEST)Svara
Koordinaterna är mycket ofta felaktiga och behöver justeras - i den mån platsen verkligen existerar. Botartiklar SKA åtgärdas eller raderas. Att låta de ligga kvar orörda är det sämsta alternativet. Om Estrellato anser att det går att "rädda" artiklar i Mexiko så är det helt OK för mig. Det får också ta tid. Vi har kommit en bra bit på vägen med Mexiko - det var ursprungligen över 81000 artiklar. Per 1 jan 2021 var de nere i 32791 oåtgärdade artiklar, nu 31889. Kitayama (diskussion) 4 april 2024 kl. 09.32 (CEST)Svara
Jag skulle vilja omdirigera små postorter till respektive kommun och skriva något bättre om de orter där det faktiskt finns källor till att skriva något. Ofta kan den gränsen dras vid ungefär 700-1000 invånare. Koordinaterna i Mexiko är inte felaktiga (det finns säkert fortfarande några undantag, speciellt i delstaten Morelos)m, men generellt har det har städats med bot på Wikidata för ett år sedan ungefär och på svwiki har de aldrig varit särskilt felaktiga utan det var de serbiskt importerade koordinaterna som inte stämde. Estrellato (diskussion) 4 april 2024 kl. 10.12 (CEST)Svara
Det kan nämnas att av de 26000+ artiklarna så avser så gott som alla orter och indelningar. Endast 95 stycken avser något annat, t ex landformer, flygplatser etc. https://petscan.wmflabs.org/?psid=27846383 Kitayama (diskussion) 4 april 2024 kl. 10.25 (CEST)Svara
I min dagliga gärning träffar jag på kanske 50 Lsjbotartiklar om året som "tappa" sin WD koppling. Jag brukar då jobba med att hitta rätt mha koordinatangivelsen. I dessa fall är det ofta träff på en bebyggelseaggretion då det är oklart vad som avse, men ofta så stämmer coordianaterna. Så jag vill inte totaldissa utifrån dåliga koordinater Yger (diskussion) 4 april 2024 kl. 10.27 (CEST)Svara
I morse klockan 07:17 återställde Estrellato fyra av Adville raderade "Las Peñitas"-artiklar, se raderingsloggen.
Återställningen blev dock inte helt genomförd, de fyra artiklarna har tappat sin koppling till Wikidata (och därmed interwiki till andra Wikipediaspråkversioner).
Här är de 4 Wikidataobjekten som har tappat sin svwp-koppling
Om artiklarna skall vara kvar på svwp bör även länkarna till Wikidata återställas, alternativt nya objekt skapas om artiklarna avser något helt annat.
-- Larske (diskussion) 4 april 2024 kl. 12.47 (CEST)Svara
fixat, tack för att du uppmärksammade detta, som jag missade i morse (men skulle upptäckt när jag dagligen söker WP-artiklar som saknar WD objekt) Yger (diskussion) 4 april 2024 kl. 13.14 (CEST)Svara

Ett räkneexempel. Vi verkar ha fler än 1 miljon botmärkta artiklar. Men om vi antar att vi har 1 miljon artiklar kvar och vi antar att det tar 15 minuter att fixa till en artikel ordentligt (ta bort fluff, lägga in riktiga källor, kontrollera det som står och förvandlar den till något vettigt) hinner man fyra artiklar per timme. Om vi räknar om det till årsarbetstid behöver vi räkna med att människor inte jobbar effektivt fyrtio timmar per vecka (man fikar, ta för långa luncher, går på möten, hanterar personalgrejer, datorstrul mm) så vi kan räkna med 3,5 artiklar per timme. Det innebär att det skulle ta 285 714 timmar att fixa till 1 miljon artiklar. Årsarbetstiden är 2080 timmar vid heltid, så 258 714 det motsvarar 137 heltidsanställda som jobbar ett år. Om 100 volontärer (vilket väl motsvarar alla aktiva användare på Wikipedia?) skulle ägna 10 timmar i veckan åt det skulle innebära 52 o00 timmar per år, och även då skulle det ta 5 år att fixa till 1 miljon artiklar och allt annat arbete med att förbättra uppslagsverket skulle då stanna upp, om de lägger 5 timmar per vecka pratar vi 10 år.--ArildV (diskussion) 4 april 2024 kl. 11.32 (CEST)Svara

@Estrellato: Stort tack för allt ditt slit med att fixa Lsjbotartiklarna för Mexiko. Det är mycket jobb. Själv tog jag under flera år hand om och betade av Nicaragua, där alla artiklar nu antingen har fixats eller raderats. Mexiko är dock mycket större. Min erfarenhet från Nicaragua är att det är snabbare och blir mycket bättre resultat att skriva artiklara från början på nytt än att kontrollera, redigera och brottas med alla faktafel i Lsjbotartiklarna, med Du jobbar kanske på ett annat sätt. Att få bort alla faktafel är ett otacksamt arbete som inte alltid stöds av andra, och eftersom det är Du som kämpar med Mexiko bör vi göra som Du tycker är bäst där. Ett tredje alternativ är att lägga artiklarna i en sandlåda som du sedan kan återställa till wikipediarymden efterhand som du betar av dem. Att det finns så många faktafel i Lsjbot artiklarna gör tyvärr att läsare med lite kännedom om Latinamerika även misstror Wikipedia i allmänhet och inte heller litar på de nu korrekta artiklarna som vi har laget ner så mycket arbete på. Det är synd. Hur Du än väljer att hantera det hela, ska Du ha ett jättestort tack, och om Du vill utbyta erfarenheter så pinga mig. Martinogk (diskussion) 4 april 2024 kl. 15.42 (CEST)Svara

Strykning med robot av listor över landformer redigera

För ett par månader sedan föreslog jag att listorna över landformer (de som inleds med "I övrigt finns följande") skulle tas bort med bot, och Larske visade hur det kunde göras. Listorna är dels omöjliga att göra fullständiga, dels fulla av rödlänkar efter raderingar. Innan jag lägger upp en förfrågan på WP:RH undrar jag dock:

  • Är det en god idé i största allmänhet?
  • Om den ska genomföras, ska några underkategorier hoppas över, t ex Finland (inkl Åland) där artiklar utan iw vanligtvis behållits eftersom det ses som svWP:s "hemmaplan", eller Antarktis där urvalet verkar vara baserat på Composite Gazetteer of Antarctica och alltså i någon mening kan anses vara "komplett"?

//Essin (diskussion) 4 april 2024 kl. 13.42 (CEST)Svara

Det är en god idé - listorna tillför absolut ingenting, i synnerhet inte när det är 100-tals rödlänkar för större administrativa enheter. Detta är vad vi har kategorier till. Algoritmen verkar dessutom ha haft sin svagheter, jag har ofta sett öar ligga på öar och ibland även sjöar som ligger i sjöar. Förmodligen borde man köra detta även på Finland och Antarktis, men bäst är att undanta de i första omgången. Det som man också behöver fånga upp är alla de "I övrigt finns följande" som INTE åtföljs av något följande. Det har jag stött på många gånger. Ser helknasigt ut. När jag läser den gamla diskussionen blir jag osäker på om Larskes regexp fångar upp det fallet. Det borde ju vara det första man åtgärdar - följande utan följande. Kitayama (diskussion) 4 april 2024 kl. 16.50 (CEST)Svara
Jag går igenom manuellt de 130+ artiklar som inte har robotflagga, men texten "I övrigt finns följande". Är det rödlänkar till raderade artiklar så tar jag bort texten, i andra fall omformulerar jag till mer "normal" artikeltext. Kitayama (diskussion) 4 april 2024 kl. 17.54 (CEST)Svara