Wikipediadiskussion:Projekt alla platser-städning

Botgenererade platser i Mexiko redigera

Det finns ju sedan tidigare konsensus om att lsjbot-genererade geografiartiklar med iw-länk endast till cebwiki ska kunna raderas. I de fall då botskapade versioner på andra språk har dykt upp som "spin-off" på cebwiki, t ex på arzwiki, så har praxis varit att artikeln på svwiki har raderats. Nu har användare MartinogkWP:BOÅ begärt att: " Radera alla Lsjbot genererade sidor för Mexiko som endast har interwikilänkar till andra botskapade sidor på cebuano (ceb/Lsjbot), tatar (tt/Nurbot), tjetjenska (ce/CheWikibot), serbiska (sr/Dcirovicbot) och/eller serbokroatiska (sh/Dcirovicbot). Exempelvis alla artiklar på förgreningssidorna El Gigante och El Pochote, med det finns tusentals fler."

Likaså anmälde användaren fyra artiklar till snabbradering. Artiklarna snabbraderades enligt min mening i enlighet med konsensus och praxis, men Estrellato satte {{Låtvara}} på dem och Yger återställde därför raderingarna. Vi behöver därför ha en diskussion om rådande konsensus också gäller denna typ av artiklar (botskapade på många språk) eller inte. Min åsikt är klar: Radera. Kitayama (diskussion) 4 april 2024 kl. 08.03 (CEST)Svara

Jag gillar inte automatiken i detta, utan ser helst detta tas plats för plats. (och det var inte jag som återställde, jag tog enbart bort snabbraderingsmallen) Yger (diskussion) 4 april 2024 kl. 08.07 (CEST)Svara
Plats för plats är lite svårt - det är frågan om tusentals artiklar av mycket tveksam kvalitet. Jag ser nu att det var Estrellato som återställde. Förlåt! Kitayama (diskussion) 4 april 2024 kl. 08.15 (CEST)Svara
Det rör sig förmodligen om 26856 artiklar (Robotskapade Mexikoartiklar som saknar iw till engelska, spanska, tyska eller franska). Det kan vara något färre om det finns manuell artikel på något annat språk. Kitayama (diskussion) 4 april 2024 kl. 08.24 (CEST)Svara
Då bör det enligt mig skapas ett städprojekt för just detta som leds av en admin, som du gjorde tidigare. Då kan vi sedan kollektivt lite på denna admin som ombesörjer borttag. Att gå via raderamall lämnar borttaget till adminkollektivet, och vi kan inte kräva alla admin är insatta i en detaljfråga som detta Yger (diskussion) 4 april 2024 kl. 08.30 (CEST)Svara
Instämmer helt med att detta inte ska tas via snabbradera och inte heller via WP:BOÅ. Därav att jag skrev en kommentar på BOÅ och hänvisade till denna diskussion. En admin får gärna sätta "Ej utfört" på BOÅ (som icke-admin ska jag inte markera BOÅ-beslut).Kitayama (diskussion) 4 april 2024 kl. 08.33 (CEST)Svara
Om jag har arbetat förgäves med att avbotta över 3500 mexikanska orter hittills då lämnar jag projektet. Så enkelt är det. Jag har snart gjort klart hela delstaten Mexiko, vilket hade klart flest orter av alla delstater. Jag har tidigare föreslagit att orter mindre än 1000 invånare kan omdirigeras till kommunen osv men dessa förslag har mötts av ogillande. Om jag nu ska ha spenderat uppskattningsvis 200 timmar på detta projekt bara för att allt som inte har koppling till annan iw än de botskapade ska raderas, då lämnar jag Wikipedia. Så enkelt är det för mig, faktiskt. Estrellato (diskussion) 4 april 2024 kl. 08.55 (CEST)Svara
Se Kategori:Orter i delstaten Mexiko för referens för vad jag gjort hittills, Kategori:Mexikos öar och så vidare. Jag har tidigare varit för att omdirigera mindre orter till kommunen och låta samt nyskapa artiklar för orter med över 1 000 invånare, och jag kan tänka mig den kompromissen (trots att jag då lagt hundratals timmar på artiklar som nu anses ska bort). Men om allt botgenererat som "saknar iw till engelska, spanska, tyska eller franska) ska bort. Då säger jag adjö. Estrellato (diskussion) 4 april 2024 kl. 09.01 (CEST)Svara
Ingen har föreslagit radering av artiklar som är åtgärdade.--ArildV (diskussion) 4 april 2024 kl. 09.04 (CEST)Svara
Jag har full respekt för ditt arbete med Mexiko och jag böjer mig för dina argument. Just ditt arbete med Mexiko var anledningen till att jag inte rörde Mexiko i "mitt" städprojekt. Jag föreslår därför att vi går på din linje. Kitayama (diskussion) 4 april 2024 kl. 09.06 (CEST)Svara
Det går att argumentera att det redan finns ett städ-projekt. Nämligen detta där användare har gjort en enorm insats med att fixa till artiklar fylla av felaktigheter, tveksamheter, missvisande information och egen forskning. Trots det finns det hundratusentals artiklar kvar efter 7 år. All denna tid som redan lagts ned kunde ha använts till att skriva artiklar som folk faktiskt ville läsa och förbättra artiklar. Nu styrs arbetet över till att åtgärda artiklar som en bot massproducerade utan någon som helst tanke på vilka artiklar som efterfrågades.
Personligen tycker jag att alla bot-märkta geografiartiklar borde raderas, de fyller inte de mest grundläggande krav på våra artiklar och skapar inget värde för våra läsare. För att visa hur tokiga det blir kan vi titta på denna artikel. Först använder boten en indelning som avskaffades i Skottland före andra världskriget, sedan använder boten en egen term ”Rådsområde”, sen påstår boten att denna udde i havet ligger nära havet i väster (hur kan en udde i havet ligga ”nära” havet?), sen berättar boten att (havet) västerut är det relativt platt och sen tycker boten (oklart vad det stödjer sig på) att det är ganska glesbefolkat.
Men det är fullt möjligt att det fortfarande finns konsensus för att inte radera alla bot-artiklar utan att vi ska hålla kvar vid den kompromissen som gjordes. Nämligen att radera bot-artiklar där det saknas icke-botskapade artiklar på andra språk. Och den kompromissen ser jag ingen anledning att ändra och därmed bör de 26000+ artiklarna raderas.
Kraften som det skulle ta att gå igenom dem kan i stället användas till de artiklar där det faktiskt finns artiklar på andra språkversioner, vilket indikerar att platserna existerar och att de tillmäts någon sorts vikt. Vi har inte obegränsade arbetskapacitet på Wikipedia.--ArildV (diskussion) 4 april 2024 kl. 09.04 (CEST)Svara
Mycket bra förslag att ta bort de cirka 26000 artiklar som inte har annat iw än cebwp. Sjunnesson (diskussion) 4 april 2024 kl. 09.20 (CEST)Svara
Det finns bara 190 sådana artiklar - de 26000 artiklarna som omnämnts ovan har endast botskapade artiklar på som mest fem olika språk. Kitayama (diskussion) 4 april 2024 kl. 09.26 (CEST)Svara
Fast det väsentliga är väl att de bara länkar till botskapade artiklar och då borde de 26 000 artiklar jämställas med de som bara har länkar till cebwp.--ArildV (diskussion) 4 april 2024 kl. 11.09 (CEST)Svara
Rätta mig om jag har fel, men är inte de botskapade artiklarna på srWP och shWP baserade på data från statistikmyndigheten? De är i så fall åtminstone mer verifierbara än artiklar på arzWP mfl som har botskapats utifrån Geonames eller Wikidata (och artiklar på stora språk som enWP, deWP och frWP som skapats av människor utifrån Geonames direkt eller indirekt). Om det finns källbelagda data från statistikmyndigheten på Wikidata (för Mexiko och andra länder) skulle en väg framåt kanske vara att med bot ta bort större delen av den nuvarande artikeltexten och lägga in WD-mallar för folkmängd och administrativ tillhörighet.
För övrigt är jag å ena sidan böjd att hålla med Estrellato om att det skulle vara mycket demotiverande i nuläget att radera alla botmärkta artiklar – det borde ha gjorts omedelbart efter att botkörningen stoppades, nu finns det väldigt många artiklar och kategorier som är delvis botstädade. Å andra sidan är en:sunk cost fallacy något vi måste vara medvetna om, botartiklar kan inte vara helt fredade för att någon människa har börjat bearbeta dem. Dock finns det betydligt mer hopplösa artikelsortiment bland botartiklarna än orter i Mexiko, t ex vattendrag i Burundi och små flygfält, så en hårdare raderingslinje bör inte börja där. //Essin (diskussion) 4 april 2024 kl. 10.29 (CEST)Svara
Och med dessa artiklar borta blir det mycket lättare att hitta de botgenererade artiklar som har fler iw än cebwp och åtgärda dessa. Sjunnesson (diskussion) 4 april 2024 kl. 09.23 (CEST)Svara
Nja - det är snabbt gjort att hitta de med Petscan. För detta ändamål behöver inga artiklar raderas. Kitayama (diskussion) 4 april 2024 kl. 09.27 (CEST)Svara
@Kitayama Då är väl problemet att jag inte känner till Petscan. Hur ska jag göra då? Sjunnesson (diskussion) 4 april 2024 kl. 09.37 (CEST)Svara
Verktyget finns här: https://petscan.wmflabs.org/
Exempelrapport: https://petscan.wmflabs.org/?psid=27845265 I detta fall använde jag flikarna Categories (för att välja Robotskapade Mexikoartiklar) och fliken Wikidata (för att hitta alla artiklar som har länk till cebwiki, men max två iw-länkar - eftersom den ena är svwiki så innebär det att det inte finns någon annan iw). Ytterligare förklaringar får vi ta någon annanstans. Verktyget har varit ett måste för att göra den typen av städningar som gjorts. Kitayama (diskussion) 4 april 2024 kl. 09.42 (CEST)Svara
@Sjunnesson, Kitayama: Jag vet inte om ni letar efter samma sak:
  • Sjunnesson skriver om "artiklar som har fler iw än cebwp"
  • Kitayama ger en PetScan fråga som hittar "artiklar som bara har iw till cebwp förutom svwp"
OK, tillsammans utgör väl dessa två mängder hela Kategori:Robotskapade Mexikoartiklar, men det kompliceras en del av att det nu tydligen är ytterligare fem språkversioner som inte ska "räknas som icke-botskapade", nämligen arz, tt, ce, sr och sh, om jag uppfattat det inledande inlägget i tråden rätt.
Det kan vara knepigt att få PetScan att leverera ett svar på vilka artiklar som har iw till någon annan språkversion än dessa "svartlistade". I och med att alla svartlistade inte nödvändigtvis är kopplade till alla objekt kan man inte använda rutan för "Minimum number of sitelinks". Man kan förstås räkna upp ett antal icke-svartlistade sajter i rutan "Has any of these site links". Här är ett exempel på en fråga som hittar 5 042 robotskapade Mexikoartiklar som har interwiki till minst en av åtta icke-svartlistade sajter (en, de, fr, es, pt, nl, da, fi), men det fångar ju inte alla objekt som har länkar till andra icke-svartlistade sajter.
Jag har därför gjort en inventering av samtliga 31 889 robotskapade Mexikoartiklar med avseende på deras interwiki och listat vilka interwikilänkar respektive artikel har och speciellt angivit sådana som inte är svart-listade.
Ett utdrag med de 1 683 artiklar som börjar med A eller Á finns i Sandlådan.
Den kompletta tabellen är för stor för att rymmas på en wikisida. Men om jag skippar kolumnerna för artikelnamn och alla sajtlänkar, de kan ju fås via Wikidata, får den plats.
-- Larske (diskussion) 4 april 2024 kl. 15.56 (CEST)Svara
Som Esrellato ser jag potenatiella utnyttja dessa botstubar till att göra något bättre. Jag stöder ej massradering av dessa (men ok om det görs inmtelligenta raderingar) OCh arildv jag ser största vitsen att de finns och gå länka till och att de har coordinater som ofta är va stort värde Yger (diskussion) 4 april 2024 kl. 09.25 (CEST)Svara
Koordinaterna är mycket ofta felaktiga och behöver justeras - i den mån platsen verkligen existerar. Botartiklar SKA åtgärdas eller raderas. Att låta de ligga kvar orörda är det sämsta alternativet. Om Estrellato anser att det går att "rädda" artiklar i Mexiko så är det helt OK för mig. Det får också ta tid. Vi har kommit en bra bit på vägen med Mexiko - det var ursprungligen över 81000 artiklar. Per 1 jan 2021 var de nere i 32791 oåtgärdade artiklar, nu 31889. Kitayama (diskussion) 4 april 2024 kl. 09.32 (CEST)Svara
Jag skulle vilja omdirigera små postorter till respektive kommun och skriva något bättre om de orter där det faktiskt finns källor till att skriva något. Ofta kan den gränsen dras vid ungefär 700-1000 invånare. Koordinaterna i Mexiko är inte felaktiga (det finns säkert fortfarande några undantag, speciellt i delstaten Morelos)m, men generellt har det har städats med bot på Wikidata för ett år sedan ungefär och på svwiki har de aldrig varit särskilt felaktiga utan det var de serbiskt importerade koordinaterna som inte stämde. Estrellato (diskussion) 4 april 2024 kl. 10.12 (CEST)Svara
Det kan nämnas att av de 26000+ artiklarna så avser så gott som alla orter och indelningar. Endast 95 stycken avser något annat, t ex landformer, flygplatser etc. https://petscan.wmflabs.org/?psid=27846383 Kitayama (diskussion) 4 april 2024 kl. 10.25 (CEST)Svara
I min dagliga gärning träffar jag på kanske 50 Lsjbotartiklar om året som "tappa" sin WD koppling. Jag brukar då jobba med att hitta rätt mha koordinatangivelsen. I dessa fall är det ofta träff på en bebyggelseaggretion då det är oklart vad som avse, men ofta så stämmer coordianaterna. Så jag vill inte totaldissa utifrån dåliga koordinater Yger (diskussion) 4 april 2024 kl. 10.27 (CEST)Svara
I morse klockan 07:17 återställde Estrellato fyra av Adville raderade "Las Peñitas"-artiklar, se raderingsloggen.
Återställningen blev dock inte helt genomförd, de fyra artiklarna har tappat sin koppling till Wikidata (och därmed interwiki till andra Wikipediaspråkversioner).
Här är de 4 Wikidataobjekten som har tappat sin svwp-koppling
Om artiklarna skall vara kvar på svwp bör även länkarna till Wikidata återställas, alternativt nya objekt skapas om artiklarna avser något helt annat.
-- Larske (diskussion) 4 april 2024 kl. 12.47 (CEST)Svara
fixat, tack för att du uppmärksammade detta, som jag missade i morse (men skulle upptäckt när jag dagligen söker WP-artiklar som saknar WD objekt) Yger (diskussion) 4 april 2024 kl. 13.14 (CEST)Svara

Ett räkneexempel. Vi verkar ha fler än 1 miljon botmärkta artiklar. Men om vi antar att vi har 1 miljon artiklar kvar och vi antar att det tar 15 minuter att fixa till en artikel ordentligt (ta bort fluff, lägga in riktiga källor, kontrollera det som står och förvandlar den till något vettigt) hinner man fyra artiklar per timme. Om vi räknar om det till årsarbetstid behöver vi räkna med att människor inte jobbar effektivt fyrtio timmar per vecka (man fikar, ta för långa luncher, går på möten, hanterar personalgrejer, datorstrul mm) så vi kan räkna med 3,5 artiklar per timme. Det innebär att det skulle ta 285 714 timmar att fixa till 1 miljon artiklar. Årsarbetstiden är 2080 timmar vid heltid, så 258 714 det motsvarar 137 heltidsanställda som jobbar ett år. Om 100 volontärer (vilket väl motsvarar alla aktiva användare på Wikipedia?) skulle ägna 10 timmar i veckan åt det skulle innebära 52 o00 timmar per år, och även då skulle det ta 5 år att fixa till 1 miljon artiklar och allt annat arbete med att förbättra uppslagsverket skulle då stanna upp, om de lägger 5 timmar per vecka pratar vi 10 år.--ArildV (diskussion) 4 april 2024 kl. 11.32 (CEST)Svara

@Estrellato: Stort tack för allt ditt slit med att fixa Lsjbotartiklarna för Mexiko. Det är mycket jobb. Själv tog jag under flera år hand om och betade av Nicaragua, där alla artiklar nu antingen har fixats eller raderats. Mexiko är dock mycket större. Min erfarenhet från Nicaragua är att det är snabbare och blir mycket bättre resultat att skriva artiklara från början på nytt än att kontrollera, redigera och brottas med alla faktafel i Lsjbotartiklarna, med Du jobbar kanske på ett annat sätt. Att få bort alla faktafel är ett otacksamt arbete som inte alltid stöds av andra, och eftersom det är Du som kämpar med Mexiko bör vi göra som Du tycker är bäst där. Ett tredje alternativ är att lägga artiklarna i en sandlåda som du sedan kan återställa till wikipediarymden efterhand som du betar av dem. Att det finns så många faktafel i Lsjbot artiklarna gör tyvärr att läsare med lite kännedom om Latinamerika även misstror Wikipedia i allmänhet och inte heller litar på de nu korrekta artiklarna som vi har laget ner så mycket arbete på. Det är synd. Hur Du än väljer att hantera det hela, ska Du ha ett jättestort tack, och om Du vill utbyta erfarenheter så pinga mig. Martinogk (diskussion) 4 april 2024 kl. 15.42 (CEST)Svara

Vägen framåt redigera

Räkneexemplet ovan pekar på att det kommer ta väldigt lång tid innan alla bot-artiklarna är åtgärdade. Om vi tänker ett något mer realistiskt scenario (50 använder per vecka som lägger 5 timmar per vecka på det) så pratar vi om 20 år till och att vi (räknat från att de skapades) under ett kvarts sekel (sic!) kommer att ha haft artiklar fyllda med felaktigheter, missvisande och irrelevant information och egen forskning.

Argumenten för att radera är främst att vi som uppslagsverket inte medvetet och uppsåtligen ha artiklar publicerade som vi vet potentiellt missleder och desinformerar våra läsare och att det är orimligt att sätta lägre krav på botskapade artiklar. Yger nämner två argument för att inte radera artiklar, nämligen att koordinater är värdefulla och att det går att länka och det finns också argumentet att artiklar går att förbättra.

Finns det någon lösning som gör att båda sidors önskan tas till vara?

Bara för att slänga fram ett förslag; kan vi göra alla botskapade artiklar till mjuka omdirigeringar till Wikidata med en vänlig text i stil med ”Wikipedia saknar idag en artikel om denna plats. På Wikidata finns information om platsen. Skapa gärna en artikel om platsen (redigeringslänk)”. Då finns historiken kvar (man kan skapa en ny artikel utifrån den utan att behöva besvära en administratör), läsaren får tillgång till korrekt information på Wikidata (men slipper missvisande och felaktigt nonsens från oss) och det är samma möjligheter att lätt fixa till artikeln för den som önskar.

Detta är lite okonventionell men ett mycket mindre allvarligt brott mot hur vi brukar göra än att acceptera att vi i ytterligare 20 år kommer ha mängder av artiklar som inte lever upp till de mest grundläggande krav på vad ett uppslagsverk är.

En av våra duktiga botägare kan säkert ta fram automatiskt uppdaterade listor över exempelvis artiklar om Mexico som omdirigeras till Wikidata för den som vill hitta dem. Då tillgodoser vi alla intressen. ArildV (diskussion) 4 april 2024 kl. 12.32 (CEST)Svara

Jag ser att idén i sig håller. Men frågan är om det är bra att byta dagens icke-bra mot något annat icke-bra. Dessa bot artiklar gör ingen större skada och ingen stressa åtgärda. Vem vet kanske abstract wikipedia kommer passa utmärkt för att detta sortiment, och då skapa bra artiklar istf icke-bra. Eller om ytterligare fem år kanske AI kan vara något som fixar till detta? Yger (diskussion) 4 april 2024 kl. 13.18 (CEST)Svara
En liknande lösning är det jag föreslår ovan, att ostädade artiklar ersätts med stubbar som helt bygger på WD-mallar. För att något av alternativen ska vara en reell förbättring krävs dock att WD-objekten är ordentligt källbelagda. Hur gör vi när det inte är fallet? //Essin (diskussion) 4 april 2024 kl. 13.18 (CEST)Svara
Jag tycker att även denna situation är ett argument för min idé att etablera en inkubator-namnrymd. Artiklar som inte har kvalitet nog för publicering, men som har potential i kraft av dess relevans, skulle vi kunna flytta dit. Det gäller då bland annat ej botsanerade artiklar. Skulle det inte vara värt att pröva idén? Stigfinnare (diskussion) 4 april 2024 kl. 16.18 (CEST)Svara
Har det inte etablerats konsensus kring förfarandet att istället för att bara radera en nyskapad artikel som inte håller måttet i ett eller flera avseenden, men som ändå har potential i kraft av artikelsubjektets relevans, flyttas en sådan artikel till en undersida till användarsidan för den användare som skapade artikeln? Se Wikipedia:Bybrunnen#Kategori_som_möjliggör_rensning_av_artiklar_flyttade_utan_omdirigeringar_till_användarundersidor?.
Detta förfarande borde väl även kunna tillämpas när artikeln är skapad av en robot som Lsjbot. Om man vill kan man flytta artikeln till en undersida som har strängen "/Inkubator/" i sökvägen för att den inte ska blandas ihop med "/Dubbletter/" som också finns som undersida till Lsjbot.
-- Larske (diskussion) 4 april 2024 kl. 17.48 (CEST)Svara
Jag är inte säker på att det är det bästa sättet, men om det blir av är det viktigt att skriva ner WD-objektet som artikeln var kopplad till, t ex tillsammans med utkommenterade kategorier. Det har krävt mycket jobb att koppla artiklar till rätt WD-objekt och det är inte alltid det går att spåra via cebWP eller Geonames-ID.
(Dubblettsidorna ligger faktiskt under "/Dubletter/" med ett b.) //Essin (diskussion) 4 april 2024 kl. 19.10 (CEST)Svara
Jag funderar på om det inte är bäst att gå på @Essins linje här. Göra om artiklarna till stubbar med bara en databox skapad från WD. I den boxen väljer vi ut de rubriker som vanligtvis visas korrekt, men inte de som brukar vara felaktiga (det blir olika för olika objekttyper, såsom orter, kommuner eller öar). Risken för felaktigheter minimeras då i det vi löser, men finns kvar i WD. På detta sättet behålls artiklarna, kopplingen till WD, historiken och städarbetet kan gå andra hållet mot fullständiga artiklar från minimala boxar. Gör vi enligt @ArildVs förslag, som också är bra, så kommer vi att leda läsarna till ett format de inte känner igen och där kommer de genast se även alla felaktigheter som importerats dit från artiklar.
En annan sak är att när vi har några genomtänkta alternativ (Essins, ArildVs, Advilles förfining ovan, Behåll, radera helt), så bör vi lägga upp dessa på Bybrunnen för gemenskapen att se, läsa våra argument kortfattat och vara med i diskussionen hur vi skall gå tillväga. Adville (diskussion) 4 april 2024 kl. 19.22 (CEST)Svara
Klokt @Adville. Och jag kanske har överskattat information som finns på Wikidata, om den också präglas av felaktigheter är kanske Essins (med fleras) förslag bättre som kompromiss. Är det genomförbart med en bot?
Jag tänker också att förslagen radera och radera+flytta till annan namnrymd egentligen är samma förslag. Det är ju redan etablerat att undermånliga artiklar med potential kan läggas som undersidor.
Så egentligen kanske det är tre tydliga förslag; radera, ersatt alla information i artiklar med en korta stubbar byggda på WD samt att låta allt fortsätta som idag.
--ArildV (diskussion) 5 april 2024 kl. 17.16 (CEST)Svara
Jag vill då komma med ett fjärde förslag. Rensa allt fluff ur artiklarna (botjobb) och låt "stommen" vara kvar. Då har vi kommit en bra bit på väg och det blir lättare att förbättra artiklarna. Jag rensade för flera år sedan bort "I trakten av X finns ovanligt många namngivna Y". Jag tror inte på att basera stubbar på WD, för det finns alldeles för lite data i WD, i de flesta fall bara det data som kommer från botskapade artiklar. Då blir det rundgång. Kitayama (diskussion) 5 april 2024 kl. 17.38 (CEST)Svara
Jag tycker inte att vi ska se de olika förslagen som ömsesidigt uteslutande utan som angreppssätt som kan kombineras på olika sätt. WD-baserade faktarutor (eller det mer långtgående förslaget om WD-baserad brödtext och kategorier) skulle som du säger inte fungera överallt i nuläget med rimliga krav på källor och artikellängd, men för många typer av artiklar finns källbelagd officiell statistik på WD så en generell WD-faktarutamall skulle innebära en märkbar minskning av städbehovet. Nedkortning av brödtexten gör jag ofta för hand (med redigeringskommentaren "delvis botstädning") när jag uppdaterar något i en botartikel (t ex namn, administrativ tillhörighet o dyl) utan att ha tid att förse den med bättre källor än Geonames. Om detta kan göras i alla botartiklar med bot skulle det snabba upp städprocessen märkbart. Och även om jag tycker att det är för sent att göra urskillningslös radering nu finns det avgränsade artikelserier där jag tycker att det kan vara aktuellt, t ex orter och administrativa enheter som trots ansträngningar inte har gått att identifiera i officiell statistik, insjöar i Kanada vars frWP-artiklar av allt att döma är plagiat, vattendrag i Burundi som bara iw-länkas till substubbar på swahili mm.
Vi måste också tänka på framtida uppdateringsbehov. Det är inte bara folkmängder som ändras, utan administrativa indelningar görs om, flygplatser läggs ner etc. Är det acceptabelt att vissa artikelsortiment "för all framtid" är helt WD-genererade för att minska uppdateringsbehovet på svWP? Ett lämpligt första steg är kanske fler autogenererade åtgärdskategorier som identifierar diskrepanser mellan geobox-parametrar och WD?
Om botartiklar ligger kvar i artikelnamnrymden i någon form kan de också ligga kvar i artikelkategorier (men måste inte, strikt taget). Det har både fördelar och nackdelar: för det första, om kategoristrukturen ändras uppdateras det löpande i artiklarna så att det inte behöver fixas när artikeln "uppgraderas" med människoskapat material, men det innebär å andra sidan mer arbete när någon vill ändra kategoristrukturen – för det andra, kategorier kommer inte att tömmas för att senare återställas, men å andra sidan kommer många kategorier att bli liggande mycket länge med (nästan) bara botstubbar i sig. Om kategorierna ska genereras av en WD-mall behövs antagligen handpåläggning i mallkoden för att skapa "lagom stora" kategorier utifrån WD-egenskaperna. //Essin (diskussion) 8 april 2024 kl. 11.02 (CEST)Svara

Strykning med robot av listor över landformer redigera

För ett par månader sedan föreslog jag att listorna över landformer (de som inleds med "I övrigt finns följande") skulle tas bort med bot, och Larske visade hur det kunde göras. Listorna är dels omöjliga att göra fullständiga, dels fulla av rödlänkar efter raderingar. Innan jag lägger upp en förfrågan på WP:RH undrar jag dock:

  • Är det en god idé i största allmänhet?
  • Om den ska genomföras, ska några underkategorier hoppas över, t ex Finland (inkl Åland) där artiklar utan iw vanligtvis behållits eftersom det ses som svWP:s "hemmaplan", eller Antarktis där urvalet verkar vara baserat på Composite Gazetteer of Antarctica och alltså i någon mening kan anses vara "komplett"?

//Essin (diskussion) 4 april 2024 kl. 13.42 (CEST)Svara

Det är en god idé - listorna tillför absolut ingenting, i synnerhet inte när det är 100-tals rödlänkar för större administrativa enheter. Detta är vad vi har kategorier till. Algoritmen verkar dessutom ha haft sin svagheter, jag har ofta sett öar ligga på öar och ibland även sjöar som ligger i sjöar. Förmodligen borde man köra detta även på Finland och Antarktis, men bäst är att undanta de i första omgången. Det som man också behöver fånga upp är alla de "I övrigt finns följande" som INTE åtföljs av något följande. Det har jag stött på många gånger. Ser helknasigt ut. När jag läser den gamla diskussionen blir jag osäker på om Larskes regexp fångar upp det fallet. Det borde ju vara det första man åtgärdar - följande utan följande. Kitayama (diskussion) 4 april 2024 kl. 16.50 (CEST)Svara
Jag går igenom manuellt de 130+ artiklar som inte har robotflagga, men texten "I övrigt finns följande". Är det rödlänkar till raderade artiklar så tar jag bort texten, i andra fall omformulerar jag till mer "normal" artikeltext. Kitayama (diskussion) 4 april 2024 kl. 17.54 (CEST)Svara

Rådsområde i artiklar om Storbritannien redigera

I hyfsat många botskapade artiklar om Storbritannien används "rådsområde" fortfarande i brödtexten och i geoboxen där också kommunnamnet står på regionnivå. I många fall verkar det ha rätts och "rådsområde" har ersatts med kommun och många kommunartiklar har också flyttats. Vore det möjligt att med hjälp av en bot fixa de kvarvarande artiklarna? Exempelvis på en sådan artikel Arthur's Seat, Edinburgh ArildV (diskussion) 5 april 2024 kl. 17.26 (CEST)Svara

Borde inte vara något problem. Om ingen annan tar det så kan jag ta det som ett enmansprojekt efter att ha städat klart i Österrike. Kitayama (diskussion) 5 april 2024 kl. 17.44 (CEST)Svara
@ArildV: Rådsområde utbytt mot kommun i kommun 27-32 enligt listan i Skottlands kommuner. Fortsätter vid ett senare tillfälle. Exempel på förändring som gjorts: Diff. Kitayama (diskussion) 5 april 2024 kl. 23.27 (CEST)Svara
@Kitayama: tack!--ArildV (diskussion) 7 april 2024 kl. 17.47 (CEST)Svara
Nu är "rådsområde" ersatt med kommun i geoboxar och brödtext. Även ett antal poster i Wikidata med rådsområde i etikett/alias/beskrivning har rättats. Kitayama (diskussion) 8 april 2024 kl. 10.50 (CEST)Svara

Artiklar som bara har iw till ceb och Commons redigera

Petscan räknar Commons som en iw-länk, så en del artiklar har blivit kvar som har en Commonskategori med några bilder men inga länkade Wikipediaartiklar utom cebuano. Ska vi ha kvar dem för att någon människa åtminstone har brytt sig tillräckligt för att skapa Commonskategorin, eller radera för att sannolikheten att det ska gå att hitta goda källor enkelt är låg? //Essin (diskussion) 10 april 2024 kl. 19.31 (CEST)Svara

Jag har noterat detta i mitt städarbete och jag har gjort individuella bedömningar. I vissa fall är det ett relevant objekt, i vissa fall inte. Jag har nog raderat "hälften" av de jag har stött på. Detta är vanligt för naturgeografi, i synnerhet för berg, i vart fall de fall jag stött på. Kitayama (diskussion) 10 april 2024 kl. 19.38 (CEST)Svara
Aha, jag visste inte att det var en individuell bedömning. Då låter jag artiklarna ligga kvar tills vidare. Hur bedömde du vilka som var relevanta? //Essin (diskussion) 11 april 2024 kl. 13.37 (CEST)Svara