Wikipediadiskussion:Projekt alla platser-städning

Senaste kommentaren: för 18 dagar sedan av Essin i ämnet Vägen framåt

Vägen framåt redigera

Räkneexemplet ovan pekar på att det kommer ta väldigt lång tid innan alla bot-artiklarna är åtgärdade. Om vi tänker ett något mer realistiskt scenario (50 använder per vecka som lägger 5 timmar per vecka på det) så pratar vi om 20 år till och att vi (räknat från att de skapades) under ett kvarts sekel (sic!) kommer att ha haft artiklar fyllda med felaktigheter, missvisande och irrelevant information och egen forskning.

Argumenten för att radera är främst att vi som uppslagsverket inte medvetet och uppsåtligen ha artiklar publicerade som vi vet potentiellt missleder och desinformerar våra läsare och att det är orimligt att sätta lägre krav på botskapade artiklar. Yger nämner två argument för att inte radera artiklar, nämligen att koordinater är värdefulla och att det går att länka och det finns också argumentet att artiklar går att förbättra.

Finns det någon lösning som gör att båda sidors önskan tas till vara?

Bara för att slänga fram ett förslag; kan vi göra alla botskapade artiklar till mjuka omdirigeringar till Wikidata med en vänlig text i stil med ”Wikipedia saknar idag en artikel om denna plats. På Wikidata finns information om platsen. Skapa gärna en artikel om platsen (redigeringslänk)”. Då finns historiken kvar (man kan skapa en ny artikel utifrån den utan att behöva besvära en administratör), läsaren får tillgång till korrekt information på Wikidata (men slipper missvisande och felaktigt nonsens från oss) och det är samma möjligheter att lätt fixa till artikeln för den som önskar.

Detta är lite okonventionell men ett mycket mindre allvarligt brott mot hur vi brukar göra än att acceptera att vi i ytterligare 20 år kommer ha mängder av artiklar som inte lever upp till de mest grundläggande krav på vad ett uppslagsverk är.

En av våra duktiga botägare kan säkert ta fram automatiskt uppdaterade listor över exempelvis artiklar om Mexico som omdirigeras till Wikidata för den som vill hitta dem. Då tillgodoser vi alla intressen. ArildV (diskussion) 4 april 2024 kl. 12.32 (CEST)Svara

Jag ser att idén i sig håller. Men frågan är om det är bra att byta dagens icke-bra mot något annat icke-bra. Dessa bot artiklar gör ingen större skada och ingen stressa åtgärda. Vem vet kanske abstract wikipedia kommer passa utmärkt för att detta sortiment, och då skapa bra artiklar istf icke-bra. Eller om ytterligare fem år kanske AI kan vara något som fixar till detta? Yger (diskussion) 4 april 2024 kl. 13.18 (CEST)Svara
En liknande lösning är det jag föreslår ovan, att ostädade artiklar ersätts med stubbar som helt bygger på WD-mallar. För att något av alternativen ska vara en reell förbättring krävs dock att WD-objekten är ordentligt källbelagda. Hur gör vi när det inte är fallet? //Essin (diskussion) 4 april 2024 kl. 13.18 (CEST)Svara
Jag tycker att även denna situation är ett argument för min idé att etablera en inkubator-namnrymd. Artiklar som inte har kvalitet nog för publicering, men som har potential i kraft av dess relevans, skulle vi kunna flytta dit. Det gäller då bland annat ej botsanerade artiklar. Skulle det inte vara värt att pröva idén? Stigfinnare (diskussion) 4 april 2024 kl. 16.18 (CEST)Svara
Har det inte etablerats konsensus kring förfarandet att istället för att bara radera en nyskapad artikel som inte håller måttet i ett eller flera avseenden, men som ändå har potential i kraft av artikelsubjektets relevans, flyttas en sådan artikel till en undersida till användarsidan för den användare som skapade artikeln? Se Wikipedia:Bybrunnen#Kategori_som_möjliggör_rensning_av_artiklar_flyttade_utan_omdirigeringar_till_användarundersidor?.
Detta förfarande borde väl även kunna tillämpas när artikeln är skapad av en robot som Lsjbot. Om man vill kan man flytta artikeln till en undersida som har strängen "/Inkubator/" i sökvägen för att den inte ska blandas ihop med "/Dubbletter/" som också finns som undersida till Lsjbot.
-- Larske (diskussion) 4 april 2024 kl. 17.48 (CEST)Svara
Jag är inte säker på att det är det bästa sättet, men om det blir av är det viktigt att skriva ner WD-objektet som artikeln var kopplad till, t ex tillsammans med utkommenterade kategorier. Det har krävt mycket jobb att koppla artiklar till rätt WD-objekt och det är inte alltid det går att spåra via cebWP eller Geonames-ID.
(Dubblettsidorna ligger faktiskt under "/Dubletter/" med ett b.) //Essin (diskussion) 4 april 2024 kl. 19.10 (CEST)Svara
Jag funderar på om det inte är bäst att gå på @Essins linje här. Göra om artiklarna till stubbar med bara en databox skapad från WD. I den boxen väljer vi ut de rubriker som vanligtvis visas korrekt, men inte de som brukar vara felaktiga (det blir olika för olika objekttyper, såsom orter, kommuner eller öar). Risken för felaktigheter minimeras då i det vi löser, men finns kvar i WD. På detta sättet behålls artiklarna, kopplingen till WD, historiken och städarbetet kan gå andra hållet mot fullständiga artiklar från minimala boxar. Gör vi enligt @ArildVs förslag, som också är bra, så kommer vi att leda läsarna till ett format de inte känner igen och där kommer de genast se även alla felaktigheter som importerats dit från artiklar.
En annan sak är att när vi har några genomtänkta alternativ (Essins, ArildVs, Advilles förfining ovan, Behåll, radera helt), så bör vi lägga upp dessa på Bybrunnen för gemenskapen att se, läsa våra argument kortfattat och vara med i diskussionen hur vi skall gå tillväga. Adville (diskussion) 4 april 2024 kl. 19.22 (CEST)Svara
Klokt @Adville. Och jag kanske har överskattat information som finns på Wikidata, om den också präglas av felaktigheter är kanske Essins (med fleras) förslag bättre som kompromiss. Är det genomförbart med en bot?
Jag tänker också att förslagen radera och radera+flytta till annan namnrymd egentligen är samma förslag. Det är ju redan etablerat att undermånliga artiklar med potential kan läggas som undersidor.
Så egentligen kanske det är tre tydliga förslag; radera, ersatt alla information i artiklar med en korta stubbar byggda på WD samt att låta allt fortsätta som idag.
--ArildV (diskussion) 5 april 2024 kl. 17.16 (CEST)Svara
Jag vill då komma med ett fjärde förslag. Rensa allt fluff ur artiklarna (botjobb) och låt "stommen" vara kvar. Då har vi kommit en bra bit på väg och det blir lättare att förbättra artiklarna. Jag rensade för flera år sedan bort "I trakten av X finns ovanligt många namngivna Y". Jag tror inte på att basera stubbar på WD, för det finns alldeles för lite data i WD, i de flesta fall bara det data som kommer från botskapade artiklar. Då blir det rundgång. Kitayama (diskussion) 5 april 2024 kl. 17.38 (CEST)Svara
Jag tycker inte att vi ska se de olika förslagen som ömsesidigt uteslutande utan som angreppssätt som kan kombineras på olika sätt. WD-baserade faktarutor (eller det mer långtgående förslaget om WD-baserad brödtext och kategorier) skulle som du säger inte fungera överallt i nuläget med rimliga krav på källor och artikellängd, men för många typer av artiklar finns källbelagd officiell statistik på WD så en generell WD-faktarutamall skulle innebära en märkbar minskning av städbehovet. Nedkortning av brödtexten gör jag ofta för hand (med redigeringskommentaren "delvis botstädning") när jag uppdaterar något i en botartikel (t ex namn, administrativ tillhörighet o dyl) utan att ha tid att förse den med bättre källor än Geonames. Om detta kan göras i alla botartiklar med bot skulle det snabba upp städprocessen märkbart. Och även om jag tycker att det är för sent att göra urskillningslös radering nu finns det avgränsade artikelserier där jag tycker att det kan vara aktuellt, t ex orter och administrativa enheter som trots ansträngningar inte har gått att identifiera i officiell statistik, insjöar i Kanada vars frWP-artiklar av allt att döma är plagiat, vattendrag i Burundi som bara iw-länkas till substubbar på swahili mm.
Vi måste också tänka på framtida uppdateringsbehov. Det är inte bara folkmängder som ändras, utan administrativa indelningar görs om, flygplatser läggs ner etc. Är det acceptabelt att vissa artikelsortiment "för all framtid" är helt WD-genererade för att minska uppdateringsbehovet på svWP? Ett lämpligt första steg är kanske fler autogenererade åtgärdskategorier som identifierar diskrepanser mellan geobox-parametrar och WD?
Om botartiklar ligger kvar i artikelnamnrymden i någon form kan de också ligga kvar i artikelkategorier (men måste inte, strikt taget). Det har både fördelar och nackdelar: för det första, om kategoristrukturen ändras uppdateras det löpande i artiklarna så att det inte behöver fixas när artikeln "uppgraderas" med människoskapat material, men det innebär å andra sidan mer arbete när någon vill ändra kategoristrukturen – för det andra, kategorier kommer inte att tömmas för att senare återställas, men å andra sidan kommer många kategorier att bli liggande mycket länge med (nästan) bara botstubbar i sig. Om kategorierna ska genereras av en WD-mall behövs antagligen handpåläggning i mallkoden för att skapa "lagom stora" kategorier utifrån WD-egenskaperna. //Essin (diskussion) 8 april 2024 kl. 11.02 (CEST)Svara
Jag kanske var "sen på bollen" och gjorde inlägget ovan när diskussionen redan hade dött ut, men finns det verkligen inget mer att säga om detta? Jag tycker att oavsett vad vi gör sen skulle det underlätta botstädningen betydligt om vi kan ta bort marktäcke- och klimatdata, Viewfinder Panorama-beräknade höjduppgifter, närmaste ort eller berg mm från alla botartiklar med bot enligt Kitayamas förslag, men det kräver tydlig konsensus. //Essin (diskussion) 29 april 2024 kl. 13.07 (CEST)Svara

Artiklar som bara har iw till ceb och Commons redigera

Petscan räknar Commons som en iw-länk, så en del artiklar har blivit kvar som har en Commonskategori med några bilder men inga länkade Wikipediaartiklar utom cebuano. Ska vi ha kvar dem för att någon människa åtminstone har brytt sig tillräckligt för att skapa Commonskategorin, eller radera för att sannolikheten att det ska gå att hitta goda källor enkelt är låg? //Essin (diskussion) 10 april 2024 kl. 19.31 (CEST)Svara

Jag har noterat detta i mitt städarbete och jag har gjort individuella bedömningar. I vissa fall är det ett relevant objekt, i vissa fall inte. Jag har nog raderat "hälften" av de jag har stött på. Detta är vanligt för naturgeografi, i synnerhet för berg, i vart fall de fall jag stött på. Kitayama (diskussion) 10 april 2024 kl. 19.38 (CEST)Svara
Aha, jag visste inte att det var en individuell bedömning. Då låter jag artiklarna ligga kvar tills vidare. Hur bedömde du vilka som var relevanta? //Essin (diskussion) 11 april 2024 kl. 13.37 (CEST)Svara
@Essin Jag tittade på karta och Commons-bilder för att bedöma dels om det var rätt (ganska ofta inte samma plats som botartikeln), dels om platsen verkade relevant för en egen artikel. Men det är nog en bråkdel av aktuella artiklar som jag tittat på. Kitayama (diskussion) 27 april 2024 kl. 15.34 (CEST)Svara
https://petscan.wmflabs.org/?psid=28120163 1481 stycken Kitayama (diskussion) 27 april 2024 kl. 15.42 (CEST)Svara
Hmm, jag får intrycket att vissa länder är överrepresenterade (Storbritannien, Österrike, Tjeckien mfl) mer än vad som kan förklaras av folkmängd och enstaka wikianvändares vanor, och gissar att det är vanligt i dessa länder att göra utflykter till bergstoppar, sjöar etc för att ta foton. Om det finns en sån kultur kanske det också finns en marknad för guideböcker och liknande som kan användas som källor, men det gäller ju att hitta dem också...
Utifrån några stickprov verkar det som att Commonskategorierna ibland är användbara för att hitta ett bredare ämne som artikeln kan utvidgas till (t ex om sv/ceb har en artikel om ett minnesmärke, övriga WP-versioner en artikel om byggnaden eller parken som minnesmärket står i) eller ett snävare ämne som kan länkas till med {{interwiki extra}} (t ex om sv/ceb har en artikel om ett berg, övriga WP-versioner en artikel om en borgruin eller ett utsiktstorn på berget). //Essin (diskussion) 29 april 2024 kl. 12.40 (CEST)Svara