Wikipediadiskussion:AutoWikiBrowser/Typos

Aktiva diskussioner

CD -> cdRedigera

Man ska ju skriva cd inte CD men i en början av en mening ska man väl sriva Cd eller? Kan någon fixa typot? -Josve05a (d | b) 4 augusti 2010 kl. 22.29 (CEST)

Man ska inte använda AWB:s stavningskontroll utan att kontrollera varje ändring. Det går att fixa stavningar manuellt innan man sparar. Jag tror nog att det räcker istället för att krångla med den här listan. /Grillo 4 augusti 2010 kl. 23.51 (CEST)
Jag vet, men det skulle underlätta en del. -Josve05a (d | b) 4 augusti 2010 kl. 23.54 (CEST)
Jag tänkte att man aldrig skulle skriva CD i början av en mening när jag skapade det. Men det kan inte förekomma så ofta, så ändra det bara när det kommer. Annars är det väl inte en särskilt viktig ändring så du kan radera det helt om det kommer ofta. tetraedycaltetraedycal 6 augusti 2010 kl. 14.52 (CEST)
Efter att ha kört ett antal kontroller verkar det som om en stor andel av artiklarna (uppskattningsvis 20-30%) innehåller CD där det är tveksamt om CD verkligen ska gemeniseras. Nån helt tydlig riktlinje saknas för när den gemena varianten är korrekt och när den versala varianten hellre bör användas. Jag har därför avaktiverat dessa tills vidare. ~ Dodde 23 oktober 2010 kl. 13.18 (CEST)

Nazi-Tyskland -> NazitysklandRedigera

Varför får man inte skriva Nazi-Tyskland? Det ändras till Nazityskland. Mvh /rrohdin 6 maj 2010 kl. 18.43 (CEST)

Det vanliga sättet att skriva är såvitt jag vet Nazityskland, se till exempel artikeln Nazityskland. Nazi-Tyskland är en tillkrånglad version med bindestreck. tetraedycaltetraedycal 6 maj 2010 kl. 19.53 (CEST)
Även om det är vanligare att skriva ihop är det väl inte fel att skriva med bindestreck, som exempelvis Stockholms universitet gör här? [1] Det kan finnas stilistiska skäl bland annat. /rrohdin 6 maj 2010 kl. 19.58 (CEST)
Okej, det är borttaget [2]. tetraedycaltetraedycal 6 maj 2010 kl. 20.36 (CEST)

Processa -> BearbetaRedigera

I en dator bearbetar man data. I de flesta fall så bearbetar man, på svengelska processar man. Känner inte till något område där processa används som annat än slang/svengelska. Vore det OK att lägga in en sådan ersättning här? Moberg 5 augusti 2010 kl. 06.08 (CEST)

Var? Automatersättning? Absolut inte, processa betyder att driva en juridisk process, ibland i överförd betydelse att tvista med någon.--FBQ 5 augusti 2010 kl. 15.49 (CEST)
FBQ har givetvis rätt. Utan att förstå sammanhanget kan jag inte understödja förslaget. Fernbom2 5 augusti 2010 kl. 19.11 (CEST)

VM, EM, SMRedigera

Kan man byta ut "mästerskap" mot VM, EM resp. SM för att skapa några nya ersättningar av de två som heter "mästerskap-" och "-mästerskap"? Moberg 5 augusti 2010 kl. 06.16 (CEST)

Vad tänker du att de ska åtgärda? Hursomhelst så spelar namnen ingen roll egentligen, så länge det bara finns en med varje namn. Bara att ändra mao. tetraedycaltetraedycal 6 augusti 2010 kl. 14.52 (CEST)

Har en till förresten: Celsius ska alltid skrivas med stort C; celsius är alltså fel. Moberg 5 augusti 2010 kl. 06.16 (CEST)

Hmm, är det inte så att enheter som bygger på namn skrivs med stor bokstav när de förkortas, men med liten när de skrivs ut? Eller är Celsius ett undantag? /Grillo 5 augusti 2010 kl. 13.22 (CEST)
Jag trodde som Grillo... men nu är jag osäker. Jag tog fram min gamla TEFYMA (tryckt 1971); och där ges övriga enheter med liten bokstav och utan tecken (bl. a. K för "kelvin"), medan däremot de äldre temperaturenheterna betecknas med en liten ring före; alltså som oC respektive oF; och på det enda ställe där någondera skrivs ut i ord, står det faktiskt "grad Celcius". Min gamla teknik-fysik-matematiktabell verkar alltså att ge Moberg rätt; fast det kunde vara värt att titta på några andra och kanske modernare källor, också. Jörgen B 5 augusti 2010 kl. 17.27 (CEST)
Jodå det är ett undantag, man ska alltid skriva grader Celsius med stort C, [3]. Moberg 6 augusti 2010 kl. 12.30 (CEST)

Mästa -> mestaRedigera

Skulle någon kunna lägga till rättning av mästa till mesta? finns väl inget ord som stavas mästa? Evalowyn|Säga hej? 6 augusti 2010 kl. 00.46 (CEST)

Snart   Fixat -Josve05a (d | b) 6 augusti 2010 kl. 00.52 (CEST)
Klart! <mall>(Man måste starta om AWB (Tror jag) för att det ska fungera) -Josve05a (d | b) 6 augusti 2010 kl. 00.55 (CEST)
Använd CTRL+R för att uppdatera filtret. tetraedycaltetraedycal 6 augusti 2010 kl. 14.52 (CEST)
PGA ordet mesta så vill AWB att ordet mästare stavas mestare! -Josve05a (d | b) 6 augusti 2010 kl. 15.19 (CEST)

m.ö.h./möh... -> m ö.h.Redigera

Det finns flertalet förkortningar av meter över havet som är felaktiga här på svenskspråkiga Wikipedia. Skrivreglerna rekommenderar att man skriver ut förkortningar, men denna förkortning används ofta på ställen/sätt att det inte alltid bara är att skriva ut förkortningen. Kan man därför fixa så att olika kombinationer av möh med punkter och mellanslag mellan bokstäverna blir till m ö.h.? Elfsborgarndisk. 10 augusti 2010 kl. 15.41 (CEST)

Varför blandar man mellanslag och punkter i den förkortningen? Är det verkligen så man brukar göra? Moberg 10 augusti 2010 kl. 20.27 (CEST)
Både Språknämnden och Nationalencyklopedin använder m ö.h. som förkortning. Jag vet dock inte varför det är som det är. Kan dock tänka mig att det har med enheter att göra. Jag kan inte komma någon internationell enhet som skrivs med punkt. Eller finns det någon sådan? Elfsborgarndisk. 10 augusti 2010 kl. 21.38 (CEST)
Jaha, jo det är nog för att det är meter som förkortas. Såg lite konstigt ut i anslutning till ö.h. bara. Jag tycker det låter som ett bra förslag, men är inte så hemma på regexp :P Moberg 10 augusti 2010 kl. 23.43 (CEST)
[4] nån får gärna prova den. tetraedycaltetraedycal 11 augusti 2010 kl. 01.57 (CEST)
Jag har nu kört ett antal redigeringar (för övrigt mina första med AWB någonsin) och har funnit att det kan dyka upp en bugg när det är förkortat m.ö.h, (Berget, som når 426 m.ö.h, är Sveriges sydligaste höjd över 400 m.) Då jag bara stött på problem en enda gång var det inga problem och jag kunde bara skriva ut förkortningen. Jag undrar dock om den registrerar om det inte är något mellanslag. Jag upplever det nämligen som om den missar förkortningen möh Elfsborgarndisk. 11 augusti 2010 kl. 12.13 (CEST)
Något som slog mig nu. Går det att lägga in ett hårt mellanslag mellan m och ö (allt för att inte få förkortningen uppdelad på två rader)? Elfsborgarndisk. 11 augusti 2010 kl. 13.08 (CEST)

Håller på att gå igenom Kategori:Berg och dess underkategorier, och deras underkategorier och... Josve05a (d | b) 12 augusti 2010 kl. 14.58 (CEST)


Såg att m ö.h togs bort för att punkten ger träffar på alla tecken. Ska inte <Typo word="m ö.h." find="\bm\.ö\.h\. " replace="m ö\.h\." /> fixa det problemet? -Laxskinn 7 november 2011 kl. 12.12 (CET)

Ja, \. eller [.] träffar punkt, men jag tog också bort raden eftersom det redan finns en rad för m ö.h. som verkar hantera felskrivningen korrekt nu (se Inteloutside2:s diskussionssida), inklusive den som den borttagna raden avsåg att fixa. Beklagar otydligheten i kommentaren till min redigering av sidan. ~ Dodde 7 november 2011 kl. 20.16 (CET)

å, ä och ö ändras till a, a och o i kategorilänktextRedigera

Jag har rapporterat buggen på [5]. ~ Dodde 24 oktober 2010 kl. 07.05 (CEST)

AfghanistanRedigera

Kan jag få hjälp med att lägga in Afghanistan? Det finns massor av felstavningar på detta ord (som Afganistan). Sjunnesson 27 oktober 2010 kl. 09.06 (CEST)

Jag har nu själv lagt in ordet på "nya ord". Meddela mig om det blev fel. Sjunnesson 29 oktober 2010 kl. 16.37 (CEST)
Toppen att du lägger till ord! Inget fel, men finjusterade lite så att sammansättningar (otestat) inte tas med, enligt hur andra namn på länder är inskrivna. Om sammansättningar ska ge träff kanske vi får fundera på. ~ Dodde 31 oktober 2010 kl. 17.49 (CET)

Verktyg för att skapa lista över artiklar med typos...Redigera

...efterlyses. Någon som har en lösning? ~ Dodde 29 oktober 2010 kl. 17.14 (CEST)

Hittade funktionen i AWB nu :) "Wiki database scanner" kan generera en lista över alla sidor som innehåller typos enligt denna sida. Den hittade över tiotusen :S. Jag vet inte om den tar med sidor som ger match men som inte ändrar något. ~ Dodde 17 november 2010 kl. 19.03 (CET)

Frågor om Finland, Österrike och Dominikanska [Rr]epublikenRedigera

Vad gör Finland och Österrike speciella så att de inte tas med bland andra länder?
Många flerordiga namn på länder använder versal på alla ingående ord. Gäller detta inte för Dominikanska R/republiken? Finns det isåfall nån riktlinje för stavningen, stort eller litet R? ~ Dodde 31 oktober 2010 kl. 18.08 (CET)
Svenskspråkiga Wikipedia brukar ofta använda TT-språket som riktlinje för hur man bör skriva. TT, tillsammans med SAOL, UD och NE, använder stavningen Dominikanska republiken. Detta gäller för övrigt även Centralafrikanska republiken. Elfsborgarndisk. 31 oktober 2010 kl. 18.56 (CET)
Innebär det att Dominikanska Republiken då bör ändras till Dominikanska republiken på denna sida? Har svårt att bedöma hur grovt felet är. Om det är fråga om skrivregelbrott eller bara olikhet i tycke och smak. ~ Dodde 31 oktober 2010 kl. 19.18 (CET)
Jag anser att man här på Wikpedia bör skriva namnet likadant som i artikeln. (Stavningen Dominikanska republiken stödjs ju även av flera tunga auktoriteter.) Elfsborgarndisk. 31 oktober 2010 kl. 19.59 (CET)
Ok, har ändrat nu. Då återstår frågorna om Finland och Österrike. Om ingen ser nån anledning till varför deras regex ser annorlunda ut lägger jag in dem bland de andra länderna. Det lär väl uppdagas i sinom tid om det fanns nån anledning att särbehandla dem. ~ Dodde 31 oktober 2010 kl. 20.32 (CET)
Jag har korrigerat Finland och Österrike. När det gäller Finland var nog avsikten med det tidigare uttrycket att undvika träff för ordet finlandssvensk, men det undviks ju även med ett uttryck liknande det som används för de andra länderna. När det gäller Österrike blev det nog nästan aldrig träff med det tidigare uttrycket. Svensson1 (disk) 15 september 2013 kl. 14.25 (CEST)

Fråga om böjningsformer och symbolerRedigera

Jag är litet osäker på hur man gör för att göra rätt om man eventuellt lägger in nya ord här. När det gäller böjningsformer lade man alltid in sådana i Doddebot/stavning, men här ska man kanske inte göra det? Men jag hittade ett exempel där två böjningsformer verkar vara inlagda inom parentes, <Typo word="Artificiell" find="\b(A|a)rtificell(a|t)\b" replace="$1rtificiell$2" /> alltså artificiella, artificiellt? Det gäller också <Typo word="Professionell" find="\b(P|p)roff?ess?ionell?(\W|a|t)" replace="$1rofessionell$2" />. Här undrar jag också vad symbolen (\W| betyder. Tacksam för svar. Sjunnesson 13 november 2010 kl. 17.04 (CET)

Jag implementerade inte stöd för regular expressions i min stavningslista. Därför var man tvungen att ange alla tänkbara former vart och ett för sig. Här stöds det dock och det finns ett antal tecken man kan använda sig av för att inkludera och exkludera ord. Det är lätt att bli blind när man skriver formeln, så många rader kan förbättras till att inkludera mer, även om sådant som kan innebära en rättstavning fortfarande exkluderas. Stora och små bokstäver räknas som olika tecken. "(A|a)rtificell(a|t)\b" inkluderar Artificella, artificella, Artificellt och artificellt. Självklart ska även Artificell och artificell inkluderas, och jag missade detta. För att få med detta ska uttrycket vara "(A|a)rtificell(a|t)?\b". Den första parentesen ersätts av $1 i replace, den andra parentesen ersätts av $2 osv.. Frågetecknet anger att tecknet (eller helar parentesen) till vänster kan, men inte behöver, matchas. \b betyder "word boundery" och markerar början och slutet på ett ord. Finns \b med i slutet innebär det att sammansättningar med find-strängen exkluderas, medan avsaknaden av \b gör att sammansättningar med find-strängen inkluderas i sökbegreppet. \W betyder "non-word"-character. Det kan användas ungefär som \b, men personligen tycker jag att \b ger ett renare uttryck (utom då \W behövs mitt i ett uttryck, vilket är sällan). Jag brukar byta ut \W mot motsvarande kod med \b när jag ser \W användas, liksom det görs på engelska Wikipedias motsvarande lista. Anledningen till \b i slutet av uttrycket är för min del att jag inte kommer på några sammansättningar med artificiell och tar därför det säkra före det osäkra att inte inkludera sammansättningar som skulle kunna vara rättstavningar av något annat som jag inte tänkt på. Jag försöker tänka vilka möjliga felstavade ord jag vill få med och inkludera dessa, men inga andra. "\b(P|p)roff?ess?ionell?(\W|a|t)" inkluderar (med varianter) -sionell, -sionella(+sammansättningar), -sionellt(+sammansättningar). Jag skulle ändra denna till att inkludera de former jag kan komma på (genitiv i och med dess möjliga substantiverade variant): -sionell, -sionells, -sionella, -sionellas, -sionellt och ge söksträngen uttrycket "(P|p)roff?ess?ionell?(s|as?|t)?\b". Samma sak som med artificiell kommer jag inte på några sammansättningar och avslutar därför med \b. ~ Dodde 14 november 2010 kl. 02.01 (CET)
Tack för den utförliga förklaringen. Förut kände jag mig osäker, men nu kanske jag kan våga lägga in fler ord som jag kommer på. Sjunnesson 14 november 2010 kl. 08.32 (CET)
Låter bra! :) ~ Dodde 14 november 2010 kl. 13.01 (CET)

ViketRedigera

Vad tror du om att lägga in 'viket' i listan? Jag har hittat 56 sådana "felstavningar" för 'vilket' just nu. Problemet är att det finns ett ord 'viket' (böjningsform av 'vika') men den betydelsen finns inte i någon av de här 56 felen. Men det kanske är oförsiktigt (felaktigt) att lägga in ett ord som i princip skulle kunna vara rätt? Sjunnesson 15 november 2010 kl. 13.21 (CET)

Eller finns det något sätt att lägga in det efter ett komma /, viket/, för i ungefär hälften av fallen föregås 'viket' av ett komma. Sjunnesson 15 november 2010 kl. 13.28 (CET)
Jag tycker att 'viket' verkar vara ett lämpligt ord att ha med i listan, trots att det teoretiskt finns risk för att AWB föreslår en felaktig ändring. Det går inte att få listan 100% vattentät. Varje ändring ska ju också kontrolleras manuellt innan ändringarna sparas. Jag hade önskat att man skulle kunna markera undantagsartiklar för specifika felstavningar, så man inte behöver ställas inför samma felaktiga ändringsförslag från AWB gång på gång på gång, men någon sådan funktion finns inte, vad jag känner till. ~ Dodde 15 november 2010 kl. 23.09 (CET)
Tack för svaret på min fråga. Jag har nu lagt in 'vilket' - 'viket' under Nya ord. Sjunnesson 16 november 2010 kl. 08.08 (CET)

Abort -> AbborreRedigera

Har två gånger råkat ut för att AWB vill översätta "Abort-lag" (eller annan ändelse) till abborre.. någon skicklig som kan fixa detta? Evalowyn|Säga hej? 29 november 2010 kl. 13.38 (CET)

Och precis nu ville den översätta "aborginskt" till abborrginskt.. Evalowyn|Säga hej? 29 november 2010 kl. 13.39 (CET)
  Fixat [6] Ibland blir det inte som man tänkt sig. Tack för upplysningen! (aborginskt är också en felstavning så jag lägger till den också) ~ Dodde 30 november 2010 kl. 05.06 (CET)

Neutrer i bestämd form pluralRedigera

Skulle man kunna lägga till ord som klostrena, numrena, tecknena, seklena, fönstrena och så vidare, som ofta får ett a för mycket på sig? Smiddle 5 december 2010 kl. 16.26 (CET)

Tror det är svårt att hitta ett uttryck som träffar alla de du avser, men som inte träffar korrekta stavningar av ord. ("\b(\w{3,5})([rln])ena\b" träffar t.ex. äpplena). Vanligast kommer detta extra-a till substantiv som har nollplural och som slutar på -er, -el och -en (som dina exempel gör), men det förekommer även för en uppsjö andra ord fast mer sällan (krigena, pärona, syskona) och med en än mer vardaglig prägel. Hur som helst får man nog ange vart och ett av de ord man vill rätta till, eftersom ett allmänt uttryck skulle ge alltför många felaktiga träffar. Har lagt till de orden du nämnde. [7] ~ Dodde 6 december 2010 kl. 16.07 (CET)

VietnamnRedigera

Jag är inte så bra på att skriva in hur olika ord ska korrigeras. Det jag har tänkt när jag skrev in Vietnam är dels att få bort den felaktiga stavningen Vietnamn och även att skivning med gemen, t.ex. vietnam, korrigeras. Var snäll och ändra det jag har lagt in (som troligen inte är korrekt skrivet) så att det fungerar som tänkt. Sjunnesson 15 december 2010 kl. 09.11 (CET)

  Fixat [8]. Om du vill kan du bara ändra word= till disabled= om du är osäker (så tas inte ändringen i bruk) och eventuellt lämna en <!-- kommentar --> till bidraget om du vill förtydliga vad du försökt få med, så fixar jag eller nån annan det när vi ser de nya bidragen. :) ~ Dodde 15 december 2010 kl. 16.43 (CET)
Tack för det! :) Sjunnesson 17 december 2010 kl. 11.59 (CET)

OstasiatiskRedigera

Jag vill ge ett svar på den allmänna fråga som är ställd under ordet 'östasiatisk' om östasiatisk resp. ostasiatisk:
"Är Ostasien verkligen felaktigt? SAOL har med både ostasiatisk och östasiatisk"
Vad jag kan förstå är båda rätt. Sjunnesson 17 december 2010 kl. 12.12 (CET)

Tack. ~ Dodde 20 december 2010 kl. 15.49 (CET)

Bysantisk, Bysantiska riketRedigera

Hur ska man ändra i 'bysantinsk' så att även felstavningen 'byzantisk/bysantisk' kommer med? Stavningen 'bysantisk' finns inte i SAOL. Denna fråga gäller även Bysantinska riket, som inte stavas Bysantiska riket (enligt NE). Sjunnesson 20 december 2010 kl. 08.20 (CET)

Dessa träffas redan av uttrycket. [sz] innebär träff för stavning med "s" eller "z" och n? innebär träff för stavning med eller utan "n". ~ Dodde 20 december 2010 kl. 15.49 (CET)
Bra! Som du har sett jag inte lärt mig att klara av alla symbolerna i AutoWikiBrowser/Typos på rätt sätt ännu, men jag lär mig nog. Och när det gäller Bysantinska riket har jag nu skrivit in det under nya ord efter mönster av hur 'bysantinsk' är skrivet, men jag tror också att jag har skrivit Bysantinska riket så att det ska börja med versal. Jag hoppas att det blev rätt nu. Sjunnesson 21 december 2010 kl. 08.05 (CET)
Jaha. Då missförstod jag. Jag har genomfört en massa felaktiga ändringar isåfall. säkert 20 talet. Borde kanske inaktivera dessa båda regex helt och hållet tills detta är ordentligt utrett? Fanns det ett bysantiskt rike som heter Bysantinska riket, eller vad är det fråga om? Inte bra att ha med sådana felskrivningar med så komplicerade regler i en allmän lista som denna. ~ Dodde 22 december 2010 kl. 00.59 (CET)
Ja, det fanns ett sådant rike. Bysantinska riket är bl.a. beskrivet i Nationalencyklopedin. Sjunnesson 22 december 2010 kl. 07.51 (CET)
Om det fanns ett bysantinskt rike borde det väl ha funnits andra bysantinska "saker", kan man ju tycka... ~ Dodde 22 december 2010 kl. 08.00 (CET)
Ja, Nationalencyklopedin skriver även om 'bysantinsk artitektur', 'bysantinsk konst' o.s.v. Se även svwp Bysantinska riket (även kallat Bysans). Sjunnesson 22 december 2010 kl. 08.08 (CET)
Gosh, undrar hur många av de hundratals uppslag man ändrat på som borde återställas. ~ Dodde 22 december 2010 kl. 11.12 (CET)
Ytterligare en sak om Bysantinska riket. Jag har märkt att det, förutom Bysantinska riket, även skrivs 'det bysantinska riket'. Där är det ju rätt att skriva 'bysantinska' med gemen i det sammanhanget, precis som när man t.ex. skriver 'det svenska riket'. Och jag fick se ytterligare en sak när jag kollade Romerska riket/romerska riket i Nationalencyklopedin; de är tydligen inte konsekventa. De skriver 'romerska riket' med gemen, fast de har skrivit 'Bysantinska riket' med versal. Men Romerska riket är vi tydligen mer konsekventa att skriva med versal på svwp. Det överhuvud vanligaste på Internet är att man skriver Romerska riket eller Romarriket med versaler. Jag ville bara nämna det här, när jag nu har sett hur tillkrånglat det kan vara med sådana här riken. Kanske är det bäst att helt stryka Bysantinska riket från den här listan och bara låta 'bysantinsk' sköta rättstavningskontrollerna? Sjunnesson 22 december 2010 kl. 16.59 (CET)
När det står 'det Bysantinska riket' har jag nu manuellt börjat ändra den skrivningen genom att ta bort 'det' så att det bara blir Bysantinska riket, eftersom det annars blir "tårta på tårta". Alternativet är att ändra B till b. Tyvärr visade sig den nämnda varianten förekomma så pass ofta att jag får avstå från att ändra den. Nog om detta. Sjunnesson 22 december 2010 kl. 17.47 (CET)
Det bör vara två regex, och det ena utesluter inte det andra, och ställer inte till det för varandra, om det bara i regex går att urskilja när stavningen ska vara med och när stavningen ska vara utan "n". Det är orimligt att kräva att personer som använder AWB mer sporadiskt att göra den bedömningen vid varje påträffat fall och därför isåfall inte lämpligt att över huvud taget ha med någon av dessa i listan. Det känns dessutom, med frågetecknen som uppstått, tveksamt att ha med någon av dessa utan flera källor på hur det verkligen ligger till. Jag skulle gärna vilja ha en resonerande förklaring till varför det bör vara si eller så, inte bara konstaterande om förekomst i NE, SAOL eller likvärdiga källor. Jag har lämnat meddelande på IntelOutside2:s diskussionssida om diskussionen, eftersom det var han(? :)) som ursprungligen la till typot på Doddebot/Stavning. Hoppas på mer klarhet :) ~ Dodde 22 december 2010 kl. 18.10 (CET)
Det ska väl aldrig någonsin skrivas utan "n"? Jag kan inte se att någon i diskussionen förespråkar det, eller lyckas jag missa något? /Inteloutside2 22 december 2010 kl. 21.08 (CET)
Det är i många fall svårt att ge ett resonerande svar, eftersom man ofta inte vet (eller kan gissa) grunden till att det (t.ex. i SAOL) har bestämts att vissa sätt att skriva eller stava är det riktiga. Som Inteloutside2 skriver ska aldrig bysantinska skrivas utan 'n'. Det enda skälet som kan ges till det är väl att det inte finns den stavningen (utan 'n') i SAOL. Och den publikatiotionen har ju blivit någon sorts rikslikare för svensk stavning. Sjunnesson 22 december 2010 kl. 22.00 (CET)
Utgår från att anledningen till att det heter bysantinsk och inte bysantisk, är att en invånare i riket var en bysantin. Dvs det följer samma mönster som beduin - beduinsk, libertin - libertinsk, augustin - augustinsk osv /Inteloutside2 22 december 2010 kl. 22.31 (CET)
Det är nog bara jag som är virrig. Sorry. Fick som sagt för mig att stavningen skulle ske med n ibland, och utan n ibland, men eftersom det alltid ska vara med n så är det ju inte längre några konstigheter, och det innebär att det inte skett några felaktiga ändringar på grund av det regex som varit aktivt. Det är bara om man vill ändra "det Bysantinska riket" till "det bysantiska riket" (jfr "det romerska riket") och "bysantinska riket" om det inte föregås av "det" till "Bysantinska riket" (jfr "Romarriket") man behöver särskilda regex för dessa två. Att ändra "det bysantiska riket" till "Bysantiska riket" torde vara lika kontroversiellt som att ändra "det romerska riket" till "Romarriket", så det tycker jag inte vi ska göra. Nuvarande regex för "Bysantinska riket" versaliserar bysantinska utan urskiljning, och så ska det ju inte vara, så jag låter den vara fortsatt inaktiverad, medan jag aktiverar det vanliga regexet för "bysantinsk" igen. ~ Dodde 23 december 2010 kl. 17.37 (CET)

jorden, månen, etc.Redigera

Jag inaktiverade dessa tillägg. Som det var tillagt ändras Jorden till jorden även i inledningen av en mening. Versalisering säger "Vad gäller himlakroppar och astronomiska objekt skrivs solen, jorden, månen och universum normalt med gemener". Det framgår inte närmare vad "normalt" innebär, och det kanske inte är så praktiskt att ha med detta i en allmän lista, om det finns komplicerade undantag. ~ Dodde 20 december 2010 kl. 15.49 (CET)

Jag tycker att 'disabled' borde bytas mot 'word' igen, alltså att raderna aktiveras. Skäl: Jag kan inte riktigt inse vad "normalt" innebär i det här sammanhanget. Jag tror inte det kan finnas många undantag. Möjligen kan man vara litet tveksam till 'universum', där ordet ska skrivas med versal i Miss Universum (för att hela den titeln kan räknas som ett namn). Men till svenskt bruk hör att de astronomiska begreppen jorden, månen, solen, världen (alltså 'jorden') och universum inte skrivs med versal. Alla de här orden skrivs med gemener i t.ex. Nationalencyklopedin. Dessa ord räknas i svenska som appellativ och inte som egennamn och därför skrivs de med gemener. Du har ju skrivit förut att resultatet av de halvautomatiska datakörningarna kontrolleras manuellt och då ska man alltid undanta skrivningar som är korrekta just i sitt sammanhang, som i exemplet Miss Universum. Är inte det här värt att pröva? Du kan ju, om det verkar bli för många undantag, vilket jag inte tror, efter en provkörning inaktivera det här igen. Men det är ju du som arbetar med det här, så du avgör föstås vad som är lämpligt att göra. Sjunnesson 21 december 2010 kl. 09.41 (CET)
En förklaring till att jag skrev (J|j) för t.ex jorden var att jag trodde att (J|j) skulle ändra t.ex. ett felaktigt Jamaican till jamaican (och ett felaktigt Jorden till jorden). Men i stället är det väl så att (J|j) ska göra att Jamaican får börja med versal när det står först i en mening. Som du ser är jag inte särskilt hemmastadd i de här datatekniska resonemangen. Sjunnesson 21 december 2010 kl. 15.59 (CET)
Den främsta anledningen var att den regex som använts är för vid för att tas med, medan jag passade på att kommentera att jag personligen är osäker på om det finns särskilda undantag (liknande frågan om när cd ska skrivas med versaler och när det ska skrivas med gemener, eller när NATO/Nato ska skrivas Nato och när det ska skrivas NATO). Men du har troligen helt rätt i att frågan för dessa är mer komplicerad än för universum/jorden/månen osv, men blev bara lite fundersam när det stod "skrivs normalt...".
(J|j) betyder typ "J eller j (och spara strängen i $1 e.d.)", och kan lämnas oförändrad med t ex $1 (som i vanliga fall), eller bytas ut mot versal (när det gäller egennamn), eftersom egennamn alltid inleds med versal, oavsett om det skrivs först i en mening eller i mitten. För att slippa fånga in detta i en sträng brukar istället [Jj] användas, som betyder "någon av tecknen J och j". När det gäller gemenisering gäller ju inte riktigt motsvarande. J ska ändras till j, men bara när det står mitt i en mening. Jorden ska till exempel föregås av ett ord för att J ska ändras till j. Samtidigt ska egentligen det föregående ordet vara en del av ändringen. Det finns sätt att skriva ut regex på det här sättet, men jag är inte riktigt hemma på det. Tänkte nog kolla på det nån gång, om IntelOutside2 eller någon annan redan känner till hur man gör, men kanske att det inte ligger högst upp på prioriteringslistan just nu. Det finns fortfarande ca 3000 felskrivningar på Wikipedia utgående från den nuvarande listan och en hel del felskrivningar att komplettera listan med från WP:LÖVS och Doddebot/Stavning som känns snäppet viktigare, och när detta är gjort kanske ytterligare några tusen felskrivningar identifieras. ~ Dodde 22 december 2010 kl. 00.51 (CET)
Tack för upplysningarna om symbolerna. Jag förstår att det finns mycket att göra med att fixa alla felstavningar och felskrivningar, så det är klart att du måste prioritera de viktigaste sakerna. Men om du hinner ifatt kan du kanske göra något åt felskrivningar med versaler också. Sjunnesson 22 december 2010 kl. 08.18 (CET)
Det är mest att jag inte är så bra på komplicerad regex. Men ja, förr eller senare så! ~ Dodde 22 december 2010 kl. 18.10 (CET)

Sammansättningar berg-, bergs-Redigera

Beträffande de två olika sätten att sätta samman 'berg' som förled med andra ord som efterled tycks det finnas en rätt stor osäkerhet för många ord. Under bokstaven B är 'bergs-' satt som disabled, vilket jag tycker är riktigt i nuvarande läge. Jag har skrivit en kommentar även för 'bergvägg', där det finns samma typ av osäkerhet (men jag vågade inte skriva 'disabled' där). Jag har i alla fall gått igenom 'bergs-' och funnit att när det gäller 'bergskedja' och 'bergsområde' finns ingen tveksamhet i SAOL. De ord som det finns parentes kring s i SAOL är 'berg(s)knalle, 'berg(s)massiv' och 'berg(s)topp'. Mitt förslag är att vi helt tar bort dessa tre ord samt 'bergvägg' som i SAOL skrivs som berg(s)vägg. Ett andra förslag är att vi låter SAOL vara det som är normgivande för det som ska gälla i svwp, annars fastnar vi bara i diskussioner. Och med de ovannämnda fallen som exempel, tycker jag att ord där SAOL har parentes, (t.ex. 'berg(s)vägg'), ska anses som icke felaktiga i svwp. Fast jag vet ju inte hur Wikipediagemenskapen ställer sig till detta sätt att betrakta stavning. I "Wp:Skrivregler" hänvisas i alla fall till SAOL (med rätta förstås). Sjunnesson 25 december 2010 kl. 08.49 (CET)

Det står också i "Wp:Skrivregler":"Skrivreglerna bör följas om det inte finns goda skäl att göra annorlunda. I de fall då konventioner saknas måste skribenten lita på sitt eget omdöme och välja det skrivsätt som passar bäst i sammanhanget. Vid tvister gäller det som vanligt att diskutera och anföra goda argument." Det här tycker jag är helt riktigt. Just när det gäller stavning av ord bör vi kunna betrakta det som finns i SAOL som konventioner och vid fall där SAOL tvekar tar vi denna tvekan som intäkt för att inte ha med sådana ord som felstavade (t.ex. bergtopp, bergstopp; SAOL: berg(s)topp). Kan det här vara lämpligt att ha som riktlinjer? Sjunnesson 25 december 2010 kl. 09.00 (CET)
Förlåt, läste detta först nu. Därav en liten upprepning vad gäller skog(be)klädd nedan. Hur som helst. Jag anser inte att den frågan bör diskuteras här, utan på WP:SKR. Vi måste komma ihåg att det är skillnad på att själv författa en text och avgöra hur den ska formuleras, och att i efterhand gå in och ändra en text skriven av annan. Min tolkning av tidigare diskussioner och kommentarer är att "om stavningen inte är direkt felaktig (eller har en olämplig stilnivå) ska det inte ändras". Språkrådet skriver att det inte finns några generella regler, men att det finns vissa tendenser som kan uppfattas bland annat genom att titta i Saol [9]. Men vad händer om Saol inte speglar de tendenser som kan konstateras vid exempelvis googlesökningar, tidningsartikelsökningar och bokdatabassökningar? Jag är inte säker på att det i skapandet av rättstavningslistor är korrekt att alltid anta att Saol:s listade stavningar är de enda rätta. Om detta dock är ett tydligt önskemål från gemenskapens sida så för all del, men tills dess tycker jag att vi ska vara återhållssamma med liknande bidrag i listan. ~ Dodde 18 januari 2011 kl. 05.12 (CET)
Jag ser nu, när jag återigen läser det som jag skrev 25 december, att det verkar motsägelsefullt. Det var nog så att det som jag skrev inte blev det jag tänkte beträffande en mening. Jag hade skrivit "ord där SAOL har parentes, (t.ex. 'berg(s)vägg'), ska anses som icke felaktiga i svwp." Det här var något jag inte menade, det måste bero på distraktion. För jag skrev ju också: "De ord som det finns parentes kring s i SAOL är 'berg(s)knalle, 'berg(s)massiv' och 'berg(s)topp'. Mitt förslag är att vi helt tar bort dessa tre ord samt 'bergvägg' som i SAOL skrivs som berg(s)vägg." Och just detta tror jag vi är överens om, eftersom det innebär att vi godkänner t.ex. både 'bergknalle' och 'bergsknalle'. Ursäkta att jag rörde till det. Sjunnesson 18 januari 2011 kl. 13.21 (CET)
Ja, vi är överens :) ~ Dodde 20 januari 2011 kl. 12.05 (CET)

Ordet 'kasino'Redigera

Ordet 'kasino' skrivs ofta felaktigt som 'casino'. Men casino/Casino ger antagligen för många träffar (i namn bland annat). Man skulle kanske kunna lägga in pluralis 'kasinon' och bestämd form 'kasinot'. Skriver man i så fall det som två olika rader? Och skriver man "\b(C|c) inuti raden för att rätta 'c' till 'k' ? Sjunnesson 2 januari 2011 kl. 10.25 (CET)

Ja, det behövs två rader eftersom (C|c) inte kan ersättas med $1 utan med K eller k. (C|c) ska inte användas eftersom det blir en rad för gemen initial och en rad för versal initial. [10] ~ Dodde 2 januari 2011 kl. 10.35 (CET)

restaurang, restaurantRedigera

Ordet restaurang finns med regex 'resturang'. Går det också att få med felstavningen 'restaurant'? Risken är många träffar, men man kanske i alla fall kunde lägga in 'restauranten' och 'restauranter' (-na)? Sjunnesson 3 januari 2011 kl. 11.10 (CET)

Ja, det är nog rätt tänkt. Prova (R|r)est(a?urant(e[nr])|urang)(\w*) $1estaurang$3$4, kanske? Ger träff för alla ord som börjar på (eller är) resturang, restauranten, restauranter, resturanten och resturanter. (Samma som (R|r)est(a?uran[tg])(e[nr])?(\w*) $1estaurang$3$4, men detta ger även träff för det rättstavade restaurang vilket väl inte har nån jättestor betydelse). ~ Dodde 3 januari 2011 kl. 16.15 (CET)

Mexico CityRedigera

Förlåt att jag är frågvis, men jag stötte på ett problem med Mexico City. Jag har sett att det ibland skrivs Mexiko City (med k) och den rätta stavningen är rimligtvis Mexico City, som också har en rad bland Typos. Men hur gör man för att automatiskt ändra Mexiko City (där det förekommer) till Mexico City? Sjunnesson 8 januari 2011 kl. 17.36 (CET)

Bra att du såg det. Som det var förut gjordes inget undantag för staden Mexico City när landet Mexico skulle ändras till Mexiko. Har ändrat här [11]. Hoppas att det ska fungera nu. ~ Dodde 9 januari 2011 kl. 15.54 (CET)

Apropå Mexiko. Av kommentaren ovan tolkar jag det som att Mexico->Mexiko är med på listan. Är inte Mexico en stavningsvariant, och listan ska väl inte innehålla ord med stavningsvarianter? Varken [K/C]anada eller [K/C]uba står med på listan. --Lundgren8 (d · b) 16 december 2011 kl. 18.25 (CET)

parikel -> partikelRedigera

Skulle kunna läggas till. Nirmos 10 januari 2011 kl. 23.58 (CET)

Fixat! [12] ~ Dodde 11 januari 2011 kl. 16.41 (CET)

skog(be)kläddRedigera

SAOL listar ett stort antal sammansättningar med skog + binde-s, men anger skogklädd och skogbeklädd utan binde-s. Google ger dock i stort sett samma antal träffar med och utan binde-s. I vilken grad kan man påstå att det ena är mer rätt än det andra, och vad skulle resonemanget för det vara? Finns fler källor som stödjer stavning av dessa ord utan binde-s, och i vilken mån bör dessa "fixas" till på Wikipedia om en viss stavning endast förekommer i SAOL men i övrigt inte kan motiveras, men då en annan stavning till synes verkar vara minst lika vanlig och korrekt? Jag gissar att fler av de sammansättningar med skog utan binde-s som anges i SAOL kan vara föremål för samma fråga. (Jag har inaktiverat skog(be)klädd tills vidare). ~ Dodde 18 januari 2011 kl. 04.52 (CET)

Det finns ett system i hur SAOL skriver sammansättningar med skog. När det gäller skog + substantiv skriver de skogs- (med skogvaktare som enda undantag). När det gäller skog + adjektiv skriver de skog-. Två undantag finns från det sistnämnda, skogspolitisk och skogsvetenskaplig, men de två orden hänger nära ihop med substantiven skogspolitik och skogsvetenskap.
Om vi sedan ser på sammansättningar med berg- visar SAOL en rätt stor tvekan, till skillnad mot när det gäller skog-. Men när det gäller berg- har de, med två undantag, sammansättningar med "berg + substantiv" och deras osäkerhet gäller just substantiv. De två adjektiv de listat är 'bergsäker' och 'bergtagen', alltså skrivet utan binde-s
Du efterlyser fler källor än SAOL och då har vi Nationalencyklopedins ordbok. När det gäller skog- har de skogklädd som enda adjektiv. Skogbeklädd nämns inte, och inte heller andra adjektiv. Alla sammansättningar som är substantiv skriver de som skogs- med undantag av skogvaktare. NEO:s uppfattning stämmer alltså överens med den som SAOL har beträffande skog. När det gäller berg- har de också med 'bergsäker' och 'bergtagen' som adjektiv. Sammansättningar med berg som är substantiv har NEO mindre tvekan för än vad SAOL har. Man skriver bl.a. bergvägg utan att tveka. Man skriver också bergskida, bergsyra, bergtall, bergtroll, berguv, bergvind utan binde-s. Övriga sammansättningar med berg (som alltså även de är substantiv) skriver de med binde-s (utom bergsbestigare, bergsbestigning, där de tvekar). Orden 'berg(s)knalle, 'berg(s)massiv' och 'berg(s)topp', som jag nämnde förut beträffande SAOL:s inställning, finns inte listade i NEO.
Du skriver, när det gäller mitt inlägg om berg-, bergs- härovan, att man bör vara återhållsam med att lägga in sådana ord i listan. Samma problem kan man nog ha med massor av sammansatta ord. Så visst kan man strunta i det som står i SAOL och NEO när det gäller sammansättningar och bara t.ex. söka på internet och se hur vanliga olika stavningar är. Men jag antar att redaktionen för SAOL också gör sådana kontroller och försöker väga samman olika intressen. Hur vi ska göra med olika varianter av stavningar i Wikipedia har vad jag vet inte diskuterats förut, men (som du skriver) borde nog det här diskuteras på WP:SKR. Jag ser ju att problemen finns, precis som du gör, och jag känner också tvekan inför de här problemen. Det skulle inte förvåna mig om redaktionen för SAOL också kan ha besvärligt att avgöra vad som är vedertaget språkbruk. Sjunnesson 18 januari 2011 kl. 10.05 (CET)
När jag nu ordentligt har läst igenom vad jag skrev 25 december om berg- bergs- och också skrivit en kommentar till det, är det klart att jag den 25 december av misstag råkade skriva något som jag inte menade. Frågan är ju hur man ska behandla ord där inte SAOL uttrycker någon tveksamhet, men när man ändå vid en sökning med t.ex. Google kan se att uppfattningarna på Internet är synnerligen delade, så att t.ex. versionerna 'skogklädd' och 'skogsklädd' är ungefär lika vanliga.. Jag ber om ursäkt för att jag rörde till det den 25 december. Frågan om hur mycket man ska följa SAOL har jag för avsikt att ta upp på WP:SKR någon gång när jag är tillräckligt koncentrerad. Sjunnesson 18 januari 2011 kl. 13.38 (CET)
Nu har jag varit ute och fått frisk luft och känner mig koncentrerad igen. Så jag har redan nu skrivit ett inlägg på WP:SKRs diskussionssida. Delta gärna i debatten där. MVH Sjunnesson 18 januari 2011 kl. 16.02 (CET)
Intressant analys. Tack för research. Kan inte bekräfta hur sann analysen är (Språkrådet skriver att det inte "finns några särskila regler"), men det hade varit intressant att läsa mer om detta med binde-s, och vad som kan tänkas avgöra när och hur binde-s används i språkbruket. Jag tycker att SAOL samt 90-10% i googlebooks till förmån för s-lös variant av skog(be)klädd räcker för inkluderande av raderna, så jag aktiverar dem igen. ~ Dodde 20 januari 2011 kl. 12.11 (CET)

armenisk/armenskRedigera

Beträffande armenisk/armensk anger både SAOL och NEO armenisk som enda alternativ. En sökning på Google books ger 2320 träffar på armenisk och 1000 träffar på armensk. Tycker du att den här övervikten i träffar är tillräcklig för att man ska ändra armensk till armenisk? Sjunnesson 21 januari 2011 kl. 17.14 (CET)

Sedan jag skrev föregående har jag hittat en komplikation. Språket armeniska finns ju också, som i svWp:s artikel innehåller i, och sökning på Google books ger 2270 träffar för armeniska och 742 träffar för armenska. Sedan finns det också den feminina invånarbeteckningen armeniska/armenska, och även adjektivet armeniska/armenska. Men här kan man inte urskilja varken vad som avser språket armeniska, invånarbeteckningen eller adjektivet. Jag tycker i alla fall att språket ska kallas armeniska (och inte armenska). Men om vi bestämmer oss för att 'armenska' ska vara tillåtet i två betydelser, men inte för den tredje betydelsen, språket, måste man i så fall manuellt skilja ut de ord "armeniska/armeniskan" som gäller språket. Sjunnesson 21 januari 2011 kl. 17.40 (CET)
Jag gissar att du med "du" menar mig. ;) Jag är tveksam. Min spontana uppfattning är att armeniska kan användas om språk eller kvinnlig invånare i Armenien, medan både armensk och armenisk kan användas som adjektiv. Språkrådet skriver så här om (adjektivet) aborigin(i)sk, som känns som en nära parallell. SAOL anger tydligen armenisk som korrekt form, men påstår SAOL verkligen att armensk är felaktigt genom att inte ha med formen? Med en tydligare konsensus om att ändra en korrekt form till en annan korrekt form i enhetlighetssyfte är det dock en annan fråga att ta ställning till. Skulle man välja en av formerna är det isåfall givetvis rimligt att välja armenisk eftersom både SAOL och NEO anger den formen i sina upplagor. Vad gäller olika stavningar för olika betydelser så kan det ju innebära ett tekniskt problem, men i detta fallet är det ju enkelt eftersom formen med "i" alltid rekommenderas av SAOL, oavsett om språkbetydelsen, nationalitetsbetydelsen eller adjektivbetydelsen avses. ~ Dodde 21 januari 2011 kl. 17.56 (CET)
Jag tänkte inte på tilltalet, men eftersom det är bara du som svarar på frågorna på den här diskussionssidan så var det dig jag tänkte på. Till sakfrågan: Om man tittar på titlarna på artiklarna i svWp finns det inga artiklar som heter något på Armensk. Armenska (alltså språket) har omdirigerats till Armeniska och Armenska höglandet har omdirigerats till Armeniska höglandet. Sedan finns det andra artiklar som Armeniska folkmordet, Armenisk trut o.s.v. Frågan om man ska betrakta de varianter som inte SAOL har med som felaktiga är svår att svara på. Det framgår inte vad språkexperterna på SAOL själva anser om den frågan. Vad som är rätt och vad som är fel kan över huvud taget vara svårt att svara på i de fall där man inte med hjälp av t.ex. logik kan avgöra det. Men med tanke på vad SAOL skriver och vad artikelförfattarna på svWp skriver som titel på artiklar och med tanke på övervikten för 'armenisk' i Google books skulle jag helst se att vi, åtminstone "i enlighetssyfte", använder 'armenisk'. Men jag garderar mig och lägger in 'armenisk' med disabled på Typos, så ligger bollen hos dig. Sjunnesson 21 januari 2011 kl. 22.16 (CET)
Det är helt klart ett rimligt resonemang du för, och enhetlighetsargumentet biter allt hårdare på mig. Fortfarande känner jag mig ändock till viss del bakbunden av tidigare diskussioner där mindre vanliga korrekta former inte accepterats att de bytts ut mot vanligare korrekta former, med just motiveringen att båda är korrekta. Att det inte finns konsensus för att över huvud taget göra ändringar i enhetlighetssyfte. Jag inser efter många diskussioner att det är svårt att nå en mer genomgripande nivå på diskussionen, som tar hänsyn till alla de aspekter som behöver tas hänsyn till för att AWB/Typos (som ju vi arbetar med här) ska bli ett så effektivt verktyg som möjligt. Det känns också allt svårare att i varje ny diskussion hänvisa till en diffus känsla av yppade åsikter från tidigare diskussioner. Jag tror att vi helt enkelt får skapa arbetsriktlinjer som vi anser vara väl avvägda vad gäller olika intressen men också tämligen konkreta för att kunna vara praktiskt att hänvisa till och sedan försöka få stöd för de riktlinjerna. Om du tycker det låter bra, så ska jag skissa på ett förslag i veckan att lägga fram. ~ Dodde 22 januari 2011 kl. 02.14 (CET)
Jag tycker att det låter alldeles utmärkt. En bra början är det du skrev på AutoWikiBrowser igår.
Jag skulle också vilja lägga till litet till det jag skrev igår om 'armenisk': Man kan resonera utifrån Albanien-albansk-alban/albanska (invånare)-albanska språket, Rumänien-rumänsk-rumän/rumänska (invånare)-rumänska språket samt Slovenien-slovensk-sloven/slovenska (invånare)-slovenska språket. Om man då jämför med Armenien så heter det inte armen, utan armenier. Därom tror jag att de allra flesta är överens. Av armenier blir det då armeniska språket. Då är det rimligt att det också blir armeniska som adjektiv och inte armensk. Det här var något jag inte tänkte på igår. Med utgångspunkt från detta tänker jag aktivera 'armenisk' som jag inaktiverade igår. Om du inte tycker att det är rätt kan du inaktivera det igen. Med vänlig hälsning. Sjunnesson 22 januari 2011 kl. 08.03 (CET)
Precis iakttagandet av såna liknande mönster som jag menar är intressanta att uppmärksamma! Också etymologin kan ha betydelse i vissa fall. Detta med språknamn, invånarnamn, kvinnliga invånarnamn och adjektiv verkar inte användas helt konsistent i förhållande till något (lättupptäckt) mönster. Jag tror att de olika orden ibland tar olika vägar in i det svenska språket och ofta kan vara korrekta ur olika synvinklar. Det hade varit intressant om mönstret du hittade alltid visade sig gälla. Men titta bara på Iran/Irak, iranier/irakier (invånare), iransk/irakisk (adjektiv), iranska/irakiska (kvinnlig invånare), persiska/arabiska|kurdiska. Gör "k" eller "n" sådan skillnad? Uppenbarligen är "i" sällsynt efter "n": endast 4 av 67 träffar i wikt:Appendix:Nationaliteter/Svenska: armeniska, bosniska, estniska, makedoniska (SAOL accepterar både makedonsk(a) och makedonisk(a)). Samma lista visar att nationaliteter på -ier får ofta -iska för kvinnliga invånare, men iranska är ett undantag, liksom filippinska, jordanska, makedonska, pakistanska, palestinska, madedonska - åtminstone med avseende på det mönstret. Det finns säkerligen fler mönster att titta närmare på, men jag är osäker på om något mönster når ända fram till regler som ger konsistenta stavningar som stämmer överens med bruket. ~ Dodde 22 januari 2011 kl. 14.40 (CET)
Det var intressant att du har tittat litet på utomeuropeiska länder också. Jag har faktiskt inte tänkt på att det kan variera så som du beskriver, med t.ex. iranier/iransk. Ett annat exempel på inkonsekvens, som jag upptäckte nu, är Indonesien-indones-indonesisk. Det vore mer logiskt om invånarna kallades indonesier. Det är sånt här som gör att det ofta är svårt att argumentera för att ord ska skrivas på ett bestämt sätt, för det finns så mycket som är inkonsekvent i svenska, liksom i andra språk. Sjunnesson 23 januari 2011 kl. 09.36 (CET)

Riktlinjer för arbetet med AWB/TRedigera

Jag har formulerat några riktlinjer och placerat dem överst på WP:AWB/T i ett försök att sammanfatta otaliga diskussioner på denna sida, på WP:SKR, tidigare även på WP:LÖVS och diverse användardiskussionssidor ihop med insikter som tillkommit under arbetets gång. Syftet är att ge viss arbetsro till arbetet med felskrivningar så att alla "felskrivningar" som finns i listan inte behöver bevisas bortom allt tvivel att de verkligen är regelrätta felskrivningar utan även kan ha enhetlighet som syfte utan att strävan efter enhetlighet ska behöva gå till överdrift. Det känns inte som punkterna innehåller något kontroversiellt såsom de nu är formulerade, men jag nämner det här så att det finns möjlighet att reagera på innehållet och kanske förbättra formuleringarna ytterligare. ~ Dodde 22 januari 2011 kl. 03.42 (CET)

aids/hivRedigera

Jag ser att ett antal förkortningar, Ikea, Unesco m.fl. är inaktiverade. Nu funderar jag på 'hiv' och 'aids' som inte finns i listan. Vissa användare skriver HIV och AIDS, som tydligen är det rätta i engelska. I svenska är de korrekt skrivna förkortningarna aids och hiv enligt SAOL, Svenska skrivregler (s. 143) och TT-språket, TT-språket om förkortningar. Men ska jag lägga in dem i Typos eller inte? Det kanske kan bli samma problem med de här förkortningarna som med Ikea, Unesco, Säpo o.s.v.? Sjunnesson 23 januari 2011 kl. 14.04 (CET)

För de förkortningar som används även på engelska uppstår det ibland en del problem att avgöra om en ändring ska ske eller inte. Jag upplever att de språkliga rekommendationerna som det hänvisats till inte ger tillräckligt bra beslutsstöd i de frågorna. Vad jag förstår är dessutom dessa rekommendationer allmänt hållna och de fåtal exempel som givits är just bara exempel. Att gemenisera vissa förkortningar, men konsekvent och uppsåtligen undvika att gemenisera andra, är ett tecken på den förvirring som verkar råda om vad rekommendationerna egentligen säger. Hiv och aids används som flera av de andra exemplen även på engelska, så det kommer troligen att generera en del skenträffar. Jag anser inte att det är fel att genomföra liknande ändringar, men förutom problemet med skenträffar och ev. problem att avgöra om ändring ska göras eller ej, skulle jag föredra om dessa åtminstone tills vidare hade markeringen "disabled" så att var och en kan välja att genomföra dessa ändringar eller ej, genom att komplettera listan på den här sidan med en privat lista som aktiveras genomm inställningarna för var och ens installation av AWB. ~ Dodde 23 januari 2011 kl. 17.44 (CET)

Unicef-ambassadörRedigera

Ursäkta mig, jag stöter bara på problem. Enligt vad som står i "Svenska skrivregler", s. 143, bör Unesco och liknade skrivas med versal+gemener. Jag har lagt in Unicef som disabled. Men Unicef-ambassadör borde kunna läggas in som aktiverat, och det finns en hel del sådana (annars vore det enklare att ändra manuellt). Tyvärr verkar det komplicerat att skriva en sådan rad i typos. Om du, Dodde, tycker att det ska läggas in kan du väl hjälpa mig att skriva en sådan rad? Sjunnesson 24 januari 2011 kl. 07.54 (CET)

Ja, finns ingen risk att de blandas ihop med engelska så borde det inte vara några problem! Exempelvis find="UNICEF-?ambassadör(\w*)" - replace="Unicef-ambassadör$1" borde väl funka? (Jag har inte så bra koll på när bindestreck ska användas och inte). Jag tror också att man skulle kunna få med många av dessa förkortningar genom att se till att ett ord före eller efter förkortningen är svenskt (t.ex. till, och, men, \w*[åäö]\w* osv.). Vet inte riktigt hur ett sådant regex ska se ut, men när vi "kommit ikapp" någorlunda med de mer allvarliga felskrivningarna så kanske vi kan kika närmare på detta. Nu är det väl omkring 40005800 felskrivningar som återstår för den befintliga listan.~ Dodde 24 januari 2011 kl. 09.21 (CET)
Nu har jag lagt in det. Titta gärna på texten på Typos. Texten blev både röd och grön, så det kanske blev något fel? Sjunnesson 24 januari 2011 kl. 10.45 (CET)
Ett glömt " bara :) ~ Dodde 24 januari 2011 kl. 20.03 (CET)

följaktligen, följaktig, följaktligRedigera

På Doddebot/Staning fanns följ(d)akt(l)ig(en) > följaktlig(en) med som typo, med Johan Rantzau som undantag för följaktig. Det verkar som användning av följaktig är korrekt använd där, men hur ålderdomligt är egentligen det ordet? Borde meningen skrivas om? SAOL har inte med följaktig (men SAOB). Jag tror att flera felaktiga ändringar gjorts p.g.a. följaktig>följaktlig i Doddebot/Stavning för åratal sedan och som har varit felaktiga sedan dess. Behöver hjälp att reda ut detta. Samtidigt undrar jag om det över huvud taget finns något ord (i nutida svenska) som stavas följaktlig(t)? Finns risk att en felaktig betydelse hämtas från adverbet följaktligen på grund av avsaknaden av ett motsvarande adjektiv? Någon som känner sig ha tillräcklig språkkunskap för att åtgärda alla fel på WP som gäller detta? Vad gäller eventuellt regex - kan man över huvud taget ha ett sådant för följaktig(t)/följaktlig(t)? ~ Dodde 25 januari 2011 kl. 23.50 (CET)

Har återställt de 5-6 ändringar av följaktig>följaktlig som Doddebot gjort för ett par-tre år sedan. ~ Dodde 26 januari 2011 kl. 21.26 (CET)
Svenska akademiens ordbok finns på nätet: http://g3.spraakdata.gu.se/saob/. Där framgår (tycker jag) att 'följaktlig' knappast har använts senare än 1800-talet. I SAOL finns 'följaktlig' inte med. Om man söker i Google books får man fram böcker från 1800-talet som skriver 'följaktlig', men inte några från 1900-talet som gör det. Avgör det saken? Sjunnesson 27 januari 2011 kl. 06.59 (CET)
Vid en närmare titt var de förekomster av följaktlig typon av följaktig, inte av felaktiga avledningar till följaktligen. Det finns dock en del sådana exempel att se med googlesökningar. Så följaktlig ska inte användas i betydelsen följaktig, enligt din analys. Men inte heller följaktig förekommer i SAOL, men ett tiotal gånger på Wikipedia. Och i SAOB. Det var ett nytt ord för mig, så jag undrade hur nutidssvenskt det är egentligen. ~ Dodde 27 januari 2011 kl. 15.48 (CET)
Jag har nu hittat 'följaktig' i SAOB (1926): http://g3.spraakdata.gu.se/saob/show.phtml?filenr=1/77/125.html Ordet verkar åldedomligt, och jag kan inte tro att det används nuförtiden. Men helt säker är jag inte. Sjunnesson 27 januari 2011 kl. 21.11 (CET)

bergart/bergsartRedigera

Sjunnesson: Jag är bara lite nyfiken på din kommentar till denna ändring. Hur kom du fram till att "bergsart" förstås är korrekt i humlesammanhang? Dodde 25 januari 2011 kl. 23.59 (CET)

Så här står det i artikel Bombus pyrenaeus: "Arten är en bergsart, som i Alperna och Pyrenéerna kan gå så högt som 2700 m." I ett relativt stor antal artiklar om olika Bombus-arter står det på det här sättet. Det handlar alltså inte om bergarter, utan om arter (av Bombus) som lever i bergstrakter. Sjunnesson 26 januari 2011 kl. 08.06 (CET)
Du har säkert helt rätt. Du menar att man göra nån sorts särskiljning för när binde-s ska användas och när binde-s inte ska användas? Jag förstår bara inte på vilka språklogiska grunder man kan göra en sådan särskiljning - varför det så självklart ska vara binde-s i ena fallet men inte i det andra fallet. ~ Dodde 26 januari 2011 kl. 08.25 (CET)
Som alltid (nästan) är det svårt att veta varför ord sammansätts utan eller med s. Men när det gäller bergart menar man väl berg = mineral. När det gäller 'bergsart' så är det arter av humlor som lever i bergen (vad jag kan förstå av det som Law har skrivit). Något ord 'bergsart' finns inte i några uppslagsverk, men kanske det används inom entomologin. Kanske kan Användare:Law svara på det. I alla fall har dels ordet 'berg' olika betydelse i de båda fallen, liksom att också 'art' har olika betydelser. Ordet 'art' i 'bergsart' har ju biologisk betydelse (humlor, paddor). Det kanska ändå är möjligt att ha med ordet 'bergart' i Typos, men då får man undanta de 29 artiklar som Law har skrivit om olika humlor som han kallar 'bergsarter'. Han har också lyckats få med paddan Flectonotus ohausi som en bergsart. I artiklarna Litostratografi och Säve har jag ändrat bergsart till bergart, eftersom det rör sig om mineral i de fallen. Sjunnesson 26 januari 2011 kl. 10.51 (CET)
Känner mig lite otillfredsställd av svaret, men förstår att det kanske inte finns nåt tydligt svar att ge. Nej, bergart/bergsart bör inte finnas med i listan på grund av den sista punkten i villkoren, att det kan medföra svåra rättningsval. ~ Dodde 26 januari 2011 kl. 18.21 (CET)
Ledsen att du inte är riktigt nöjd med svaret. Jag kan utveckla mitt resonemang litet till. Beträffande 'bergsart' tycker jag svaret är enkelt. På (eller i) Wikipedia är det enbart Law som använder det om arter av humlor och grodor. Ingen annan användare skriver om bergsart i den bemärkelsen. När det gäller 'bergart' i bemärkelsen mineral känns det inte heller så besvärligt. SAOL skriver 'bergart' och inget annat, trots att de i många fall annars är tveksamma när det gäller sammansättningar berg-, bergs-. I svWp får jag 580 träffar på 'bergart*'. Innan jag i går gjorde en ändring i två artiklar från 'bergsart' till 'bergart' fanns det alltså 548 artiklar med 'bergart*'. Beträffande 'bergart' tycker jag inte att vi behöver tveka och beträffande 'bergsart' får Law själv ta ansvar för den användningen, men inuitivt har jag inget att invända mot det ordet. Sjunnesson 27 januari 2011 kl. 07.15 (CET)
Jo, nöjd med svaret - inte riktigt tillfredsställd ;) Jag ifrågasatte inte stavningarna. Jag ifrågasatte din användning av "förstås", som om det hade funnits ett logiskt resonemang om varför det vore så självklart att använda -s- i vissa sammanhang, som om det fanns en tydlig regel i "Svenska skrivregler", en kommentar i SAOL, eller ett svar på en fråga i Språkrådets frågelåda, men att detta resonemang var underförstått i redigeringssammanfattningen. "Utan intuitiv invändning" som du nu konstaterar att det handlar om, är inte dåligt det heller. Sådant är ju vad vi alla använder oss av. Så kallad språkkänsla. Men språkkänslan ger i sig sällan några tillfredsställande svar om varför man säger si eller så. ~ Dodde 27 januari 2011 kl. 15.58 (CET)
Nej det är sant. Jag tror att du missförstod vad jag menade med förstås. Min tanke var att om det gäller humlor så är art ett biologiskt begrepp och 'art' när det gäller 'bergart' gäller vad man kan kalla 'sort' eller liknade. Det var alls inte min mening att var ohövlig på något sätt. Och när det gäller Law:s begrepp 'bergsart' så är det väl hans språkkänsla som säger honom att det är rätt, och den känslan har jag också inför det ordet. Jag kanske inte skulle kalla Law för 'han', eftersom det är brukligt på Wikipedia att skriva h*n, men Law har på sin användarsida skrivit 'skåning'. Vore Law en kvinna borde det stå 'skånska'. Sjunnesson 27 januari 2011 kl. 16.50 (CET)
Har aldrig uppfattat dig som ohövlig, blev bara inspirerad av att du verkade så övertygad och nyfiken på varför. :) Det är allt. Jag vet inte vad min språkkänsla säger och utan något hållbart resonemang för det ena eller det andra och utan ordstatistik så vet jag inte om jag anser något ens. Jag förstår att det rör sig om olika sorters "ras" och därför rimligen inte kan resoneras att det ska skrivas med eller utan s bara för att den andra betydelsen av ras gör det. ~ Dodde 27 januari 2011 kl. 22.20 (CET)

Apenninerna, Apenninska halvönRedigera

Om de här orden har jag en del frågor. En vanlig felstavning som jag har hittat är Appeninerna/appeninerna. Men det kan också bli stavningar som Apeninerna eller Appenninerna. Du kanske kan hjälpa mig att lägga in det här som typos, för när det kan förekommer flera typer av felstavningar vet jag inte riktigt hur man skriver för att det ska bli rätt. Samma sak gäller Apenninska halvön. Där är frågan också: räcker det med att skriva enbart Apenninska? Jag har nämligen stött på ett fall där det står Appeninska (Italienska) halvön, och skriver man hela ordet Apenninska halvön rättas inte felstavningar som gäller Apenninska om ett annat ord kommer emellan. Hur ser du, Dodde, på den här saken? Sjunnesson 31 januari 2011 kl. 10.56 (CET)

Eftersom det är ett egetnamn som alltid har versal begynnelsebokstav börjar vi med [Aa]. Man kan alltid fortsätta med pp? och nn? som betyder "ett eller två p" respektive "...n". Och sedan avsluta med genitiv-s:et (s)?: [Aa]pp?enn?inerna(s)? Nackdelen är att vi även träffar det rättstavade Apenninerna med detta regex, så vi försöker med ett regex som träffar felskrivningarna, men missar rättskrivningen: Det kan skrivas såhär: [Aa]p(pen|e|pe)ninerna(s)?, eller kortare [Aa]p(pen?|e)ninerna(s)?
Om det inte finns anledning att tro att apenninsk kan vara en felskrivning avseende något annat, finns ingen anledning att ha med halvön i regexet. Apropå diskussionen om bysantinsk gjorde jag en googlesökning på felskrivningen apennisk, men stavningen var inte vanlig. Dock hade NE med den felaktiga stavningen i sin artikel om Sydeuropa :). Iallafall, utan den felskrivningen blir det motsvarande regex för adjektivet: (A|a)p(pen?|e)ninska eller med NE:s ovanliga felskrivning (A|a)p(pen?|e)nin?ska. Används ordet även i andra former, som apennisk/apenniske/apenniskt blir syntaxet (A|a)p(pen?|e)ninsk(a|e|t)? respektive (A|a)p(pen?|e)nin?sk(a|e|t)?. Eftersom det inte finns risk för skenträffar tycker jag gott vi kan använda de regex som ger flest träffar. Har lagt till dem under nya bidrag [13] ~ Dodde 31 januari 2011 kl. 12.05 (CET)

Asea och IkeaRedigera

Går det att få maskinell hjälp att ändra ASEA till Asea och IKEA till Ikea? Det är för många förekomster för att göra det manuellt. Sjunnesson 23 februari 2011 kl. 06.53 (CET)

Ikea finns med men på en inaktiverad rad. Har lagt till Asea där också. På grund av det stora antalet förekomster kanske vi kan avvakta tills fler av de mer allvarliga skrivfelen är åtgärdade. Just nu återstår 3-4000 skrivfel enligt aktuell lista. ~ Dodde 23 februari 2011 kl. 22.15 (CET)
Ja, jag tycker som du: de mer allvarliga skrivfelen ska åtgärdas först. Sjunnesson 24 februari 2011 kl. 06.46 (CET)

FörränRedigera

Väldigt många false positive "fören" på typokollen på "Förrän". Ett 100-tal, som alltså ska vara "fören" (på en båt). Jag hittade ca 10 st som skulle vara förrän, rättade dem. Ska vi stryka alternativet "fören" från "förrän"? /Inteloutside2 26 februari 2011 kl. 01.13 (CET)

I synnerhet som du nu gått igenom alla befintliga, ja det tycker jag då. ~ Dodde 26 februari 2011 kl. 19.44 (CET)

AWB lägger in mallen reflistRedigera

AWB lägger in mallen reflist, vilken tydligen är avvecklad. Se AWB-redigeringen här, som gav ett felmeddelande i artikeln efter ändringen /Inteloutside2 9 mars 2011 kl. 23.11 (CET)

"General fixes" är bara anpassat till engelskspråkiga Wikipedia. Jag har valt att inaktivera dessa tills vidare, främst på grund av olikheterna med hur vi hanterar referenser. ~ Dodde 15 mars 2011 kl. 09.52 (CET)

USAs -> USA:sRedigera

Det här är ett fel av mindre allvarlig art, men jag vill ändå fråga om det. Om jag visste hur jag skulle skriva skulle jag lägga in det under "Nya bidrag" och som "disabled". Mitt problem, när det gäller att skriva "typo word" för det här, är att det rättskrivet är en kombination av tre versaler, ett kolon och en minuskel. Om USAs -> USA:s är av tillräcklig betydelse att lägga in för rättning kanske jag kan få hjälp att skriva en korrekt rad för det. Sjunnesson 2 april 2011 kl. 09.04 (CEST)

Detta finns redan med, under "Specialare": Typo word="genitivrättning av förkortningar". Den tar hand om USAs, EUs m.fl. (den kollar på samtliga versalförkortningar som är mellan 2-6 bokstäver långa) och sätter in ett kolon framför s. //Inteloutside2 3 april 2011 kl. 11.00 (CEST)

AWB:s sortering av Interwiki-länkarRedigera

Har upptäckt att AutowikiBrowser kanske inte sorterar Interwiki-språklänkarna riktigt bra. Den sorterar rent alfabetiskt, så exvis finska fi:xxx hamnar uppe ovanför fr: , men jag ser att standard på svenska Wikipedia verkar vara att finska ska ligga nere bland s-språken (Suomi). På Huvudsidan sv.wikipedia.org är det så till exempel. Funktionen "Sort Interwiki links" under Options är påslagen som standard, men jag stängde av den i min AWB tills vidare. //Inteloutside2 16 april 2011 kl. 20.32 (CEST)

Jag har lagt märke till samma sak, fast med en mytiskt detalj: om det redan är felsorterat, så att finskan ligger vid F, så sorterar den åtminstone finska rätt. Det varierar alltså i hur den tycker att det ska sorteras. -Laxskinn 23 april 2011 kl. 12.31 (CEST)
Jag lade in en "varningstext" om General fixes under rubriken "Att komma igång med AWB" på Wikipedia:AutoWikiBrowser. //Inteloutside2 27 april 2011 kl. 11.11 (CEST)

Avgjord/avgöraRedigera

Stämmer detta?

<Typo word="avgöra" find="\b(A|a)vg?jör(as?|s|ande)?\b" replace="$1avgör$2" />
<Typo word="avgjord" find="\b(A|a)vjor(de?s?|ts?)\b" replace="$1avgjor$2" />

Har inte riktigt koll på det där med backreferences, eftersom AWB inte använder det, så någon får gärna kolla på detta innan jag vågar lägga upp det. -Laxskinn 27 april 2011 kl. 00.39 (CEST)

Nästan helt rätt, stryk a:et i replacen så blir det perfekt. (A:et hämtas in via parentes nr 1, dvs $1).
Så här alltså:
<Typo word="avgöra" find="\b(A|a)vg?jör(as?|s|ande)?\b" replace="$1vgör$2" />
<Typo word="avgjord" find="\b(A|a)vjor(de?s?|ts?)\b" replace="$1vgjor$2" />
//Inteloutside2 27 april 2011 kl. 10.57 (CEST)
Ja, så klart! Jag misstänkte väl att jag klantat till det nånstans ;) Då tar jag och lägger in dem nu. -Laxskinn 27 april 2011 kl. 11.06 (CEST)
Toppen! //Inteloutside2 27 april 2011 kl. 11.09 (CEST)

RubrikerRedigera

Gör det något om man lägger in felaktiga rubriker också? De jag tänker på är för tillfället == References == och == Externa källor == som borde kunna ersättas av == Referenser == och == Källor == (eftersom alla källor är externa) -Laxskinn 16 maj 2011 kl. 01.00 (CEST)

Bra idé, jag ser inget som hindrar. Skulle ev vara det rent tekniska i så fall; AWB kollar inte på det som står inom == ==. Men om man tar med "==" i find så borde det funka, blir spännande att se om det funkar //Inteloutside2 16 maj 2011 kl. 16.52 (CEST)
Testar nu, så får vi se. -Laxskinn 16 maj 2011 kl. 23.51 (CEST)
Knepigt. Jag testade detta, det fungerar allmänt att matcha likhetstecken, exvis: \=\= hej
Men försöker man göra just det som är tanken, inledande och avslutande dubbla likhetstecken, ex: \=\= hej \=\=
så vägrar AWB att reagera, eftersom den då känner igen rubrikformatet. Ngn annan kanske vet hur man löser detta, jag tror inte jag kommer längre. /Inteloutside2 17 maj 2011 kl. 23.32 (CEST)
Händer det bara om man söker just efter "== hej ==", med likhetstecken på slutet också? Skulle det kanske funka om man helt enkelt bara körde på "== References"? Det finna väl ändå inga andra tillfällen där två likhetstecken används i rad? I annat fall kanske "== References (?=\=\=)" -Laxskinn 17 maj 2011 kl. 23.55 (CEST)
Allt som är skrivet i rubrikformatet ignoreras helt tyvärr, har någon skrivit "== References" och inga likhetstecken därefter i en artikel så funkar det, men så fort någon har skrivit "== References ==" så är det kört, även om vi bara söker på "== References" :(
Men däremot så hittade jag en alternativ lösning på problemet. Ser att det går att lägga in egna permanenta Find and Replace direkt i AWB. Se [14]. Jag testade just detta. Under fliken "Options" i fältet i mitten längst ner kan man bocka för "Enabled" på Find and replace, och sedan klicka på "Normal settings". Där skrev jag in "== Externa källor ==" på Find och "== Källor ==" på Replace with. Och se till så att rutan "Ignore templates, refs, link target, and headings" inte är förbockad. Funkar finfint! //Inteloutside2 18 maj 2011 kl. 00.08 (CEST)
Jo, jag använder den funktionen rätt mycket (har säkert över 100 olika sökrader nu, men de flesta är ännu för grova för att jag ska våga släppa lös dem här :P). Så mycket som möjligt vill man ju dock ska finnas här så att det blir tillgängligt för alla automatiskt. -Laxskinn 18 maj 2011 kl. 00.13 (CEST)
Helt sant. Och jag vet inte hur Find/Replace-delen i AWB funkar, om det går att aktivt hämta in de artiklar som innehåller Find-delen, på samma sätt som man kan göra med typo-listan? Vi kan ju alltid hoppas att någon annan kan trixa in rubrik-fixar i typolistan, men jag gissar att det tyvärr inte är möjligt.. //Inteloutside2 18 maj 2011 kl. 00.22 (CEST)

turneérRedigera

Ordet turné finns redan inskrivet. Men hur löser man felstavningar som turneér? Jag kan inte se att sådana tas om hand av det som redan är skrivet om turné. Sjunnesson 5 juli 2011 kl. 14.56 (CEST)

Hejsan! Jag lade in en ny typofix som tar hand om ideér, turneér, succeér och även ...eér/na/s. Kanske finns fler ord som följer samma mönster, det är bara att bygga på fixen i så fall! Jag har inte testat fixen i AWB men den bör absolut funka. //Inteloutside2 31 juli 2011 kl. 14.05 (CEST)
Jag lade till troféer också. Exvis arméer ser jag att det redan finns en egen fix för //Inteloutside2 31 juli 2011 kl. 14.17 (CEST)
Tack för det! :-) Sjunnesson 1 augusti 2011 kl. 08.04 (CEST)

MetrologiRedigera

I typot "meteorologi" blir det träff på metrologi, som är läran om mätningar och mätteknik, AWB vill alltså ändra metrologi till meteorologi. Röstar för att "metrolog-" tas bort ur typot "meteorologi", men att de andra får vara kvar. Dvs "meterolog, metorolog, metreolog".//Inteloutside2 26 september 2011 kl. 14.36 (CEST)

Jag tycker också att det är lämpligt att göra så. Du kanske kan lägga till -isk också, så att det blir träff på det? Sjunnesson 26 september 2011 kl. 16.04 (CEST)
Om det nu går att göra så, för metrologisk kan väl ha med mätteknik att göra. Sjunnesson 27 september 2011 kl. 08.44 (CEST)
Jepp, vi får nog ta bort allt som har med metrologi att göra, inkl alla ändelser. Att ta bort det är en avvägningsfråga eftersom felstavat metrologi (dvs när det handlar om väder) är ganska frekvent, men det rimliga är väl ändå att ta bort risken för att korrekta metrologi felaktigt görs om till meteorologi. Jag kan ju lägga in en kommentar i typolistan om att man inte ska matcha "metrologi". Och lägga till ändelser på de andra, exvis "meterologiska".//Inteloutside2 27 september 2011 kl. 12.21 (CEST)
Jag ändrade manuellt "metrolog..." till "meteorolog..." i fyra artiklar så nu tror jag allt ska vara rätt. Borde vara förbjudet för vetenskaper att ha så snarlika namn. Hoppas att det inte finns någon vetenskap om läran om meteorer? :) //Inteloutside2 27 september 2011 kl. 12.48 (CEST)

UndantagRedigera

En funktion som jag fantiserat om i såna här situationer är någon slags taggar eller liknande som man kan sätta runt ord som ska undantas. Jag skulle t.ex. vilja lägga till ordet "Californien" men tyvärr finns det tydligen en låt vid namn "Nätterna med dig i Californien" som alltså ger falska träffar. Nån typ av funktion (Nätterna med dig i <sic>Californien</sic> typ) som gjorde att AWB ignorerade träffen skulle vara mycket praktiskt -Laxskinn 29 september 2011 kl. 23.27 (CEST)

Det skulle vara en toppenfunktion. Funktionen verkar finnas, i alla fall på engelska wikipedia
Från http://en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/User_manual#Regex_Typo_Fixing:
Regex Typo Fixing
... Users performing typo fixing will be warned if a ((sic)) or ((typo)) template is found (when on English Wikipedia).
Jag har bara kollat lite snabbt, kanske vi behöver skapa ngn motsvarande mall på svwi //Inteloutside2 30 september 2011 kl. 11.18 (CEST)
Jag har skapat en mall enligt den engelska "Not a typo". Den heter Mall:Ej stavfel och verkar funka fint. (Principen är väldigt enkel - AWB tittar inte i mallar)//Inteloutside2 30 september 2011 kl. 20.51 (CEST)

Hjälp behövs om typoradRedigera

Skulle någon kunna hjälpa mig med raden <Typo word="växtlighet" find="\b(V|v)äxlighet(ens?)\b" replace="$1äxtlighet$2" /> ? Jag har också provat att skriva om raden som <Typo word="växtlighet" find="\b(V|v)äxlighet(\w)". Problemet är att raden (både i min variant och i den tidigare varianten) rättar enbart "växligheten" men inte "växlighet". I Fornborgar i Västergötland rättas "växligheten" (typos fixed: växligheten → växtligheten using AWB), men i Spansk skogssnigel, Stockholms skärgård och Praktblåsmyg rättas inte "växlighet" fast det inte står inom parentes, citationstecken eller wikilänkning m.m., utan i helt vanlig text. Om jag skriver en typorad <Typo word="växtlighet" find="\b(V|v)äxlighet\b" replace="$1äxtlighet" /> skulle det säkert fungera att få "växlighet" rättat, men då måste man ju också ha den nuvarande raden kvar, eftersom den rättar "växligheten" och "växlighetens". Finns det någon förklaring på hur det kan bli så här? Jag kan inte se att någon av de två raderna skulle vara felskriven. Sjunnesson 2 december 2011 kl. 07.54 (CET)

Testa nu, nu ska det säkert funka bättre. Jag lade till (\w*). Stjärnan innebär att AWB accepterar (men kräver inte) en fortsättning på växlighet. (\w) innebär att det är krav på en fortsättning. mvh!//Inteloutside2 2 december 2011 kl. 13.29 (CET)
\b(V|v)äxlighet(s?|ens?)\b ger träff för växlighet, växlighets, växligheten och växlighetens. Det finns dock ingen risk att använda Inteloutside2:s förslag. I det fall sammansättningar med växlighet skulle existera träffas de orden också med (\w*) istället för (s?|ens?)\b. ~ Dodde 2 december 2011 kl. 15.59 (CET)
Problemet var just att den första raden inte gav träff för "växtlighet", bara för "växtligheten". Men med den variant som Inteloutside2 nu har gjort tas även "växtlighet" med. Tydligen måste (\w) finnas med i det här fallet. Så den lösning som Inteloutside2 hade var den som löste problemet. Den första raden borde också ha fungerat, som Dodde skriver, men det gjorde den alltså inte. Sjunnesson 2 december 2011 kl. 16.44 (CET)

Gemensamt, gemensammt.Redigera

Jag håller nu på och testar "gemensam", men raden fungerar inte för "gemensammt". Det förekommer i två artiklar, Studentboende och Seniorboende. Kan någon hjälpa mig med typoraden så att det här fungerar? Sjunnesson 2 december 2011 kl. 17.24 (CET)

Denna slutar med (\w*), dvs den accepterar vilken fortsättning som helst, t.ex. fångar den upp och rättar genemsamhetsanläggning. Det blir lite knepigt att få typot att reagera på gemensammt. Eftersom exempelvis genemsamma ska fångas upp (där två m ju är korrekt). Kanske en ny typorad för gemensammt. Fast det finns bara 2 förekomster? Kanske en typorad som fångar upp alla ord som slutar på -sammt, om det är frekvent. //Inteloutside2 2 december 2011 kl. 21.48 (CET)
Det fanns bara två förekomster. Men det kan nog bli fler så småningom. Jag lade till en extra typorad, och då fungerade det. :-) Sjunnesson 3 december 2011 kl. 09.40 (CET)

Färggrann, färggranntRedigera

Typoraden fungerar inte för "färggrannt". Se artikeln Arabavagn. Kan någon fixa till raden så att den rättar det här felet? Sjunnesson 2 december 2011 kl. 17.43 (CET)

I princip samma sak som "gemensam" ovan, för denna är det väl dock inte motiverat med (\w*) som avslutning. Svår. (Speciellt som jag är motståndare mot rader som även fångar in korrekt stavning (annars kanske man kan få till ngt med ...färgg?ran...)). Kanske lutar åt två rader, jfr noggrann/noggrant som har två typorader (en under nya bidrag)//Inteloutside2 2 december 2011 kl. 22.07 (CET)
Här lade jag också till en extra typorad, som gjorde att det fungerade. :-) Sjunnesson 3 december 2011 kl. 09.41 (CET)

Uttala, utalandeRedigera

Nu har jag kommit till "uttala" bland Nya bidrag. I artikeln Adoniram Judson Gordon finns ordet 'utalanden' som inte rättas av AWB. Hjälp behövs! Sjunnesson 2 december 2011 kl. 17.52 (CET)

Någon hade i just den artikeln skrivit in citationstecken på fel sätt, så hela slutet av artikeln var inom citat :)
Ändrade citationsformatet så nu ska det funka!//Inteloutside2 2 december 2011 kl. 22.25 (CET)
Bra! Nu fungerade det. :-)
För övrigt kan jag tillägga att jag (som du kanske har sett) har gjort ett riktigt häst- (test-)jobb med AWB/typos nu på morgonen. ;-) Sjunnesson 3 december 2011 kl. 09.44 (CET)
Grymt! :) ~ Dodde 3 december 2011 kl. 11.50 (CET)
Härligt! //Inteloutside2 3 december 2011 kl. 12.35 (CET)

ledamöterRedigera

Kan någon hjälpa mig att skriva ihop riksdagsledamot/-ledamöter på samma rad. Jag har försökt, men jag lyckades bara med 'rikdagsledamot', inte när jag försökte med riksdagsledamöter på samma rad. Sjunnesson 11 december 2011 kl. 09.08 (CET)

fixat! mvh//Inteloutside2 11 december 2011 kl. 12.02 (CET)
Tack för det! :-) Sjunnesson 11 december 2011 kl. 13.44 (CET)

"eftersom"Redigera

Nu har jag skrivit en rad för att rätta "efer-" (efter-). Raden fungerar utom på en punkt. Fast det är meningen att den ska rätta "efersom" till "eftersom" gör den inte det. Stavningen "efersom" förekommer i artiklarna Nachthexen och Legenden om Tarzan. Går det att skriva om raden på något sätt? Sjunnesson 12 december 2011 kl. 11.33 (CET)

Avslutande (\w) gör att ytterligare en bokstav krävs, så syntaxen ger ingen träff för efterfölj, efterleva, eftermiddag och eftersom (däremot exempelvis för efterföljande, efterlevde och eftermiddagen). Jag tror att du avsåg (\w*) som inte kräver - men tillåter - en fortsättning på orden. ~ Dodde 12 december 2011 kl. 16.44 (CET)
Ja, det var (\w*) jag hade tänkt ha med, men som jag alltså missade. Tack för svaret. Sjunnesson 12 december 2011 kl. 17.26 (CET)

Hur gör vi med "m.fl."?Redigera

Under "Nya bidrag" finns "m.fl.". Går det över huvud taget att testa om "m.fl." kan flyttas ner? Punkterna i förkortningen upptäcks ju inte vid sökning. Både "mfl" "mfl." "m.fl" och "m.fl." ger över 3000 träffar när man söker på dessa varianter. Sjunnesson 13 december 2011 kl. 08.18 (CET)

Konstnärsmateriel, kontorsmateriel.Redigera

Om man tittar i SAOL, http://www.svenskaakademien.se/svenska_spraket/svenska_akademiens_ordlista/saol_pa_natet/ordlista, på kontorsmaterial och kontorsmateriel ser man att båda orden finns med. Varken konstnärsmateriel eller d:o -material finns med i ordlistan. I Nationalencyklopedins ordbok (NEO), 2000, s. 1014-1015, står att både ordet 'material' och ordet 'materiel' kan användas när det gäller 'utrustning för verksamhet'. I Google Scholar får 'kontorsmaterial' 365 träffar, medan 'kontorsmateriel' får 76 träffar. Söker man på 'konstnärsmaterial' får man 42 träffar och på 'konstnärsmateriel' 1 träff. I svwp har vi kategorin Konstnärsmaterial på många artiklar. Jag tycker, med anledning av det nämnda, att vi stryker raden <Typo word="kontors-/konstnärsmateriel" find="\b(K|k)on(to|stnä)rsmaterial(\w*)" replace="$1on$2rsmateriel$3" />. Är någon däremot? Sjunnesson 13 december 2011 kl. 09.16 (CET)

Jag är inte emot, mvh//Inteloutside2 13 december 2011 kl. 10.32 (CET)

NoggrantRedigera

"Noggrant" måste nog läggas tillbaka. Jag har inte tillgång till AWB på ett par dagar :( så jag kan inte testa, men är ändå så säker jag kan bli när jag kollar på typoraderna . <Typo word="noggrann" find="\b(N|n)og(rann?|gran(?![nt]))(\w*)" replace="$1oggrann$3" /> lägger alltid in två n på slutet. //Inteloutside2 13 december 2011 kl. 10.54 (CET)

Lägg gärna tillbaka "noggrant" om det måste vara med. Sjunnesson 13 december 2011 kl. 16.51 (CET)
Men vad är skälet till att [nt] finns med i raden? Borde inte det tas bort om man har raden för "noggrant" med? Sjunnesson 14 december 2011 kl. 09.12 (CET)
?! framför betyder att det *inte* ska bli träff på det som står efter (i detta fall n eller t). Raden ger alltså inte träff på "noggrann" eller "noggrant". Däremot träff på allt som börjar med noggran... och sedan fortsätter med allt utom n eller t. "Noggranhet" osv//Inteloutside2 14 december 2011 kl. 16.15 (CET)
Tack för upplysningen. Då vet jag. Sjunnesson 14 december 2011 kl. 17.05 (CET)

äppel-Redigera

Vad är denna rad tänkt att rätta? <Typo word="äppel-" find="\b(Ä|ä)ppel\W(skr[uo]tt|paj|kaka|sort|mos|syra)(\w*)" replace="$1ppel$2$3" /> Jag kan inte se vad det skulle kunna vara. Om det är tänkt att t.ex. 'äppelmos' skulle rättas om det skrivs som 'äpplemos' är detta tveksamt. I Wiktionary beskrivs 'äpplemos' som en variant. I SAOL skrivs om 'äpple': Sms-fog äppel- äv. äpple-. Raden fungerar heller inte på varken 'äpplemos' (tre förekomster) eller 'äpplesort' (25 förekomster). Vore det inte lämpligt att ta bort den här raden? Sjunnesson 17 december 2011 kl. 18.16 (CET)

Det som raden gör är att den skriver ihop särskrivna ord som inleds med "äppel". T.ex. "Äppel mos" (och även "Äppel-mos") blir "Äppelmos", helt enkelt :) Ganska specifikt med en rad som riktar in sig på särskrivningar just i samband med äppel, men detta är alltså vad raden gör. mvh!//Inteloutside2 18 december 2011 kl. 00.26 (CET)
Aha! Då är ju inte raden felaktig eller överflödig (men kanske överambitiös ...). Det finns ju gott om sär skrivna samman sättningar i svenska Wiki pedia (och troligtvis även i andra språkversioner). Jag hittade faktiskt ett fel för en stund sedan, äppel sort, men för tillfället fungerar inte sökningen, så jag kan just nu inte hitta igen det och rätta det. Sjunnesson 18 december 2011 kl. 08.26 (CET)
När sökfunktionen nu är igång igen upptäckte jag att att inte ens det var ett fel. När jag sökte på "äppel sort" var det äppelsort jag hittade, och alltså ingen särskrivning. Sjunnesson 18 december 2011 kl. 08.52 (CET)

"är en/ett av de"Redigera

<Typo word="är en/ett av de" find="tillhör e(n|tt) av de (främsta|bästa|snabbaste)\b" replace="är e$1 av de $2" /> Raden rättar inga av de förekomster som jag hittade. När "felet" innehåller 'en' kommer det även med 'tillhöra' och 'tilhörig'. Artiklar med 'tillhör' är Häxprocessen i Bamberg, Fire (Jimi Hendrix-låt), Friedrich von Wieser och Joen Pöffvelson. Där är uttrycket fel, men det rättades inte. När "felet" innehåller 'ett' får jag med Advokatsamfund som innehåller 'tillhöra'. De övriga 5 förkomsterna skulle ha rättats, men det skedde inte. Jag kan förstås inte avgöra om 'tillhöra' och 'tillhörig' hade riskerat att komma med om raden hade fungerat, men det gjorde den alltså inte. Går det att skriva om raden så att den fungerar? Sjunnesson 17 december 2011 kl. 18.37 (CET)

Kollade på Häxprocessen i Bamberg, där står "...tillhör en av de mest...". Typoraden kollar bara på "...tillhör en/ett av de främsta/bästa/snabbaste...". Vi måste alltså bygga ut den, så att den även kollar på "mest" som alternativ till "främsta|bästa|snabbaste". mvh//Inteloutside2 18 december 2011 kl. 00.34 (CET)
Jag missade något fundamentalt när jag kollade den här raden igår; jag missade parentesen. Men det gjorde att jag har skrivit en ny rad på prov, <Typo word="är en/ett av de" find="tillhör e(n|tt) av de\b" replace="är e$1 av de" />. Den fungerade för 'ett', som jag hade i AWB sedan igår. När sökningen fungerar igen ska jag också prova med 'en'. Om det fungerar bra är det nog möjligt att ersätta den gamla raden med den nya. mvh Sjunnesson 18 december 2011 kl. 08.33 (CET)
Nu har sökfunktionen kommit igång igen, så jag har provat med 'en' också. Fem artiklar kunde rättas med den nya raden, medan det blev fel rättningsförslag på de båda artiklarna Æthelbald av Mercia och Filippinerna. När jag förut rättade 'ett' med den nya raden blev det också fem rättningar (totalt alltså tio). Kan det möjligen vara bra byta ut den gamla raden mot den nya, trots att det blev ett par fel? Vi kontrolläser ju ändringsförslagen. Sjunnesson 18 december 2011 kl. 08.44 (CET)
Tja, jag är nog tveksam. Blir inte den nya raden lite väl liberal? Jag skulle nog hellre se att vi bygger ut den gamla med diverse alternativ vi hittar, så att den är 100% säker.//Inteloutside2 18 december 2011 kl. 11.03 (CET)
Ok, då bygger vi ut den gamla och jag tar bort den nya. Sjunnesson 18 december 2011 kl. 12.05 (CET)
Det skulle nog bli bra att lägga in en koll på alla ord som slutar på -ste eller -sta, ngt i stil med detta: find="tillhör e(n|tt) av de ((\w+)st[ae]|mest)\b". Obs, jag har inte kollat koden i detalj, det är bara en tankegång :) . Dodde? :) //Inteloutside2 18 december 2011 kl. 13.14 (CET)
I väntan på att du eller Dodde lägger till mer till den här raden har jag lagt in 'mest' och 'få'. Sistnämnda ord förekommer efter 'ett' ("tillhör ett av de få") i artikeln Lussi i Svärstorp, och efter 'en' i Joen Pöffvelson ("tillhör en ..."). Din idé om att lägga in -ste och -ste tycker jag verkar bra. mvh Sjunnesson 18 december 2011 kl. 16.45 (CET)
Jag ändrade till <Typo word="är en/ett av de" find="tillhör e(n|tt) av de ((\w+)st[ae]|få|mest)\b" replace="är e$1 av de $2" />. Verkar funka fint vid ett snabbt test. //Inteloutside2 19 december 2011 kl. 18.46 (CET)

Raden "m.fl."Redigera

Raden <Typo word="m.fl." find="\bmfl\.? " replace="m.fl. " /> medför att t.ex. Clausén mfl [red] (i artikeln Musik från Skellefteå) skrivs ihop till Clausén m.fl.[red] Ihopskrivningen sker vanligtvis när mfl finns i slutet av en mening och inte efterföljs av , eller ) Exempel på detta: mfl. Sommaren 1999 > m.fl.Sommaren 1999 (i artikeln Hassel – Privatspanarna). Hur kan man undvika sådant? Sjunnesson 18 december 2011 kl. 12.38 (CET)

Tycker det här påminner starkt om m ö.h.-grejen. Ska kolla på detta vid tillfälle! Om ingen annan hinner före :) //Inteloutside2 18 december 2011 kl. 13.24 (CET)
Ja, det här verkar lika komplicerat som "m ö.h." Det är bra om du eller någon annan tittar på det. Jag gjorde ett tappert försök med raden för "m ö. h." som förebild, men det fungerade inte för mig. Sjunnesson 18 december 2011 kl. 17.07 (CET)
När jag testar så vill AWB rätta mfl. helt korrekt i Hassel – Privatspanarna, utan att ta bort mellanslaget. Har du lagt in typoraden i egen "Find and replace" i AWB? //Inteloutside2 19 december 2011 kl. 18.36 (CET)
Ja, jag hade lagt in typoraden i min "Find and replace". Men det hade jag inte gjort nu, utan för ett tag sedan, så att jag hade glömt bort att jag hade gjort det. Jag har upptäckt att man kan göra fel när man lägger in på det sättet. Om det finns ett mellanrum före " måste man kopiera in mellanrummet också, så att kopierar in både ? " och m.fl. " annars får man den där ihopskrivningseffekten. Nu har jag gjort om och gjort rätt. Och med typoraden rätt inskriven i AWB får jag t.ex. träff på "mfl" i t.ex. Jakt i Sverige "skogsbolag, staten, stift mfl stora markägare." Vad är det som gör att inte AWB upptäcker "mfl" här, utan att man gör den här extra åtgärden? Sedan finns det många "mfl" eller "mfl." som inte upptäcks ens med den åtgärden. Ett exempel är "...John Abruzzi (Peter Stormare) mfl." i artikeln Prison Break. mvh Sjunnesson 20 december 2011 kl. 10.15 (CET)

"utseende"Redigera

Typoraden "utseende" behöver justeras. I artikeln Andy Warhol (sång) hittar inte AWB 'utsende'. I artiklarna Balisong och All-Stars hittas inte 'utsendet'. Sjunnesson 19 december 2011 kl. 10.20 (CET)

Det funkar när jag testar. AWB vill rätta "utsende" och "utsendet" i Andy Warhol (sång) och Balisong.//Inteloutside2 19 december 2011 kl. 18.27 (CET)
Märkligt att det inte fungerar i min AWB, när det fungerar i din. Vad kan det bero på? Jag kan inte se att jag gör något fel. Sjunnesson 20 december 2011 kl. 10.17 (CET)
Nu har jag lagt in typoraden i AWB och fungerar det, men inte annars. Fortfarande tycker jag att det är märkligt. Sjunnesson 20 december 2011 kl. 16.53 (CET)

FörkortningarRedigera

Jag har fått följande på min diskussionssida, och jag tycker att det här kan diskuteras i samband med AWB/Typos. "Du ändrade en del artiklar med förkortningen ”o s v” till ”osv.” Är inte förkortningen o.s.v. att betrakta som ”mer korrekt” eftersom det består av tre ord? Se även Språkrådets rekommendation. För det andra brukar väl förkortningar skrivas ut på Wikipedia, eftersom Wikipedia inte har begränsat utrymme? Se vidare WP:SKR#Förkortningar. Vänligen, --Lundgren8 (d · b) 21 december 2011 kl. 17.25 (CET)" Sjunnesson 21 december 2011 kl. 17.58 (CET)

SkiljaRedigera

Just nu ändras särskiljd till särskild, kan inte alla ”skiljd” ändras till ”skild” i stället och inkludera ”skiljde” i det så täcker man in flera likadana missar? --Lundgren8 (d · b) 21 december 2011 kl. 21.50 (CET)

I Svenska akademiens ordlista (SAOL), 2006, s. 834, står mycket riktigt att det ska vara 'skild'. När man sedan kommer till ordet 'skilja' står det "v. skilde äv. skiljde, skilts äv. skiljts, ..." Och om 'skiljas' skriver SAOL: v. skildes äv. skiljdes, skilts äv. skiljts... Ordformerna 'särskild' och 'särskilt' har de ingen variant till (s. 946). Det här verkar ju inte helt konsekvent, men klart är i alla fall att de anser att det bara ska finnas en stavning för ordformerna 'skild', 'särskild' och 'särskilt'. Om man ska följa SAOL har du alltså rätt i att det bör stå 'skild' och inte 'skiljd'. Däremot skulle man inte ändra 'skiljde', eftersom det räknas som en variant. Med hjälp av typoraden "särskild" kan jag skriva en rad även för "skild". Däremot vågar jag mig inte på "skilde" (skiljde) och "skildes" (skiljdes) med tanke på det SAOL skriver. Sjunnesson 22 december 2011 kl. 08.43 (CET)
Jag ser nu att raden "särskild" inte tar upp stavningen 'särskiljd' och det kan den heller inte göra, eftersom det finns ett ord 'särskilja' som enligt SAOL (s. 946) "böjs som skilja". Sjunnesson 22 december 2011 kl. 09.02 (CET)
Det var krångligare än jag trodde. Raden <Typo word="särskild" find="\b(S|s)är(ksk|s|k)ill?(d[ae]?s?|ts?)\b" replace="$1ärskil$3" /> tar även upp s?|ts?) och går inte att ta som förebild för 'skild'. En rad för det ska alltså, till skillnad från den typorad som finns för "särskild", ta hänsyn till 'skiljd'. Sjunnesson 22 december 2011 kl. 09.12 (CET)
Jag antar att jag borde ha kollat upp var SAOL stod i frågan, men jag trodde inte ens att det existerade några variantformer så det var en miss av mig. Ursäkta! --Lundgren8 (d · b) 22 december 2011 kl. 21.10 (CET)

"Anledningen till varför"Redigera

Wp:Lista över vanliga språkfel finns ett nytt bidrag: "anledningen till varför" > "anledningen till att". Helt klart är "anledningen till varför" inte något bra uttryck. Jag har provat att ersätta uttrycket med "anledningen till att" via en typorad i AWB. Av 37 fall gick det i de flesta fall att ersätta det sämre uttrycket med det bättre, så att meningarna blev mera logiska. Men i vissa fall var meningarna formulerade så här: "Anledningen till varför Suzuki fick sparken var för att ..." (artikeln Seijun Suzuki). Problemet med sådana formuleringar är "var för att". Man måste i dessa fall ändra även det så att meningen lyder: "Anledningen till att Suzuki fick sparken var att ..." Cirka 8 av de 37 artiklarna hade meningar som var olämpliga för maskinell ändring av detta och av andra skäl. De artiklarna har jag rättat manuellt. Man kan också tänka sig att ändra "anledningarna till varför" och "anledning till varför", men också där stöter man på problem (kanske i högre grad). När det gäller "anledningarna till varför" finns t.ex. en i mitt tycke helt korrekt mening i artikeln Se Wsi Testamenti: "I det praktiska förordet anger Agricola anledningar till varför Åbodialekten används ...". Så vad tycker ni som är intresserade av språkvård: ska vi använda den nya typoraden med stor försiktighet, eller ska vi ta bort den? Sjunnesson 29 december 2011 kl. 17.25 (CET)

LösensummaRedigera

Jag avaktiverade raden som ersätter "lösensumma" med "lösesumma". Enligt Språknämnden är "lösensumma" en korrekt variant. Se artikeln Lösesumma. //Inteloutside2 (diskussion) 1 mars 2012 kl. 14.49 (CET)

Mexiko/MexicoRedigera

Jag föreslår att vi tar bort raden "Mexiko". Motivering: Det finns en alternativ stavning Mexico, som bland annat används i Nationalencyklopedin, så att skriva Mexico kan väl inte vara fel? Vi har ju inga rader som ändrar Canada till Kanada eller som ändrar Cuba till Kuba. Visserligen används Mexiko som artikelnamn i svwp, men det är ju samma sak med Kanada och Kuba (som i Nationalencyklopedin skrivs som Canada och Cuba). Mexico skrivs också med c i spanska och engelska, varför det tar tid att se om en av AWB föreslagen ändring Mexico -> Mexiko verkligen ska genomföras. Jag ser att Mexico city och New Mexico är inlagda som undantag i raden, men även där kommer Mexico som ändringsförslaget Mexiko. Sjunnesson (disk) 16 mars 2012 kl. 17.52 (CET)

Motiveringen till att Mexiko finns med i listan är enkel, och finns med i inledningen på sidan där det står i en av punkterna över vilka rättelser listan ska innehålla: "i enhetlighetssyfte gällande icke-triviala ändringar av ord, uttryck och egennamn, även om det kan diskuteras att flera korrekta alternativ finns (exempelvis ej överhuvudtaget till över huvud taget, men däremot skogsbeklädd till skogbeklädd och armensk till armenisk)."
Vi har åtskilliga sådana rader i listan, så att Mexico>Mexiko finns med trots att båda stavningarna är korrekta är i sig inget kontroversiellt. Att det är just Mexico som ändras till Mexiko kan, åtminstone delvis, härledas till Språkrådets kommentar [15] som i den ger rekommendationen att stava landets namn med "k" (dock nämns ej staden eller delstaten, vilka man heller troligen ej skulle kunna påstå stavades med "k" av hävd som man påstår om landet).
Om du upplever att den raden leder till alltför stor andel skenträffar föreslår jag att du inaktiverar raden och placerar den under inaktiverade rader. Jag hade önskat att man kunde göra en inställning för vissa rader som ska kunna ge en varning/påminnelse om att vara extra uppmärksam och kanske motivering till det, men såvitt jag vet saknas den funktionen. ~ Dodde (disk) 17 mars 2012 kl. 02.02 (CET)
Eftersom raden leder till för många skenträffar inaktiverar jag den. Sjunnesson (disk) 20 mars 2012 kl. 06.56 (CET)

skild/skiltRedigera

I inledningen till AWB/Typos står: "Denna lista ska innehålla rättelser i enhetlighetssyfte gällande icke-triviala ändringar av ord, uttryck och egennamn, även om det kan diskuteras att flera korrekta alternativ finns ..." Jag vill då fråga hur man ska se på olika böjningsformer av 'skilja', 'skiljas'. Här ovan finns en diskussion under rubriken "Skilja", där jag har diskuterat den här saken med Lundgren8. Ett problem är att Nationalencyklopedins ordbok (NEO) år 2000 och Svenska akademiens ordlista (SAOL) år 2006 verkar ha olika uppfattningar i frågan. För 'skild' har båda uppfattningen att det bara ska finnas 'skild' (enl. NEO skild adj. skilt). Böjningsformer för ordet 'skilja' är enligt NEO skilde skilt, men enligt SAOL skilde äv. skiljde, skilt äv. skiljt, skild n. skilt, För 'skiljas' är böjningsformerna enligt NEO skildes skilts, pres. skiljs äv. skils el. skiljes. SAOL anger formerna skildes äv. skiljdes, skiljts, äv. skiljts, pres. skilj(e)s e. skils.

Hur ska svwp ställa sig i den här frågan? Ska vi godkänna enbart 'skilde' och 'skilts' (som NEO) eller ska vi även godkänna 'skiljde' och 'skiljts' som SAOL? Det står som sagt i inledningen tiil AWB/Typos om "enlighetssyfte" och "även om det kan diskuteras att flera korrekta alternativ finns ...". Sjunnesson (disk) 17 mars 2012 kl. 08.51 (CET)

Så, vad kom ni fram till? :) Om det finns en form som är rekommenderad och dessutom tydligt motiverad är frågan lättare. Ibland blir det en avvägningssak. Språkrådet säger att båda formerna är helt ok att använda [16] utan att man rekommenderar den ena framför den andra. Mitt val hade varit att inte lägga till någon typosrad för dessa stavningsformer (däremot för skilsmässa). ~ Dodde (disk) 18 mars 2012 kl. 01.59 (CET)
Det blir mitt val också, eftersom SAOL och Språknämnden har samstämmig uppfattning. Sjunnesson (disk) 18 mars 2012 kl. 11.07 (CET)

Kursiverade citatRedigera

Enligt WP:Skrivregler#Kursivering bör citat inte kursiveras. Jag undrar därför om det vore möjligt att lägga till här att kombinationer med citattecken och kursivmarkörer kunde ändras till bara cittattecken? Alltså "'' och ''" till ".

andejons (disk) 23 april 2012 kl. 21.42 (CEST)

VM fyra / VM-fyraRedigera

Jag tog bort "fyra" och "åtta" ur raden "Mästerskap-...". Visserligen korrigerar raden då och då särskrivna felaktigheter, exvis "Laget blev OS åtta i Moskva 1980", men oftare hittar AWB skenträffar som inte ska korrigeras med ett bindestreck, ex: "Han deltog i VM fyra gånger". Så mycket oftare att det känns befogat att ta bort "fyra" och "åtta" ur raden. mvh//Inteloutside2 (disk) 20 juni 2012 kl. 11.38 (CEST)

Jag lade tillbaka "fyra" och "åtta", men med kravet att de följs av "i", "1896" eller ett årtal på 1900- eller 2000-talet. Då får man träff på t.ex. "OS fyra i Moskva" och "OS fyra 2012". Svensson1 (disk) 21 september 2013 kl. 19.12 (CEST)

TabulatorteckenRedigera

Är det ok att skriva att ersätta tabulatortecken med mellanslag, typ Sök: [\t] Ersätt: [ ]. Vissa artiklar innehåller tabbtecken trots att de inte går att skriva in när man redigerar artikeln, utan har klippts och klistrats in från t.ex. ett ordbehandlingsdokument. Tabbtecknet stör inte den visuella upplevelsen av artikeln då det översätts till ett mellanslag när wikikoden omvandlas till html. När jag gick igenom socknarna i Västergötland med AWB så visade sig ungefär hälften ha tecknet någonstans (framför allt i mallen sockenfakta). Wolfgangus' bot har nu rensat bort dem, men många andra artiklar där man klippt och klistrat mellan en ordbehandlare kan ha tabbar (och möjligen andra tecken så som hårda blanksteg mm). Är ersättningen meningsfull eller ska tecknen få vara kvar? Nasko (disk) 11 augusti 2012 kl. 00.34 (CEST)

I kodexemepel kan tabtecken vara meningsfulla:
kod {
	kod;
	kod {
		kod;
	}
}
där borde de få vara kvar. 217.210.57.95 11 augusti 2012 kl. 08.39 (CEST)
  Ej utfört Samförstånd om åtgärden saknas. Nasko (disk) 23 augusti 2012 kl. 17.50 (CEST)
Indentering i koder kan lika gärna ske med mellanslag, 4 brukar vara vanligt. Med reservation för att jag inte känner till eventuella baksidor med att ta bort tabbtecken så tycker jag att förslaget verkar bra. Kan någon ge ett exempel på ett par sidor där kodexempel används? Svårighet kanske att veta (och ställa in i AWB) när ett mellanslag ska användas och när fyra mellanslag ska användas. Tror AWB är ett för trubbigt verktyg för det. Kanske bättre att begära en åtgärd på Wikipedia:Robothjälp? ~ Dodde (disk) 25 augusti 2012 kl. 15.25 (CEST)
7909 artiklar har ett eller flera tabulatortecken insprängt i texten. Detta tecken går inte skriva in i redigerinsfönstret utan måste komma in i artikeln på andra sätt, tex genom att tecknen klipps och klistras in i artikeln från en ordbehandlare. Tecknet stör inte läsupplevelsen, men mallar och sådant blir mer svåruppdaterade för en robot om styrtecken finns inblandade i koden. Det bästa vore om AWB diskret kunde rensa upp artiklar som innehåller koden när andra förändringar genomförs. Nasko (disk) 25 augusti 2012 kl. 16.57 (CEST)
Jag förstår, men min fråga är hur ofta det ska till fler än ett mellanslag istället för tabulatortecknet. Det finns vad jag vet inget sätt att förhandsgranska detta på ett bra sätt i AWB, och även om man skulle klara det första gången, skulle det kanske inte ske andra, tredje eller fjärde gången. Jag vet inte om AWB automatiskt exkluderar sådan text som finns inom <code></code>-blocken, det är möjligt. Jag har inte sett något exempel på artiklar som innehåller tab, så jag vet inte hur det brukar se ut, om det finns anledning att oroa sig över förekomster av någon anledning. Jag gissar att vinsten hur som helst skulle bli betydligt större än den eventuella förlusten, och jag förstår din poäng med svårredigerad text, så jag tycker go for it och lägg till "\t" -> " " i listan. ~ Dodde (disk) 26 augusti 2012 kl. 00.11 (CEST)
För att få indrag använder man kolon. En testkörning gjordes på socknarna i Västergötland (Bjurums socken). Många hundra artiklar fick "felet" åtgärdat och ingen har klagat på botförarens diskussionssida. Jag vet vilka artiklar som har tabtecken i sig och skulle kunna åtgärda dem själv. Det är bara det att det fylls på med artiklar hela tiden, och läggs åtgärden in i AWB:s rättstavning så korrigeras tabtecknen tillsammans med lite andra småfel utan att det stjäl några resurser. Exempel på artiklar som innehåller tabulator är Blötdjur, Alnön och Svenska Serier 1980. Eftersom Wikipedia bygger på samförstånd är jag osäker på om vi kan utföra åtgärden. 2 för och 1 emot är inget samförstånd. Nasko (disk) 26 augusti 2012 kl. 01.08 (CEST)
Total enighet är väldigt sällsynt och ett förslag med endast fördelar och ingen nackdel är ännu mer sällsynt. 217.210.57.95 kom med en invändning vilket är jättebra för att få bredare beslutsunderlag. Den invändningen har det tagits hänsyn till. Det är inte fråga om en omröstning, utan att man genom diskussioner kan komma fram till ett bra gemensamt förslag då det råder tveksamhet. Jag föredrar att vara djärv och om det skulle visa sig att mina redigeringar skulle få oväntade negativa konsekvenser skulle jag anstränga mig att fixa till de fel som uppkommit och undvika att felen återupprepas. Om 217.210.57.95 anser att nackdelarna överväger fördelarna med inkluderingen av "\t" > " " (vilket jag inte kan utläsa att personen ens från början ansåg) så får personen följa upp sina kommentarer i diskussionen. För all del, vänta några dagar, och se om det finns några invändningar eller fler aspekter som behöver belysas. Men troligast är att eventuella invändningar kommer först efter ändringarna börjat genomföras då detta inte är en särskilt välbesökt sida. Du kan om du vill efterfråga åsikter från Sjunnesson och Inteloutside2 som är de två absolut mest aktiva användarna inom detta AWB/typos-projektet, och de har varit delaktiga i detta i flera år. ~ Dodde (disk) 27 augusti 2012 kl. 04.15 (CEST)

Kvkm och kvmRedigera

Jag skulle vilja att kvkm -> km² och att kvm -> m². Förekommer i ca 200 artiklar. Nasko (disk) 11 augusti 2012 kl. 00.34 (CEST)

  Ej utfört Samförstånd om åtgärden saknas. Nasko (disk) 23 augusti 2012 kl. 17.50 (CEST)
Jag tycker absolut att kvkm och kvm borde bytas ut. Personligen skulle jag nog skriva km<sup>2</sup> respektive m<sup>2</sup>. Det råder vad jag tror fortfarande konsensus om att skriva ut förkortningar, men lämpligen ej i tabeller där det kanske råder platsbrist. Isåfall borde det skrivas ut till kvadratkilometer och kvadratmeter. Men eftersom det kan finnas förekomster i både och känns det säkrast att med hjälp av AWB nöja sig med ändringen till km<sup>2</sup> respektive m<sup>2</sup>. ~ Dodde (disk) 25 augusti 2012 kl. 15.39 (CEST)

WPCleanerRedigera

Hi,

If you're interested, WPCleaner can now be configured to use the same list as AWB to detect spelling and typography mistakes and provide suggestions. --NicoV (disk) 23 september 2012 kl. 11.47 (CEST)

Före detta svenskRedigera

En vanligt förekommande formulering är att någon är "före detta svensk (eller annan nationalitet) x" där man egentligen syftar på att personen inte längre sysslar med x, men sannolikt är lika svensk nu som innan. Tänkte bara kolla innan hur ni tror att det är med risken för falska träffar. Det enda jag kan tänka mig vore väl om personen inte längre är svensk medborgare, men det kan inte vara många artiklar där man faktiskt medvetet använder den formuleringen. -Laxskinn (disk) 9 november 2012 kl. 12.52 (CET)

En ändring "före detta svensk" till "svensk före detta" alltså, har inget emot att det läggs in i listan, men: Detta handlar ju mer om sakfel än språkfel, dvs att man måste faktakolla artikeln. Även om risken för falsk positiv är liten så bör man ju ändå kolla genom varje sådan ändring noga, vilket är mer tidskrävande än att kolla de normala språkliga falska positiven. //Inteloutside2 (disk) 9 november 2012 kl. 13.26 (CET)
Jag tycker inte det låter som en bra idé. Att Lars Lagerbäck är före detta svensk förbundskapten säger mer än att han är svensk före detta förbundskapten (och han är inte ens det senare).
andejons (disk) 9 november 2012 kl. 14.44 (CET)
Andejons har en bra poäng. Formulering är nog inte alltid fel. -Laxskinn (disk) 9 november 2012 kl. 17.29 (CET)

Ska SAOL vara vägledande för icke-triviala ändringar av ord och uttryck?Redigera

Jag har ett förslag till ändring av texten som finns i amboxen överst på AWB/Typos. Jag tycker att femte raden, som börjar "i enhetlighetssyfte gällande icke-triviala ändringar av ord, uttryck och egennamn..." ska ändras. Jag anser att SAOL bör vara vägledande för arbetet med AWB/Typos. Det bör då framgå av texten att så är fallet, vilket det inte gör nu. Vidare skulle man kunna ta bort det som står om "skogsbeklädd till skogbeklädd och armensk till armenisk". Det framgår ju av SAOL att "armenisk" och "skogbeklädd" inte har några godkända varianter (enligt SAOL). Däremot kan varianter av ord och uttryck användas om de finns i SAOL. Exempel på detta är, när det gäller ord, bl.a. ort(s)namn, där alltså både "ortnamn" och "ortsnamn" kan användas. När det gäller uttryck kan man t.ex. se på över huvud taget, där det finns två godkända varianter: överhuvudtaget och överhuvud taget. Kan det godkännas att jag ändrar i texten så att SAOL får avgöra hur ord ska skrivas i svwp (och även uttryck, ifall de finns i SAOL)? Sjunnesson (disk) 10 december 2012 kl. 12.50 (CET)

Är positiv till detta //Inteloutside2 (disk) 10 december 2012 kl. 13.39 (CET)
Nejtack. Även om SAOL är den främsta finns det även andra ordböcker. Skulle en form finnas med i NEO men inte SAOL så skulle inte jag anse den som felaktig. Punkten borde strykas helt; antingen är "armenisk" en godkänd stavning och bör inte ändras, eller så är den inte det och bör därför bytas ut. I nuläget uppmuntrar den snarare till ändringar som "överhuvud taget"->"överhuvudtaget".
andejons (disk) 10 december 2012 kl. 21.50 (CET)
Då tar jag bort den här punkten om "enlighetssyfte", eftersom jag tycker att den punkten är oklart skriven. Kanske finns det något annat som behöver läggas till istället? Sjunnesson (disk) 11 december 2012 kl. 15.56 (CET)
Ursäkta den långa svarstiden, men som den som för länge sedan formulerade ordalydelsen i punkten, vill jag förklara syftet med att ha med punkten.
Det är möjligt att punkten var lite otydligt skriven och att det är möjligt att skriva den tydligare. Men det är heller inte helt enkelt att formulera en punkt som försöker balansera mellan ytterligheter. Att förbjuda alla ord som inte finns med i SAOL och att tillåta alla ord som används i viss omfattning, "felstavade" eller ej. Vad jag minns har vi i många diskussioner berört denna balansgång och punkten finns med som ett resultat av dem. Inget att bara "plocka bort" utan att se till konsekvenserna.
Exemplet om att överhuvudtaget till över huvud taget är för trivialt för att tas med. Det är inte så pass felaktigt att det motiverar en redigering som påverkar personer som har sidan bevakad.
Däremot är det lite annorlunda med skogbeklädd/skogsbeklädd. Det är kanske inte möjligt att argumentera för att den ena formen är direkt felaktig. Sammansättningar med skog- har ibland binde-s, ibland saknas det. Däremot är SAOL tydlig genom att endast den ena formen tas med. Utan att smälla någon på fingrarna och säga att skogsbeklädd med "s" är en felaktig stavning, så är det ändå rimligt att ändra till den formen som finns med i SAOL. Kanske formuleringen "av enhetlighetsskäl" är väl klumpig, så om någon kan får han/hon gärna göra ett försök att omformulera. ~ Dodde (disk) 19 juni 2013 kl. 05.47 (CEST)
Skriv gärna en ny (kanske bättre) formulering. Sjunnesson (disk) 23 augusti 2013 kl. 10.06 (CEST)
Okej, la till punkten igen. Hoppas omformuleringen gjorde det lite tydligare. ~ Dodde (disk) 25 augusti 2013 kl. 16.38 (CEST)

KlassifieraRedigera

Enligt Wiktionary är "klassifiera" en godkänd variant av "klassificera" så kanske den raden ska avaktiveras i typolistan? //Inteloutside2 (disk) 24 januari 2013 kl. 17.51 (CET)

Nej, det tycker jag inte. Enligt mitt förra inlägg (det om SAOL) så tycker jag att vi ska ha en officiell källa för AWB/Typos och en sådan tycker jag inte att Wiktionary är. Jag kan mycket väl acceptera att även NEO används tillsammans med SAOL (som Andejons tycker i diskussionen om SAOL) men jag tycker inte att Wiktionary är i klass med SAOL och NEO. Wiktionary är ju ett systerprojekt till Wikipedia, men en skillnad är att på Wikipedia kräver vi i princip att allt ska vara källbelagt, men det gör inte Wiktionary. Det enda man kan utläsa om formen klassifiera på Wiktionary är att användare Bounce 1337 den 23 maj 2011 ansåg det vara en variant till "klassificera" och att samma användare vid samma tidpunkt på uppslagsordet "klassificera" ansåg "klassifiera" vara en variant, men "(mindre bruklig)". I SAOL och NEO finns enbart "klassificera" och ingen variant "klassifiera". Därför tycker jag att "klassificera" ska stå kvar som den godkända formen på AWB/Typos. Sjunnesson (disk) 25 januari 2013 kl. 10.33 (CET)
Håller med, raden bör vara kvar. Dock så finns "klassifiera" med i SAOB enligt vad som kom fram i diskussion på wiktionary idag. mvh//Inteloutside2 (disk) 26 januari 2013 kl. 04.31 (CET)
Bra! Vi har alltså fått fram SAOB som trolig källa till uppgiften på Wiktionary. SAOB säger att år 1936 ansågs varianten "klassifiera" som mindre bruklig. Det var alltså ett tag sedan ... Till yttermera visso (för att använda ett äldre uttryck) ger Google Scholar 191 träffar för "klassifiera" och 8440 träffar för "klassificera". Google Books ger 505 träffar för "klassificera" och 8440 träffar för "klassificera". Så Wiktionarys uppgift om "klassifiera" som "mindre bruklig" stämmer verkligen! Var kan man hitta diskussionen på Wiktionary? Den finns inte i deras Bybrunnen eller Fikarummet eller på diskussionssidorna för de båda varianterna "klassificera", "klassifiera". Så var ska man söka? Sjunnesson (disk) 26 januari 2013 kl. 11.20 (CET)
Med "diskussion" menas nog det här, fast den inte innehåller något väsentligare än SAOB-länken (som helt riktigt lades till igår). --Vesihiisi (disk) 26 januari 2013 kl. 11.28 (CET)
Tack för upplysningen. Jag trodde att det kanske var något mer än så. Sjunnesson (disk) 26 januari 2013 kl. 12.21 (CET)
Förresten ser jag nu att jag efter sökningarna på Google Books och Google Scholar i hastigheten råkade skriva fel ord i diskussionen härovan. Jag trodde ett tag att jag hade sökt på fel ord, men det var helt rätt. Jag råkade bara skriva fel när jag skulle redovisa resultatet. Jag ändrar därför de felaktiga "kvalifiera" och "kvalificera" härovan till de korrekta "klassifiera" och "klassificera". Sjunnesson (disk) 26 januari 2013 kl. 12.41 (CET)
Håller med om att raden ska vara kvar. Ett exempel på en sådan som går under den bortplockade punkten i diskussionen ovan :P ~ Dodde (disk) 19 juni 2013 kl. 05.52 (CEST)

Tills dessRedigera

I Språklådan (som Språknämnden ansvarar för) står det "I skrift heter det till dess. Ordet tills är ursprungligen en sammandragning av till och dess, och därför är det en upprepning att skriva tills dess." Kan jag då, med ledning av detta, göra en typorad som korrigerar de 155 förekomsterna av "tills dess att"? Det är olämpligt att göra en rad som korrigerar alla 314 "till dess", eftersom där också finns "falska positiv" som t.ex. "till dess avgång...". Finns det konsensus för att vi halvautomatiskt får ändra dessa 155 "tills dess att" till det korrekta "till dess att"? Sjunnesson (disk) 8 april 2013 kl. 10.37 (CEST)

Absolut! ~ Dodde (disk) 19 juni 2013 kl. 05.53 (CEST)

LiveRedigera

I AWB/Typos har vi i typoranden <Typo word="live-" find="\b(L|l)ive[\W-](framträdande|konsert|skiva)(\w*)" replace="$1ive$2$3" som anger att liveframträdande, livekonsert och liveskiva ska skrivas utan bindestreck. I SAOL finns liveartist, liveband, liveinspelning, livekonsert, livemusik och liveshow. De har inga varianter med bindestreck. Ändringen av live-framträdande till liveframträdande har ifrågasatts av en användare, (Användardiskussion:Sjunnesson). Just detta ord (live-framträdande, liveframträdande) saknas i SAOL. Finns det några åsikter i denna fråga? Ska vi ta bort "liveframträdande" från typoraden? Och ska vi kanske ta bort hela typoraden, så att inte heller "live-konsert" och "live-skiva" ändras? Sjunnesson (disk) 6 september 2013 kl. 10.09 (CEST)

Typoraden är skriven så att AWB vill korrigera om mellanslag eller bindestreck står mellan de två orddelarna. Det viktigaste tycker jag är att vi får bort rena särskrivningar som "live skiva" m.fl., dvs med mellanslag. Så ett alternativ kan vara att ändra raden så att bindestreck inte ger träff i AWB. //Inteloutside2 (disk) 6 september 2013 kl. 12.35 (CEST)
Ja, och då skulle vi också kunna lägga in de övriga orden med "live"som finns i SAOL. Sjunnesson (disk) 6 september 2013 kl. 12.40 (CEST)
Ja, absolut. Men vill tillägga att "liveframträdande" borde ju rimligen följa mönstret från de andra sammansättningarna med "live" som förled. SAOL kan ju inte räkna upp varenda sammansatt konstruktion som finns i svenska språket. //Inteloutside2 (disk) 6 september 2013 kl. 12.44 (CEST)
Argumentet för att använda bindestreck är att "live" är ett engelskt ord och därför ska förses med bindestreck i sammansättningar, men det verkar som om "live", åtminstone enligt Saol, är ett accepterat ord i svenskan, och därför används heller inget bindestreck i sammansättningar. Detsamma gäller ordet "show". Finns något som tyder på att det råder oenighet om detta sätt att hantera anglicismer i sammansättningar? ~ Dodde (disk) 9 september 2013 kl. 16.34 (CEST)
Det var först i och med AWB-körningen av liveframträdande som jag har sett någon invändning mot detta sätt att hantera anglicismer i sammansättningar, inte i övrigt. Sjunnesson (disk) 9 september 2013 kl. 16.41 (CEST)
Oenighet bland lingvister tänkte jag mer. Diskussioner hos Språkrådet, TT-språket, språkspalter, grammatikor, andra ordböcker. Språkbankens korpusar ([17]) verkar visa att utan bindestreck generellt är omkring tio gånger vanligare. Har för mig att bindestreck kan användas för att öka tydligheten i vissa fall (men har inte koll på exakta regler). Ds 2004:045 Myndigheternas skrivregler, stötte jag på, som skriver i avsnitt 7.2.2.: <quote> Vid sammansättningar där den ena leden är ett lånord som inte anpassats till svenskan (när det gäller uttal, böjning eller stavning) ska man undvika särskrivning, t.ex. catering bolag. Om tydligheten främjas kan man sätta ut ett bindestreck. (se även avsnitt 10.7.1): industridesigner, cateringbolag eller catering-bolag.</quote>. Det finns säkerligen mer att gräva i där. ~ Dodde (disk) 9 september 2013 kl. 21.28 (CEST)
Särskrivning ska i högsta grad undvikas. Svenskan har inte nederländskans eller danskans lösa förhållningssätt till ordsammansättningar. Det är nog alltid en fråga om bindestreck eller ej, beroende på hur etablerad och/eller försvenskad sammansättningen är.--Paracel63 (disk) 20 december 2013 kl. 00.09 (CET)

USAs, USA's -> USA:sRedigera

Jag har rättat "genitivrättning av förkortningar" så att den inte bara gör om USAs till USA:s, utan även [[USA]]s till [[USA]]:s. Det har nog varit tänkt att det skulle fungera så redan tidigare, men jag tror det såg lite fel ut. Samtidigt har jag förbättrat så att den även gör om det engelska USA's till svenska USA:s. Granska gärna min ändring. Svensson1 (disk) 7 september 2013 kl. 20.32 (CEST)

Ser fint ut. Anledningen till att det bara var koll på sluthakparenteser tror jag beror på att det egentligen bara är där en koll behöver göras, i skarven mellan förkortningen och fortsättningen som kan bestå av både bokstav eller inte bokstav. Bra med breddningen, jag breddade lite till //Inteloutside2 (disk) 8 september 2013 kl. 10.33 (CEST)
Det har du rätt i att hanteringen av hakparenteser redan fungerade. Jag har tagit bort det jag lade till angående hakparenteser. Svensson1 (disk) 14 september 2013 kl. 21.44 (CEST)

Fifa m.fl.Redigera

Raden Fifa är inaktiverad och det finns totalt tio rader med likadan syntax som är inaktiverade. På raden Fifa finns den här kommentaren inlagd:

Denna ger match för fetstilad/kursiverad Fifa, vilket är ett fel som är lätt att missa och som uppkommer lite då och då. Motsvarande fel för regexen nedan.

Jag hat testat uttrycket och inte funnit något problem då två apostrofer (kursiv stil) eller tre apostrofer (fet stil) används. Finns det verkligen ett problem med kursiv eller fet stil? Ska vi prova att aktivera några av de tio raderna? Svensson1 (disk) 15 september 2013 kl. 16.30 (CEST)

Fel på AWB vid sökning efter hakparenteser?Redigera

Jag försöker söka efter tvn och [[tv]]n för att ersätta det med tv:n och [[tv]]:n. Jag har provat dessa två find-uttryck:

\b(T|t)(V|v)(\]*)['’´;]?n\b
\b(T|t)(V|v)(\]\])?['’´;]?n\b

Replace-uttrycket ser ut så här:

$1$2$3:n

Båda find-uttrycken fungerar (tillsammans med replace-uttrycket) om man i AWB:s meny väljer "Tools", "Regex tester" och skriver in dem. De fungerar även i Javascript Regular Expression Tester. Men då jag kör AWB så hittar den i artikeln Joice endast förekomster av TVn, inte [[TV]]n. Kanske är det här något som borde felanmälas till AWB-utvecklarna? Svensson1 (disk) 15 september 2013 kl. 21.15 (CEST)

göteborgs-föddaRedigera

Här kommer ett språkproblem: AWB vill ändra göteborgs-födda till Göteborgs-födda. Bindestrecket ska förstås bort, och det kan jag ta bort manuellt. Men hur är det med versalen? Jag har inte sett någon diskussion på Wikipedia om man ska skriva adjektiv och substantiv som innehåller ett ortnamn med versal eller gemen. Jag har stött på liknande problem ett antal gånger förut, både när jag har jobbat med AWB och när jag har arbetat helt manuellt. Etablerade sammansättningar som gotlandsruss och ölandstok ska ju skrivas med gemen, men hur är det, som i det här fallet, när det gäller tillfälliga samansättningar. Det kan gälla adjektiv som t.ex. göteborgsfödda/Göteborgsfödda eller subststantiv som t.ex. stockholmsresa/Stockholmsresa, som alltså är tillfälliga sammansättningar. Jag har sett att dagstidningar oftast använder versal i sådana fall, men hur gör vi när det gäller Wikipedia? Sjunnesson (disk) 16 september 2013 kl. 10.58 (CEST)

Språkrådet tycks anse att det ska vara versal. Se dessa två frågor med svar (på samma webbsida) Stockholmsområdet eller stockholmsområdet? och Umeåbor, umeåbor, Umebor eller umebor?. Svensson1 (disk) 16 september 2013 kl. 23.06 (CEST)
"Göteborgs-födda"? Bindestrecket finns väl där för att binda samman två ord i grundform? Finns det ett foge-s, måste nog bindestrecket bort, så det inte blir tårta på tårta.--Paracel63 (disk) 20 december 2013 kl. 00.06 (CET)
Ja, bindestrecket ska tas bort. Men det kan göras manuellt, eftersom varje ändring som AWB föreslår kontrolleras av den som kör AWB. Sjunnesson (disk) 20 december 2013 kl. 08.36 (CET)

Ny undersida om reguljära uttryck?Redigera

Informationen om hur man använder reguljära uttryck tillsamman med AWB är ju ganska knapphändig. Jag skulle vilja utöka den, men det känns inte som AutoWikiBrowser/Typos är rätta stället. Den sidan är ju redan gigantisk. Vi kan väl göra som på engelska Wikipedia och ha en undersida som heter "AutoWikiBrowser/Reguljära uttryck"? Svensson1 (disk) 13 oktober 2013 kl. 18.02 (CEST)

Det verkar vara en bra idé att utöka informationen och lägga den på en undersida. Sjunnesson (disk) 14 oktober 2013 kl. 10.09 (CEST)

\b(?<!\b[0-3]?\d )((?>(?>[Jj]an|[Ff]ebr)uari|[Mm]a(?>rs|j)|april|[Jj]u[nl]i|[Aa]ugusti|(?>(?>sept|nov|dec)em|[Oo]kto)ber)) ([0-3]?\d) ?, ?([12]\d{3})\b(?!-| den\b)Redigera

Kan någon hjälpa till att ändra koden ovan till att ändra t.ex. Januari 13, 1931 till 13 januari 1931 instället av 13 Januari 1931. (Ping: Sjunnesson?) Josve05a (diskussion) 1 april 2014 kl. 09.44 (CEST)

Jag skickar frågan vidare till Svensson1, som är bättre på AWB/Typos, än vad jag är. Sjunnesson (diskussion) 1 april 2014 kl. 10.26 (CEST)
Jag antar att det är den regel som heter datum7 som vi pratar om. Vet tyvärr inget annat sätt än att dela upp den på flera regler. Den befintliga får ta hand om april, september, november och december där man ej hanterar inledande versal eftersom det kan vara en engelsk datumuppgift som inte ska ändras. Sen gör man en regel, datum7j, för januari, juni och juli, en, för februari, en för mars och maj, en för augusti och en för oktober.
Så här:
<Typo word="datum7" find="\b(?<!\b[0-3]?\d )(april|(?>sept|nov|dec)ember) ([0-3]?\d) ?, ?([12]\d{3})\b(?!-| den\b)", replace = "$2 $1 $3" />
<Typo word="datum7j" find="\b(?<!\b[0-3]?\d )[Jj](anuari|uni|uli) ([0-3]?\d) ?, ?([12]\d{3})\b(?!-| den\b)", replace = "$2 j$1 $3" />
<Typo word="datum7f" find="\b(?<!\b[0-3]?\d )[Ff](ebruari) ([0-3]?\d) ?, ?([12]\d{3})\b(?!-| den\b)", replace = "$2 f$1 $3" />
<Typo word="datum7m" find="\b(?<!\b[0-3]?\d )[Mm](ars|aj) ([0-3]?\d) ?, ?([12]\d{3})\b(?!-| den\b)", replace = "$2 m$1 $3" />
<Typo word="datum7a" find="\b(?<!\b[0-3]?\d )[Aa](ugusti) ([0-3]?\d) ?, ?([12]\d{3})\b(?!-| den\b)", replace = "$2 a$1 $3" />
<Typo word="datum7o" find="\b(?<!\b[0-3]?\d )[Oo](ktober) ([0-3]?\d) ?, ?([12]\d{3})\b(?!-| den\b)", replace = "$2 o$1 $3" />
--Larske (diskussion) 21 april 2014 kl. 12.29 (CEST)
Befintliga uttryck fungerar, men det finns ett datumuttryck som flyttar om orden och ett flertal månadsnamnsuttryck som ändrar versaler till gemener. Uttrycken utförs dock i en sådan ordning så att man behöver göra två körningar för att utföra det Josve05a vill göra. Vill man både flytta om orden och ändra versaler till gemener med en körning måste man som Larske skriver göra flera uttryck. Svensson1 (diskussion) 13 maj 2014 kl. 08.16 (CEST)

Error messageRedigera

@Sjunnesson: "Duplicate typo rule "\b(F|f)öljetångar(\w*)' found." - Josve05a (diskussion) 12 maj 2014 kl. 02.30 (CEST)

Duplikat raderat. Sjunnesson (diskussion) 12 maj 2014 kl. 08.06 (CEST)
Det var fel rad som togs bort. Jag åtgärdade det. Svensson1 (diskussion) 13 maj 2014 kl. 07.54 (CEST)

Svenska AkademienRedigera

Känner mig lite rostig på Regex så jag tar detta här innan det läggs in: Svenska Akademin -> Svenska Akademien

<Typo word="Svenska Akademien" find="\bSvenska Akademin(\w*)" replace="Svenska Akademien$2" />

Eller så kanske det räcker med att köra på bara "Akademin" -> "Akademien". Vet inte riktigt om det finns några undantag. -Laxskinn (diskussion) 8 augusti 2014 kl. 00.13 (CEST)

Uttrycket var i stort sett rätt. Jag har lagt in det nu (lite modifierat). Man kan inte titta på enbart ordet "Akademin" eftersom ordet sedan länge stavas just så. Svenska Akademien grundades dock på den tiden ordet stavades "Akademien" och har behållit sitt namn. Svensson1 (diskussion) 8 augusti 2014 kl. 20.37 (CEST)
Vad tror ni om att fånga även akademin och akademien med [Aa]kademie?n i stället för bara Akademin, så här alltså:
<Typo word="Svenska Akademien" find="\bSvenska [Aa]kademie?n(s)?\b" replace="Svenska Akademien$1" />
--Larske (diskussion) 8 augusti 2014 kl. 22.51 (CEST)
Jag har lagt in det nu. Svensson1 (diskussion) 9 augusti 2014 kl. 12.53 (CEST)

Jag förstår inteRedigera

Varför behövs (\w*)? Nirmos (diskussion) 8 oktober 2014 kl. 08.22 (CEST)

Det är endast för redigeringssammanfattningens skull, så att den innehåller det fullständiga ordet som bytts ut. Det påverkar alltså inte huruvida ordet som ska bytas ut hittas eller inte. Svensson1 (diskussion) 8 oktober 2014 kl. 08.33 (CEST)
Ahh, då förstår jag! Tack, Svensson1! Nirmos (diskussion) 8 oktober 2014 kl. 08.36 (CEST)

Kan göra listan snabbareRedigera

Man kan göra listan snabbare så här:

  1. Gå till regex101.com
  2. Skriv in (?<!\\)\(([a-zåäö])\|([a-zåäö])\) under REGULAR EXPRESSION
  3. Använd gui som flaggor
  4. Kopiera in wikikoden under TEST STRING (Min dator pallar inte hela wikikoden, men det finns inget som säger att man måste göra allt på en gång. Kan göra några bokstäver i taget.)
  5. Skriv in [$1$2] under SUBSTITUTION
  6. Kopiera det du får tillbaka som den nya wikikoden

Min poäng är att det ger 1153 träffar, så om man vill göra det, så vill man inte göra det manuellt. Därför kan det vara bra att diskutera saken först och låta andra titta på det reguljära uttrycket jag har kokat ihop. Jag har gjort några stickprov och det verkar fungera bra. Synpunkter? Nirmos (diskussion) 8 oktober 2014 kl. 09.46 (CEST)

Jag vet inte om jag gjorde fel, men när jag testade detta så var de enda ändringar som föreslogs att ta bort parenteser som dock är nödvändiga eftersom innehållet i dem används i Replace-uttrycken. Förresten tror jag det är bra om de flesta uttryck är så enkla så att många kan redigera dem. Jag har bara försökt hastighetsoptimera några av de större mer komplexa uttrycken. Svensson1 (diskussion) 8 oktober 2014 kl. 19.34 (CEST)
Jag ber om ursäkt – jag tänkte inte på att dessa parenteser behövs av annan anledning. Du gjorde nog helt rätt när du testade – [Aa] är båda snabbare och ett tecken kortare än (A|a).
Jag tycker bara att det är lite synd att både fånga och återanvända tecken som man inte alls är intresserad av. Därför hade jag ändrat
find="\b(A|a)brubt" replace="$1brupt"
till
find="(?<=\b[Aa])brubt" replace="brupt"
Å andra sidan skulle det inte ge snygga redigeringskommentarer. Jag ger mig.   Nirmos (diskussion) 10 oktober 2014 kl. 04.08 (CEST)

Icke-Redigera

Vad tror ni om att lägga till "(a|t)?", dvs ett optionellt a eller t, på slutet, före (\w) i uttrycket för "icke-"?

Så här:

<Typo word="icke-" find="\b(I|i)cke((?>adlig|angrepps|häckande|häckare|judar|judisk|kommersiell|krist|kunglig|linjär|medborgare|medicinsk|muslim|mänsklig|negativ|religiös|spridning|statlig|svensk|tom|trivial|troende|verbal|våld)(a|t)?)(\w*)" replace="$1cke-$2$3" />

Med detta tillägg fångas även "ickekommersiellt", "ickekungliga", "ickelinjärt", "ickemänskliga", "ickenegativt" med flera. --Larske (diskussion) 19 oktober 2014 kl. 15.31 (CEST)

Det är en bra idé, tycker jag. Sjunnesson (diskussion) 19 oktober 2014 kl. 15.40 (CEST)
Alla böjningar tas med redan nu eftersom uttrycket avslutas med "(\w*)" i stället för "\b" som vissa andra uttryck avslutas med. Så uttrycket behöver inte ändras. (Det är egentligen inte "(\w*)" som gör att det fungerar, utan avsaknaden av "\b".) Svensson1 (diskussion) 19 oktober 2014 kl. 16.10 (CEST)
Aha, tack. Jag läste det slarvigt som "ordslut", men det var ju tvärtom. --Larske (diskussion) 19 oktober 2014 kl. 16.49 (CEST)

Passade på att ta bort ickevåld. Den formen är såpass vanlig att man inte gärna kan säga att den med bindestreck är mer lämplig. /NH 19 oktober 2014 kl. 15.56 (CEST)

När jag en gång lade in icke-våld med bindestreck gick jag på de uppgifter som SAOL, Nationalencyklopedin och Nationalencyklopedins ordbok har. Dessa tre skriver med bindestreck. Nu har jag kollat i Språkrådets bok "Svenska skrivregler" (som jag inte själv äger) och funnit att de går på samma linje som NH. De skriver att för mycket vanliga ord som börjar med icke (som icke-kristen/ickekristen och icke-våld/ickevåld) kan båda skrivsätten användas. Därför har jag nu även tagit bort "icke-krist" ur typoraden "icke-". Sjunnesson (diskussion) 20 oktober 2014 kl. 12.38 (CEST)
Fint. Det kan nog till och med finnas vissa sammanhang där icke-kristen är mest lämpligt, och vissa där ickekristen är att föredra. Det vore synd att köra över skribenternas språkkänsla genom att likrikta skrivsätten. Jag ska se om det kanske finns någon mer icke-sammansättning som kan ses över. /NH 20 oktober 2014 kl. 13.02 (CEST)

UniversitätRedigera

@Inteloutside2: Borde det inte alltid vara stort U i början? Det vill säga

  • <Typo word="Universität" find="\b(U|u)n(iveris?i?t|ivsersit|iverstit?|ivesit|versit)ät\b" replace="Universität" />

i stället för

  • <Typo word="Universität" find="\b(U|u)n(iveris?i?t|ivsersit|iverstit?|ivesit|versit)ät\b" replace="$1niversität" />

--Larske (diskussion) 8 november 2014 kl. 12.21 (CET)

Ah, javisst. Jag ändrar :) mvh //Inteloutside2 (diskussion) 8 november 2014 kl. 12.26 (CET)

Utan dess likeRedigera

Såg i historiken att ett regex som ändrar "utan dess like" till "utan like" både las till och togs bort 2014-11-10. "Utan dess like" är iaf enligt min åsikt en felskrivning och jag tycker den raden bör finnas med, den är i samma stil som "tillhör en av de", "ta tillvara på" m.fl. //Inteloutside2 (diskussion) 11 november 2014 kl. 20.36 (CET)

Se Användardiskussion:Fredrik Östman#Utan (dess) like. Eftersom "utan dess like" är mer frekvent än "utan like" både på nätet (enligt Google), enligt Språkbanken och i tidningstext (Mediearkivet) har den som menar att det är icke-etablerat språkbruk lite att bevisa. Jag har för mig att detta togs upp i radioprogrammet Språket för några år sedan; hittar inte det på nätet men däremot t ex http://sofi.imcms.net/2455#item103600 . /NH 11 november 2014 kl. 22.37 (CET)
"Utan dess like" betyder inte "utan like". Jämför "han kom med sin son" och "han kom utan sin son", som båda lika tydligt säger oss att mannen i fråga har en son. Den kristna guden är en gud med son, den muslimska en gud utan son. Det skulle vara rent trams att säga "han ber till Allah, en gud utan dess son". Precis samma trams är det att säga "han är forward, en fotbollsspelare utan dess like". Du behöver bara gå tillbaka några år i arkiven, så finns inte ett enda "utan dess like". Det är en kontamination. Fredrik Östman (diskussion) 12 november 2014 kl. 08.48 (CET)
Vi borde också förvänta oss att se förekomster av "utan sin like", "utan min like", "utan din like", "utan deras like", "utan hans like" o.s.v. Men det gör vi inte. Fredrik Östman (diskussion) 12 november 2014 kl. 08.51 (CET)
Jo, "utan dess like" betyder "utan like", för det används precis i den betydelsen. Det stämmer att det är en relativt ny företeelse (det verkar ha blivit vanligt för sådär 20–30 år sedan), men är nu såpass vanligt förekommande i alla sorters texter att det inte kan anses felaktigt. Och alltså bör det inte bytas ut automatiskt. Se t ex länken ovan. Visa gärna en källa som säger något annat! /NH 12 november 2014 kl. 09.15 (CET)

Mellan... ochRedigera

Raden "mellan ... och" ändrar skrivningar som "mellan 2010 till 2014" till "mellan 2010 och 2014" och det funkar alltid fint för årtal. Men jag blir ofta tveksam i de fall det inte handlar om årtal. Ex artikeln BGM-71 TOW där det står: "genomslagsförmågan varierar mellan 600 till 1000 mm". Det blir väl bättre där med "från 600 till 1000 mm". Kanske kan vara en idé att testa att dela upp raden i två rader, där årtalsändringen blir "mellan .. och" och övriga tal blir "från .. till". //Inteloutside2 (diskussion) 19 februari 2015 kl. 10.23 (CET)

Fast nu när jag kollar närmare på det, så blir det inte heller bra att alltid använda "från ... till" för övriga tal. Ex: "flockar på mellan 10 till 50 djur". Kanske det är vissa verb (t.ex. "varierar") framför mellan, som gör att mellan-och låter konstigt. "Variererar mellan 600 och 1000" låter för mig som att det finns två lägen, 600 eller 1000, och inget däremellan. //Inteloutside2 (diskussion) 19 februari 2015 kl. 12.29 (CET)

"anledning till varför", "orsak till varför"Redigera

Jag har idag skrivit tre typorader: "orsak till varför", "orsaken till varför" och "anledning till varför". När jag tittade närmare på de tre uttrycken tyckte jag att det var lite tveksamt om "anledning till varför" lika ofta är felaktigt som "orsak till varför". Annars bör väl "anledning" och "orsak" ha samma betydelse? Enligt Wiktionary är både "anledning" och "orsak" "något som leder till något annat". I till exempel denna mening "Klebold bad Todd om att ge honom en anledning till varför han inte skulle mörda honom" tycker jag att "varför" nog bör stå kvar. Finns det några åsikter om de här uttrycken? Sjunnesson (diskussion) 14 mars 2015 kl. 09.55 (CET)

Jag fick nu se att jag har fört samma diskussion 2011, och att raden redan fanns som disabled. Dubbletten har jag nu tagit bort. Sjunnesson (diskussion) 14 mars 2015 kl. 10.01 (CET)
Enligt vad jag har lärt mig ligger orsaken djupare. "Anledning" och "skäl" är däremot synonymer. Tostarpadius (diskussion) 9 april 2016 kl. 11.44 (CEST)

Olika talRedigera

@Svensson1: Är det säkert att [[254 (tal)|255]] ska ändras till [[255 (tal)|255]]? Det skulle väl lika gärna kunna vara [[254 (tal)|254]] som är det rätta. --Larske (diskussion) 19 april 2015 kl. 16.04 (CEST)

Ja, ganska säker kan man vara för det är ju det högra talet som visas. Den som har skrivit texten bör ju ha sett om det står 254 i artikeln samtidigt som författaren vill att det ska stå 255. Men den som kör AWB kan naturligtvis kontrollera det hela då denna typ av fel påträffas (vilket jag valde att göra vid min redigering av "Friedlander–Iwaniecs sats" i dag). (Uttrycket har funnits länge, jag bara flyttade på det i dag.) Svensson1 (diskussion) 19 april 2015 kl. 16.11 (CEST)

beaktning→beaktandeRedigera

@Sjunnesson: Att ersätta beaktning med beaktande blir lite tokigt om det står "ta i särskild beaktning". Såg just att du lagt till en kommentar om detta nu, men ska inte den här typo-listan kunna köras automatiskt, utan manuella ändringar? --Larske (diskussion) 26 juli 2015 kl. 17.03 (CEST)

Jag har just fått en fråga från Klementin varför jag över huvud taget ändrar "tar i beaktning" till "tar i beaktande". Kanske detta bör redas ut först? Om det här över huvud ska vara kvar, så är då frågan hur man automatiskt kan ändra föregående adjektiv så att det blir korrekt. Men man kanske i så fall ska ändra tillbaka som det som var förut, "ta (m.fl. böjningsformer) i beaktande" och strunta i enbart "beaktning" så uppstår inte det här problemet. Men automatiskt tycker jag inte att man kan köra AWB/typos. En hel del uttryck måste hela tiden kontrolleras, så att det inte blir fel. Det är ju frågan om halvautomatisk körning. Sjunnesson (diskussion) 26 juli 2015 kl. 17.21 (CEST)
@Sjunnesson, Klementin: OK, bra med halvautomatiskt. Jag känner mig också lite främmande för ordet beaktning. Skulle det vara en synonym till beaktande eller ett ord med någon annan betydelse? Varför finns det inte med i SAOL eller NE:s ordbok? Det förekommer att man skriver beaktningsvärda skäl (Google ger cirka 500 träffar), men jag tror att det är en felskrivning av beaktansvärda skäl (mer än 14 000 träffar). Å andra sidan så nämns beaktning som ett besläktat ord i wikt:beakta och ta i beaktning finns med i språkbanken. Kan det vara så att beaktning endast finns som en del i sammansatta uttryck och inte som ett eget ord med en egen, fristående, betydelse?
Flytta gärna den här tråden till lämpligare plats. --Larske (diskussion) 26 juli 2015 kl. 19.10 (CEST)
@Klementin: Jag har avaktiverat den aktuella raden tills vidare, så att det blir utrett hur det egentligen ska vara. Vad tycker du? Sjunnesson (diskussion) 26 juli 2015 kl. 21.16 (CEST)
Jag har aldrig reflekterat över uttrycket, och googlade innan jag kontaktade din bot @Sjunnesson:Jag gjorde ungefär samma upptäckter som @Larske: men noterade också att SAOL föreslog uttrycket "ta i beaktande" precis som du nu ändrar~det till. SAOB reagerar bara på sökningen "beakta", och nämner "beaktande" som vbalsbst, medan "beaktning" finns i sammansättningen "beaktningsvärd". Uttrycket "ta i beaktning" är, vilket man märker om man googlar, dock mycket välspritt också om man ser till "vårdat-språk-träffar" (tidningar, riksdagens motioner och betänkanden etc). Om man ska se till användning så är min form etablerad, men bortsett från språkbanken hittar jag inget stöd från någon auktoritativ källa (sitter långt från mina böcker just nu, så jag kan inte kolla dem). Jag tänker att detta nog behandlas i någon språkvårdslitteratur eftersom båda uttrycken tycks användas parallellt.Klementin (diskussion) 27 juli 2015 kl. 06.41 (CEST)
Jag upptäckte den här diskussionen. I sak får jag nog hålla med Sjunnesson, eftersom ordet "beaktning" inte finns i ordböckerna, medan beaktande gör det. Google ger 74000 mot 20000 för "ta i beaktande". Jag hittar just nu ingen språkvårdande institution som stödjer "ta i beaktning". Angående "beaktningsvärd"… SAOB anger ordet som föråldrat, medan samma markering inte görs för "beaktansvärd". SAOL #13 och NEO har "beaktansvärd" men inte "beaktningsvärd". Allt gott.--Paracel63 (diskussion) 4 augusti 2015 kl. 23.39 (CEST)

Stavning av "provensalsk"Redigera

I går fick jag ett meddelande på min diskussionssida av en användare som tyckte att det var fel att AutoWikiBrowser ändrar "provençalsk(a)" till "provensalsk(a)" (https://sv.wikipedia.org/w/index.php?title=Anv%C3%A4ndardiskussion:Sjunnesson&oldid=31859881). Alla källor som jag har hittat har stavningen "provensalsk(a)" och ingen har stavningen "provençalsk(a)". Finns det några andra åsikter om den här stavningen? Sjunnesson (diskussion) 23 december 2015 kl. 10.25 (CET)

Jag fick nu ett meddelande att användaren tycker att ändringen är korrekt, så det behöver kanske inte diskuteras vidare. Sjunnesson (diskussion) 23 december 2015 kl. 10.40 (CET)

Kommer (att)Redigera

För arkiven, eftersom jag tog upp frågan på ett annat ställe: Det är inte direkt fel att utelämna att i uttryck som "det kommer (att) byggas en ny station". Det ska alltså inte ändras automatiskt. Se t ex http://www.svd.se/jag-kommer-att-undvika-irritation . /NH 23 februari 2016 kl. 19.10 (CET)

Från 1 000 000 miljoner till 1 miljonerRedigera

Kan någon förklara varför AWB föreslår följande stora (och felaktiga) ändring "Storbritanniens BNP var år 1990 ca 1 000 000 miljoner US dollar och hade år 2010 ökat till ca 2 300 000 miljoner US dollar." till "Storbritanniens BNP var år 1990 ca 1 miljoner US dollar och hade år 2010 ökat till ca 2 300 000 miljoner US dollar." i artikeln Storbritanniens ekonomi? Går det att ändra någon typorad så att inte sådana fel uppstår? Sjunnesson (diskussion) 21 mars 2016 kl. 08.16 (CET)

Har också stött på den raden ibland, men då gjorde raden rätt. Artiklar om fotbollsspelare som sålts för exvis 4 000 000 miljoner kronor. I exemplen du nämner tycker jag det är bättre att skriva om i artiklarna till "1 000 miljarder US dollar". //Inteloutside2 (diskussion) 21 mars 2016 kl. 19.22 (CET)
Det är jag som lagt in (för länge sedan) att "500 hundra" ändras till "500", "5 000 tusen" ändras till "5 000" och "5 000 000 miljoner" ändras till "5 miljoner". De två förstnämnda fallen är alltid felskrivningar. Det tredje fallet (med miljoner) är nog så gott som alltid en felskrivning. Men tydligen finns det ett ytterst fåtal artiklar (tre för närvarande tror jag) där någon valt att skriva så i stället för att använda orden miljarder eller biljoner (se här), vilket gör att AWB:s föreslagna ändring är fel, men de artiklarna borde vi väl ändra. Det är väl inte ett normalt skrivsätt. Svensson1 (diskussion) 9 april 2016 kl. 08.35 (CEST)
Kan inte du ändra de här tre felen, så att de inte finns med? Det känns lite obehagligt när det dyker upp, och man tänker "Hjälp, det här kunde jag kanske ha missat!" Sjunnesson (diskussion) 9 april 2016 kl. 09.21 (CEST)
Nu har jag ändrat de tre artiklarna. Då såg jag att två av dem innehöll sådana fel som AWB-uttrycket skulle gjort rätt i att ändra. Endast BNP-uppgiften som nämnts ovan skulle varit fel av AWB-uttrycket att ändra. Svensson1 (diskussion) 9 april 2016 kl. 15.33 (CEST)
Bra! Tack för hjälpen. Sjunnesson (diskussion) 9 april 2016 kl. 15.47 (CEST)

KändasteRedigera

"Kändaste" förekommer i nästan 300 artiklar, "kändare" är ganska vanligt också. Är detta ok språkbruk, kan inte hitta någonstans att detta är godkänt. Ska vi ta och lägga in en rad som byter kändaste mot "mest kända". Kändare kanske vi måste ta manuellt eftersom det ibland ska vara "mer känd" och ibland "mer kända". //Inteloutside2 (diskussion) 25 mars 2016 kl. 10.40 (CET)

"Kändaste" etc är nog inte att rekommendera eftersom man kan tänka sig att det stör ganska många läsare. Men jag tycker inte man kan säga att det är såpass fel att det ska tas upp på den här listan. Se t ex DN:s språkspalt. /NH 25 mars 2016 kl. 13.08 (CET)

Finns det konsensus för behandlingen av "kommer (att)"?Redigera

Jag har för ett tag sedan avaktiverat typoraden "kommer att" på grund av ett inlägg av NH på min diskussionssida: här. Tostarpadius anser att raden ska återaktiveras. "Jag anser att det är ytterst störande när det utelämnas. Det är också en stilfråga. I ledig text på bloggar och i social media kan det knappast betraktas som felaktigt, men här bör vi vara mer formella än så (i varje fall i artikeltext). Jag förespråkar därför att korrigeringen återupptas."

Som stöd för sin åsikt att "kommer att" inte ska ändras av AWB har NH en länk från DN: http://www.svd.se/jag-kommer-att-undvika-irritation. I den länken finns också en hänvisning till Språkriktighetsboken, Svenska språknämnden 2005. I den står följande (s. 360): "Det omdiskuterade hjälpverbet "komma (att)" hör hör numera till de verb där att i praktiken är frivilligt" och "Idag är båda formerna fullt acceptabla". Men eftersom detta anses från officiellt språkvårdshåll kan vi inte både ta bort den här raden från AWB, och ändå anse att det är tillåtet att ändra manuellt. Enligt NH: "Frågan gällde automatiska rättningar med AWB. Eftersom man kan tänka sig att en del användare medvetet utelämnar att i enlighet med sin egen språkkänsla, och eftersom det inte direkt är fel att göra så, så ska det nog inte ändras automatiskt. Däremot ser åtminstone jag inga problem med att man gör det för hand, i samband med andra redigeringar." Varför ska det vara någon skillnad? Några helt automatiska rättningar finns inte, de är halvautomatiska, så att de ändringar AWB föreslår godkänns eller avvisas manuellt. Det är alltså egentligen ingen skillnad på att göra så som NH m.fl. gör manuellt, enligt ovan, och det som görs med AWB. Ingen kan veta om "en användare medvetet utelämnar att i enlighet med sin egen språkkänsla", och skulle man mot förmodan vara tankeläsare, är det ändå frågan vilken användares språkkänsla som ska vara rådande. Sjunnesson (diskussion) 8 april 2016 kl. 11.32 (CEST)

Tack för notifieringen!
Det är skillnad på att låta AWB byta ut alla förekomster av ett skrivsätt som anses korrekt (vilket det gör enligt källorna ovan) för att man inte själv gillar det, och att ändra det medan man ändå gör andra redigeringar i artikeltexten. Vi har inte "automatisk" rättning av språkfel för att eliminera skrivsätt som vissa av oss inte tycker om, utan just för att rätta sådant som är direkt felaktigt eller av andra skäl bör bytas ut (en del förkortningar t ex).
Visst kan man tänka sig att någon använder sökfunktionen och rättar alla "kommer…" till "kommer att". Han eller hon kan antagligen också räkna med att stöta på patrull. Men här gällde det om denna rättning ska finnas med bland sådant som AWB gör tillsammans med stavfel etc.
/NH 8 april 2016 kl. 18.43 (CEST)
Jag anser också att den redigeringen bör hållas borta från awb. Vi brukar vara mycket restriktiva till massredigeringar som inte är helt okontroversiella och det tycker jag vi bör vara här också eftser som det inte är självklart att föredra endera varianten. --افيراتير (diskussion) 8 april 2016 kl. 22.22 (CEST)
Instämmer med Averater. //Romulus74 (diskussion) 8 april 2016 kl. 22.29 (CEST)
Det är också min åsikt. Och jag håller helt med om att "principen här brukar ju vara att när två skrivsätt är godtagbara så ska man inte ändra." som NH har skrivit på min diskussionssida. Men bortsett från "massredigeringar" har NH också skrivit på min diskussionssida: "Däremot ser åtminstone jag inga problem med att man gör det för hand, i samband med andra redigeringar." Då har ju NH sagt emot sig själv att man inte ska ändra när två skrivsätt är godtagbara.
Diskussioner om AWB/Typos bör alltid föras på den här sidan, eftersom alla registrerade användare kan redigera AWB/Typos och ingen har ensam ansvar för den sidans innehåll. Jag borde alltså genast ha flyttat den diskussion som NH började föra på min diskussionssida, utan att göra fler åtgärder, det har jag insett sedan, och jag ber om ursäkt om den uteblivna diskussionsflytten har strulat till diskussionen. Sjunnesson (diskussion) 9 april 2016 kl. 08.55 (CEST)
Praxis är att det är en gradskillnad mellan att göra en redigering med bot eller för hand. Men jag skulle stoppa även en användare som redigerar för hand om den gjorde den typen av redigeringar i massa artiklar. Att vi tycker det är ok att ändå ändra så när man ändå ändrar annat är nog en pragmatisk lösning. Dels så orkar vi inte bry oss, dels så vet inte alla att deras "rättning" inte är så självklar och dels så ska språket vara konsekvent inom en artikel. Jag tror ett tillåtande som vi nu har det är bästa lösningen. --افيراتير (diskussion) 9 april 2016 kl. 09.20 (CEST)
Jag antar att du inte menar enbart "bot", för AWB kan ju även köras utan bot. Det gäller alltså "halvautomatiska rättningar utifrån listan AWB/Typos", om jag har förstått dig rätt. Sjunnesson (diskussion) 9 april 2016 kl. 09.27 (CEST)
Ja. --افيراتير (diskussion) 9 april 2016 kl. 09.57 (CEST)

I tabellen nedan visas antalet förekomster med respektive utan "att" som i skrivande stund finns på svwp. Några av förekomsterna utan "att" kommer från citat, tidningsrubriker eller titlar på böcker och sånger och dessa ska naturligtvis inte ändras. Övriga bör enligt min uppfattning kompletteras med "att", men det behöver alltså granskas i varje enskilt fall.

--Larske (diskussion) 9 april 2016 kl. 10.30 (CEST)

Tabellerna är intressanta. Men utan att ytterligare gå in på det som diskuteras här, vill jag rent allmänt påpeka att citat kan vara felskrivna eller felöversatta och boktitlar och tidningsrubriker kan vara felskrivna av wikipedianvändare. Sådant förekommer då och då, och när det gäller artiklar översatta från engelska är felöversatta citat rätt vanliga, och det är förstås tillåtet att rätta till. Sjunnesson (diskussion) 9 april 2016 kl. 11.55 (CEST)
Sånt som är felskrivet ska givetvis rättas. Exempel på vad jag avsåg är rubriken på den här tidningsrubriken som används som källa i Stig Bergling. --Larske (diskussion) 9 april 2016 kl. 12.05 (CEST)
Om en viss formulering är accepterad av språkvårdare (utan förbehåll à la "i vardagligt språk") bör den inte ändras systematiskt (med bot, efter sökning på formen ifråga eller med AWB). Trots att AWB inte gör ändringar på eget bevåg är jag övertygad om att användarna ofta slentrianmässigt godkänner de föreslagna ändringarna. När det drabbar former som jag föredrar brukar jag bli rejält irriterad. Däremot håller jag med Siv Strömquist, citerad i den ursprungliga diskussionen: "Den som vill undvika att väcka irritation ska nog välja kommer att-varianten ett tag till." Jag kommer att fortsätta lägga till "att" när jag stöter på "kommer göra" (men givetvis då se till att stycket också i övrigt håller viss språklig standard, om jag inte har tid med det gör jag inte ändringar annat än då de påverkar i sak). --LPfi (diskussion) 9 april 2016 kl. 10.51 (CEST)
Jag ser att kommer göra-formerna är mycket ovanliga. Jag vet inte om det beror på AWB eller om det faktiskt är så att våra mer flitiga medarbetare alla använder "kommer att". I det senare fallet är användande av AWB på den här punkten inget problem (och "Idag är båda formerna fullt acceptabla" överilat). --LPfi (diskussion) 9 april 2016 kl. 10.58 (CEST)
Fram till för ett par månader sedan ändrades ju många "kommer…" till "kommer att" regelmässigt. I februari stängdes detta av efter diskussion på Sjunnesons diskussionssida. Därför säger nog tabellen ovan inte särskilt mycket. Anledningen till att jag tog upp saken just med Sjunnesson var två: Dels var det redigeringar av Sjundebot som fick mig att reagera, dels var det Sjunnesson som ursprungligen införde "kommer att" i listan över fel som rättas med AWB. /NH 9 april 2016 kl. 12.23 (CEST)
Och den fylldes senare på av andra användare. Sjunnesson (diskussion) 9 april 2016 kl. 12.29 (CEST)
Och eftersom ovanstående visar att NH vänder sig just mot mig, kan jag sluta att göra redigeringar, om det är det användaren önskar. Övriga användare i denna diskussion har varit mycket sansade. Sjunnesson (diskussion) 9 april 2016 kl. 13.07 (CEST)
Om du uppfattat inläggen som otrevliga så ber jag verkligen om ursäkt. Det verkar lite som att du läser in en fientlig inställning hos mig i dem – jag kan bara försäkra att så är det inte. Det var det faktum att rättningen fanns med på listan som jag vände mig mot – inget annat. Att jag frågade dig, och inte gjorde ett inlägg här, berodde på att jag både såg att det var du som lagt till den ursprungliga raden i listan och att de redigeringar jag uppmärksammade gjorts av dig (kontot Sjundebot). Mitt första inlägg på din diskussionssida under den rubriken börjar "Jag undrar…", och precis så var det. Eftersom du sysslar mycket med språkvård och rättande av språkfel tänkte jag att du nog skulle kunna svara. /NH 9 april 2016 kl. 15.57 (CEST)
Svar kommer på din diskussionssida. Sjunnesson (diskussion) 9 april 2016 kl. 16.21 (CEST)

Beträffande listan som Larske har tagit fram: Jag är inte säker på att så många ändringar av "kommer" till "kommer att" har gjorts med AWB, och att tabellen inte "säger särskilt mycket" kan man inte veta, om man inte har tittat på alla "kommer att" och ser vilka av dem som hade enbart "kommer" från början. Säkert har många användare skrivit "kommer att" från första början. På andra ställen kan det ha blivit manuellt ändrat och har då inget med raden i AWB att göra. Vad vår språkkänsla säger är nog väldigt olika, bland annat beroende på vår ålder och på vilket språkintresse vi har. Vad som är "rätt" och vad som är "fel" är därmed inte så lätt att avgöra. Ibland påstås det att ändringar via AWB skulle vara massändringar, men det är inte så det fungerar. Man kan inte jämföra t.ex. med det som Lsj-bot gör, där man med fog kan tala om massredigeringar av artiklar. Sjunnesson (diskussion) 10 april 2016 kl. 09.02 (CEST)

AWB använd på olika sätt. Det handlar inte per definition om massändringar, men det kan göra det. Ibland missbrukas redskapet till redigeringar i mängd kring vilka det ännu inte råder konsensus och vilka det är näst intill omöjligt att återställa manuellt. I detta fall har det definitivt inte varit så. Jag tycker mig kunna avläsa ett tydligt stöd för dessa korrigeringar. Tostarpadius (diskussion) 11 april 2016 kl. 18.37 (CEST)

Teorien och teologienRedigera

Dessa två ord skrivs i SAOL som "teorin" och "teologin". Inga varianter anges. Det verkar vara i äldre språk det har skrivits -ien. Ett antal förekomster av "teorien" och "teologien" finns i svwp. Är det lämpligt att göra halvautomatiska rättningar av de här orden? Sjunnesson (diskussion) 13 april 2016 kl. 11.05 (CEST)

Formen teorien finns med i SAOL fram till och med upplaga 11 (1986) och togs bort i upplaga 12 (1996). Formen ideologien finns med fram till och med upplaga 10 (1973) och togs bort i upplaga 11. Söker man i nutida text, t ex i tidningstext, så verkar de knappt användas. Detta tycker jag talar för att formerna gärna kan ändras – men det finns kanske fler aspekter. /NH 13 april 2016 kl. 11.39 (CEST)
Jag missade att lägga till "filosofien", som det också finns ett antal av. Sjunnesson (diskussion) 13 april 2016 kl. 17.55 (CEST)
Överallt där det inte handlar om direkta citat, som exempelvis i boktitlar, bör de bytas ut. Tostarpadius (diskussion) 13 april 2016 kl. 18.15 (CEST)
Jag har nu lagt in reguljära uttryck som rättar de tre orden. Svensson1 (diskussion) 13 april 2016 kl. 20.55 (CEST)
Uttrycket för "teorien" behöver dock förfinas så att den inte matchar "tjänsteorienterad" som är ett ord som för närvarande förekommer i ett dussintal artiklar. --Larske (diskussion) 13 april 2016 kl. 21.11 (CEST)

HandbollRedigera

@Svensson1: Tycker att den här ändringen verkar lite riskabel. Den ger falska träffar som dessa. --Larske (diskussion) 7 maj 2016 kl. 11.57 (CEST)

Åtgärdat. Svensson1 (diskussion) 7 maj 2016 kl. 12.00 (CEST)

Ett typ avRedigera

En språkfråga: Bör vi ändra "ett typ av" till "en typ av"? Det förstnämnda är vardagligt enl. Språkrådet (Frågelådan). Sjunnesson (diskussion) 8 maj 2016 kl. 15.05 (CEST)

Ja. Jag har nu lagt in det. Svensson1 (diskussion) 8 maj 2016 kl. 18.00 (CEST)

Besläktad med ovanstående är "en slags" versus "ett slags". Båda varianterna är "acceptabla" enligt Språkrådet (för fem år sedan). Det finns just nu fler än 1 000 förekomster av " en slags " och 15 förekomster av " vilken slags " på svwp. --Larske (diskussion) 8 maj 2016 kl. 18.27 (CEST)

Frågelådan säger ingenting om att "en slags" skulle markera någon särskild stilnivå, och det finns därför ingen anledning att automatiskt ändra.
andejons (diskussion) 8 maj 2016 kl. 19.56 (CEST)
Här är en länk till Frågelådan för frågan om "en slags" och "ett sorts", Ja, det verkar mer tillåtet med varianter, så det får vi väl stå ut med. --Larske (diskussion) 8 maj 2016 kl. 21.28 (CEST)

med med. kand.Redigera

Nu "rättar" typos en mening som äktenskapet med med. kand. Elisabeth med att ta bort ett med, så att det blir: äktenskapet med. kand. Elisabeth. Vet ej hur man korrigerar detta, men det vore bra om typos accepterade (?med.)? Dan Koehl (diskussion) 1 juni 2016 kl. 14.32 (CEST)

Åtgärdat. Svensson1 (diskussion) 1 juni 2016 kl. 21.57 (CEST)
Tackar, det var snabbt! Dan Koehl (diskussion) 1 juni 2016 kl. 22.18 (CEST)

Bestå/BestårRedigera

@Inteloutside2: Hej! När du smalnade av "betå(\w*)" till "betår\b" så missar vi "betå".

Vad tror du om <Typo word="består" find="\b(B|b)etå(r?)\b" replace="$1estå$2" /> för att fånga även "betå"?

--Larske (diskussion) 22 juli 2016 kl. 01.15 (CEST)

Absolut, det blir fint. Finns inga förekomster av det idag, men det kan ju dyka upp framöver.--Inteloutside2 (diskussion) 22 juli 2016 kl. 01.18 (CEST)

referencesRedigera

Det blir false positive med <Typo disabled="== Referenser ==" find="== ?Referen(ces|s) ?==" replace="== Referenser ==" />, vilken byter det korrekta <references/> mot <Referenser/>. Dan Koehl (diskussion) 27 september 2016 kl. 12.31 (CEST)

jag prövar med att kommentera denna rad, i väntan på förslag till åtgärd. Dan Koehl (diskussion) 27 september 2016 kl. 12.32 (CEST)

problemet kvarstår. Dan Koehl (diskussion) 27 september 2016 kl. 13.39 (CEST)

Problemet löst, jag hade lyckats helt i onödan att lägga in i mina egna ändringar. Allt OK. Dan Koehl (diskussion) 27 september 2016 kl. 16.56 (CEST)

AkvariefiskRedigera

I anslutning till raden "-ie-" står det "Ändelsen -ium. Felaktig ändelse i sammansättning. Exempel: "akvariumfisk" ändras till "akvariefisk"." Men för artikeln Hoppkräftor får jag att AWB tvärtom vill ändra akvariefiskar till akvariumfiskar. Går det att ändra i raden så att det här felet inte uppstår? Sjunnesson (diskussion) 8 januari 2017 kl. 11.59 (CET)

Det är kanske svårt. Rättstavningsfunktionen i AWB brukar väl inte vara så bra på att hantera hakparenteser. Men jag har nu ändrat länkningen i den artikeln till en vanlig länkning till akvariefiskar. Det var den enda artikeln som såg ut på det sättet. Svensson1 (diskussion) 8 januari 2017 kl. 23.19 (CET)

bergsäng > BergsängRedigera

På artikeln Microtus bavaricus föreslog AWB en ändring från Arten hittades där på en bergsäng. till Arten hittades där på en Bergsäng. med versal, och kanske exiterar termen Bergsäng, men jag tror att ordet bergsäng kan dyka upp betydligt oftare, och funderar på om denna justering kanske är onödig? Dan Koehl (diskussion) 1 oktober 2018 kl. 22.05 (CEST)

supportarar > supportrararRedigera

Ordet supportrarar förefaller vara inkorrekt justering, bör vara supportrar? Dan Koehl (diskussion) 4 maj 2020 kl. 21.51 (CEST)