Xqt has uploaded a new change for review. https://gerrit.wikimedia.org/r/94869
Change subject: [PEP8]ify fixes.py ...................................................................... [PEP8]ify fixes.py Change-Id: I6ef4a5fa5671f462a5042fd766887f90b2b7075d --- M fixes.py 1 file changed, 121 insertions(+), 117 deletions(-) git pull ssh://gerrit.wikimedia.org:29418/pywikibot/compat refs/changes/69/94869/1 diff --git a/fixes.py b/fixes.py index 58cbcfa..1bbf6ac 100644 --- a/fixes.py +++ b/fixes.py @@ -49,28 +49,28 @@ 'HTML': { 'regex': True, 'msg': { - 'ar':u'روبوت: تحويل/تصليح HTML', - 'be':u'Бот: карэкцыя HTML', - 'be-x-old':u'Бот: карэкцыя HTML', - 'cs':u'převod/oprava HTML', - 'en':u'Robot: Converting/fixing HTML', - 'eo':u'Bot: koredtado de HTMLa teksto', - 'fa':u'ربات:تبدیل/تصحیح کدهای اچتیامال', - 'de':u'Bot: konvertiere/korrigiere HTML', - 'fr':u'Robot: convertit/fixe HTML', - 'he':u'בוט: ממיר/מתקן HTML', - 'ja':u'ロボットによる: HTML転換', - 'ksh':u'Bot: vun HTML en Wikikood wandelle', - 'ia':u'Robot: conversion/reparation de HTML', - 'lt':u'robotas: konvertuojamas/taisomas HTML', - 'nl':u'Bot: conversie/reparatie HTML', - 'pl':u'Robot konwertuje/naprawia HTML', - 'pt':u'Bot: Corrigindo HTML', - 'ru':u'Бот: коррекция HTML', - 'sr':u'Бот: Поправка HTML-а', - 'sv':u'Bot: Konverterar/korrigerar HTML', - 'uk':u'Бот: корекцiя HTML', - 'zh':u'機器人: 轉換HTML', + 'ar': u'روبوت: تحويل/تصليح HTML', + 'be': u'Бот: карэкцыя HTML', + 'be-x-old': u'Бот: карэкцыя HTML', + 'cs': u'převod/oprava HTML', + 'en': u'Robot: Converting/fixing HTML', + 'eo': u'Bot: koredtado de HTMLa teksto', + 'fa': u'ربات:تبدیل/تصحیح کدهای اچتیامال', + 'de': u'Bot: konvertiere/korrigiere HTML', + 'fr': u'Robot: convertit/fixe HTML', + 'he': u'בוט: ממיר/מתקן HTML', + 'ja': u'ロボットによる: HTML転換', + 'ksh': u'Bot: vun HTML en Wikikood wandelle', + 'ia': u'Robot: conversion/reparation de HTML', + 'lt': u'robotas: konvertuojamas/taisomas HTML', + 'nl': u'Bot: conversie/reparatie HTML', + 'pl': u'Robot konwertuje/naprawia HTML', + 'pt': u'Bot: Corrigindo HTML', + 'ru': u'Бот: коррекция HTML', + 'sr': u'Бот: Поправка HTML-а', + 'sv': u'Bot: Konverterar/korrigerar HTML', + 'uk': u'Бот: корекцiя HTML', + 'zh': u'機器人: 轉換HTML', }, 'replacements': [ # Everything case-insensitive (?i) @@ -92,12 +92,12 @@ # so we only make it XHTML compliant (r'(?i)<hr ([^>/]+?)>', r'<hr \1 />'), # a header where only spaces are in the same line - (r'(?i)([\r\n]) *<h1> *([^<]+?) *</h1> *([\r\n])', r"\1= \2 =\3"), - (r'(?i)([\r\n]) *<h2> *([^<]+?) *</h2> *([\r\n])', r"\1== \2 ==\3"), - (r'(?i)([\r\n]) *<h3> *([^<]+?) *</h3> *([\r\n])', r"\1=== \2 ===\3"), - (r'(?i)([\r\n]) *<h4> *([^<]+?) *</h4> *([\r\n])', r"\1==== \2 ====\3"), - (r'(?i)([\r\n]) *<h5> *([^<]+?) *</h5> *([\r\n])', r"\1===== \2 =====\3"), - (r'(?i)([\r\n]) *<h6> *([^<]+?) *</h6> *([\r\n])', r"\1====== \2 ======\3"), + (r'(?i)([\r\n]) *<h1> *([^<]+?) *</h1> *([\r\n])', r"\1= \2 =\3"), + (r'(?i)([\r\n]) *<h2> *([^<]+?) *</h2> *([\r\n])', r"\1== \2 ==\3"), + (r'(?i)([\r\n]) *<h3> *([^<]+?) *</h3> *([\r\n])', r"\1=== \2 ===\3"), + (r'(?i)([\r\n]) *<h4> *([^<]+?) *</h4> *([\r\n])', r"\1==== \2 ====\3"), + (r'(?i)([\r\n]) *<h5> *([^<]+?) *</h5> *([\r\n])', r"\1===== \2 =====\3"), + (r'(?i)([\r\n]) *<h6> *([^<]+?) *</h6> *([\r\n])', r"\1====== \2 ======\3"), # TODO: maybe we can make the bot replace <p> tags with \r\n's. ], 'exceptions': { @@ -115,7 +115,7 @@ 'grammar-de': { 'regex': True, 'msg': { - 'de':u'Bot: korrigiere Grammatik', + 'de': u'Bot: korrigiere Grammatik', }, 'replacements': [ #(u'([Ss]owohl) ([^,\.]+?), als auch', r'\1 \2 als auch'), @@ -157,26 +157,28 @@ r'20min.ch', # Schweizer News-Seite ], 'inside': [ - r'<code>.*</code>', # because of code examples + r'<code>.*</code>', # because of code examples r'{{[Zz]itat\|.*?}}', - ur'{{§\|.*?}}', # Gesetzesparagraph + ur'{{§\|.*?}}', # Gesetzesparagraph ur'§ ?\d+[a-z]', # Gesetzesparagraph - r'Ju 52/1m', # Flugzeugbezeichnung - r'Ju 52/3m', # Flugzeugbezeichnung - r'AH-1W', # Hubschrauberbezeichnung - r'ZPG-3W', # Luftschiffbezeichnung - r'8mm', # Filmtitel - r'802.11g', # WLAN-Standard - r'DOS/4GW', # Software - r'ntfs-3g', # Dateisystem-Treiber - r'/\w(,\w)*/', # Laut-Aufzählung in der Linguistik - r'[xyz](,[xyz])+', # Variablen in der Mathematik (unklar, ob Leerzeichen hier Pflicht sind) - r'(?m)^;(.*?)$', # Definitionslisten, dort gibt es oft absichtlich Leerzeichen vor Doppelpunkten - r'\d+h( | )\d+m', # Schreibweise für Zeiten, vor allem in Film-Infoboxen. Nicht korrekt, aber dafür schön kurz. - r'(?i)\[\[(Bild|Image|Media):.+?\|', # Dateinamen auslassen - r'{{bgc\|.*?}}', # Hintergrundfarbe - r'<sup>\d+m</sup>', # bei chemischen Formeln - r'\([A-Z][A-Za-z]*(,[A-Z][A-Za-z]*(<sup>.*?</sup>|<sub>.*?</sub>|))+\)' # chemische Formel, z. B. AuPb(Pb,Sb,Bi)Te. Hier sollen keine Leerzeichen hinter die Kommata. + r'Ju 52/1m', # Flugzeugbezeichnung + r'Ju 52/3m', # Flugzeugbezeichnung + r'AH-1W', # Hubschrauberbezeichnung + r'ZPG-3W', # Luftschiffbezeichnung + r'8mm', # Filmtitel + r'802.11g', # WLAN-Standard + r'DOS/4GW', # Software + r'ntfs-3g', # Dateisystem-Treiber + r'/\w(,\w)*/', # Laut-Aufzählung in der Linguistik + r'[xyz](,[xyz])+', # Variablen in der Mathematik (unklar, ob Leerzeichen hier Pflicht sind) + r'(?m)^;(.*?)$', # Definitionslisten, dort gibt es oft absichtlich Leerzeichen vor Doppelpunkten + r'\d+h( | )\d+m', # Schreibweise für Zeiten, vor allem in Film-Infoboxen. Nicht korrekt, aber dafür schön kurz. + r'(?i)\[\[(Bild|Image|Media):.+?\|', # Dateinamen auslassen + r'{{bgc\|.*?}}', # Hintergrundfarbe + r'<sup>\d+m</sup>', # bei chemischen Formeln + # chemische Formel, z. B. AuPb(Pb,Sb,Bi)Te. Hier sollen keine + # Leerzeichen hinter die Kommata. + r'\([A-Z][A-Za-z]*(,[A-Z][A-Za-z]*(<sup>.*?</sup>|<sub>.*?</sub>|))+\)' ], 'title': [ r'Arsen', # chemische Formel @@ -191,26 +193,26 @@ 'syntax': { 'regex': True, 'msg': { - 'ar':u'بوت: تصليح تهيئة الويكي', - 'be':u'Бот: Карэкцыя вiкi-сiнтаксiсу', - 'be-x-old':u'Бот выпраўляе вiкi-сынтаксiс', - 'cs':u'Oprava wikisyntaxe', - 'de':u'Bot: Korrigiere Wiki-Syntax', - 'en':u'Robot: Fixing wiki syntax', - 'eo':u'Bot: Korektado de vikia sintakso', - 'fa':u'ربات:تصحیح قالب ویکینویسی', - 'fr':u'Bot: Corrige wiki-syntaxe', - 'he':u'בוט: מתקן תחביר ויקי', - 'ia':u'Robot: Reparation de syntaxe wiki', - 'ja':u'ロボットによる: wiki構文修正', - 'lt':u'robotas: Taisoma wiki sintaksė', - 'nl':u'Bot: reparatie wikisyntaxis', - 'pl':u'Robot poprawia wiki-składnię', - 'pt':u'Bot: Corrigindo sintaxe wiki', - 'ru':u'Бот: Коррекция вики синтаксиса', - 'sr':u'Бот: Поправка вики синтаксе', - 'uk':u'Бот: Корекцiя вiкi-синтаксису', - 'zh':u'機器人: 修正wiki語法', + 'ar': u'بوت: تصليح تهيئة الويكي', + 'be': u'Бот: Карэкцыя вiкi-сiнтаксiсу', + 'be-x-old': u'Бот выпраўляе вiкi-сынтаксiс', + 'cs': u'Oprava wikisyntaxe', + 'de': u'Bot: Korrigiere Wiki-Syntax', + 'en': u'Robot: Fixing wiki syntax', + 'eo': u'Bot: Korektado de vikia sintakso', + 'fa': u'ربات:تصحیح قالب ویکینویسی', + 'fr': u'Bot: Corrige wiki-syntaxe', + 'he': u'בוט: מתקן תחביר ויקי', + 'ia': u'Robot: Reparation de syntaxe wiki', + 'ja': u'ロボットによる: wiki構文修正', + 'lt': u'robotas: Taisoma wiki sintaksė', + 'nl': u'Bot: reparatie wikisyntaxis', + 'pl': u'Robot poprawia wiki-składnię', + 'pt': u'Bot: Corrigindo sintaxe wiki', + 'ru': u'Бот: Коррекция вики синтаксиса', + 'sr': u'Бот: Поправка вики синтаксе', + 'uk': u'Бот: Корекцiя вiкi-синтаксису', + 'zh': u'機器人: 修正wiki語法', }, 'replacements': [ # external link in double brackets @@ -251,14 +253,14 @@ 'startspace', # because of code examples ], 'text-contains': [ - r'http://.*?object=tx\|', # regular dash in URL - r'http://.*?allmusic\.com', # regular dash in URL - r'http://.*?allmovie\.com', # regular dash in URL - r'http://physics.nist.gov/', # regular dash in URL - r'http://www.forum-seniorenarbeit.de/', # regular dash in URL - r'http://kuenstlerdatenbank.ifa.de/', # regular dash in URL - r'&object=med', # regular dash in URL - r'\[CDATA\[' # lots of brackets + r'http://.*?object=tx\|', # regular dash in URL + r'http://.*?allmusic\.com', # regular dash in URL + r'http://.*?allmovie\.com', # regular dash in URL + r'http://physics.nist.gov/', # regular dash in URL + r'http://www.forum-seniorenarbeit.de/', # regular dash in URL + r'http://kuenstlerdatenbank.ifa.de/', # regular dash in URL + r'&object=med', # regular dash in URL + r'\[CDATA\[' # lots of brackets ], } }, @@ -268,26 +270,26 @@ 'syntax-safe': { 'regex': True, 'msg': { - 'ar':u'بوت: تصليح تهيئة الويكي', - 'be':u'Бот: Карэкцыя вiкi-сiнтаксiсу', - 'be-x-old':u'Бот выпраўляе вiкi-сынтаксiс', - 'cs':u'Oprava wikisyntaxe', - 'de':u'Bot: Korrigiere Wiki-Syntax', - 'en':u'Robot: Fixing wiki syntax', - 'eo':u'Bot: Korektado de vikia sintakso', - 'fa':u'ربات:تصحیح قالب ویکینویسی', - 'fr':u'Bot: Corrige wiki-syntaxe', - 'he':u'בוט: מתקן תחביר ויקי', - 'ia':u'Robot: Reparation de syntaxe wiki', - 'ja':u'ロボットによる: wiki構文修正', - 'lt':u'robotas: Taisoma wiki sintaksė', - 'nl':u'Bot: reparatie wikisyntaxis', - 'pl':u'Robot poprawia wiki-składnię', - 'pt':u'Bot: Corrigindo sintaxe wiki', - 'ru':u'Бот: Коррекция вики синтаксиса', - 'sr':u'Бот: Поправка вики синтаксе', - 'uk':u'Бот: Корекцiя вiкi-синтаксису', - 'zh':u'機器人: 修正wiki語法', + 'ar': u'بوت: تصليح تهيئة الويكي', + 'be': u'Бот: Карэкцыя вiкi-сiнтаксiсу', + 'be-x-old': u'Бот выпраўляе вiкi-сынтаксiс', + 'cs': u'Oprava wikisyntaxe', + 'de': u'Bot: Korrigiere Wiki-Syntax', + 'en': u'Robot: Fixing wiki syntax', + 'eo': u'Bot: Korektado de vikia sintakso', + 'fa': u'ربات:تصحیح قالب ویکینویسی', + 'fr': u'Bot: Corrige wiki-syntaxe', + 'he': u'בוט: מתקן תחביר ויקי', + 'ia': u'Robot: Reparation de syntaxe wiki', + 'ja': u'ロボットによる: wiki構文修正', + 'lt': u'robotas: Taisoma wiki sintaksė', + 'nl': u'Bot: reparatie wikisyntaxis', + 'pl': u'Robot poprawia wiki-składnię', + 'pt': u'Bot: Corrigindo sintaxe wiki', + 'ru': u'Бот: Коррекция вики синтаксиса', + 'sr': u'Бот: Поправка вики синтаксе', + 'uk': u'Бот: Корекцiя вiкi-синтаксису', + 'zh': u'機器人: 修正wiki語法', }, 'replacements': [ # external link in double brackets @@ -317,17 +319,17 @@ } }, - 'case-de': { # German upper / lower case issues + 'case-de': { # German upper / lower case issues 'regex': True, 'msg': { - 'de':u'Bot: Korrigiere Groß-/Kleinschreibung', + 'de': u'Bot: Korrigiere Groß-/Kleinschreibung', }, 'replacements': [ (r'\batlantische(r|n|) Ozean', r'Atlantische\1 Ozean'), (r'\bdeutsche(r|n|) Bundestag\b', r'Deutsche\1 Bundestag'), - (r'\bdeutschen Bundestags\b', r'Deutschen Bundestags'), # Aufpassen, z. B. 'deutsche Bundestagswahl' + (r'\bdeutschen Bundestags\b', r'Deutschen Bundestags'), # Aufpassen, z. B. 'deutsche Bundestagswahl' (r'\bdeutsche(r|n|) Reich\b', r'Deutsche\1 Reich'), - (r'\bdeutschen Reichs\b', r'Deutschen Reichs'), # Aufpassen, z. B. 'deutsche Reichsgrenzen' + (r'\bdeutschen Reichs\b', r'Deutschen Reichs'), # Aufpassen, z. B. 'deutsche Reichsgrenzen' (r'\bdritte(n|) Welt(?!krieg)', r'Dritte\1 Welt'), (r'\bdreißigjährige(r|n|) Krieg', r'Dreißigjährige\1 Krieg'), (r'\beuropäische(n|) Gemeinschaft', r'Europäische\1 Gemeinschaft'), @@ -356,7 +358,7 @@ 'vonbis': { 'regex': True, 'msg': { - 'de':u'Bot: Ersetze Binde-/Gedankenstrich durch "bis"', + 'de': u'Bot: Ersetze Binde-/Gedankenstrich durch "bis"', }, 'replacements': [ # Bindestrich, Gedankenstrich, Geviertstrich @@ -369,7 +371,7 @@ 'music-de': { 'regex': False, 'msg': { - 'de':u'Bot: korrigiere Links auf Begriffsklärungen', + 'de': u'Bot: korrigiere Links auf Begriffsklärungen', }, 'replacements': [ (u'[[CD]]', u'[[Audio-CD|CD]]'), @@ -413,10 +415,10 @@ ], 'exceptions': { 'inside': [ - r'\[\[20. Juli 1944\]\]', # Hitler-Attentat - r'\[\[17. Juni 1953\]\]', # Ost-Berliner Volksaufstand - r'\[\[1. April 2000\]\]', # Film - r'\[\[11. September 2001\]\]', # Anschläge in den USA + r'\[\[20. Juli 1944\]\]', # Hitler-Attentat + r'\[\[17. Juni 1953\]\]', # Ost-Berliner Volksaufstand + r'\[\[1. April 2000\]\]', # Film + r'\[\[11. September 2001\]\]', # Anschläge in den USA r'\[\[7. Juli 2005\]\]', # Terroranschläge in Spanien ], } @@ -424,7 +426,7 @@ 'isbn': { 'regex': True, - 'msg': 'isbn-formatting', # use i18n translations + 'msg': 'isbn-formatting', # use i18n translations 'replacements': [ # colon (r'ISBN: (\d+)', r'ISBN \1'), @@ -434,8 +436,10 @@ # hyphen-minus as separator, or spaces between digits and separators. # Note that these regular expressions also match valid ISBNs, but # these won't be changed. - (ur'ISBN (978|979) *[\- −\.‐-―] *(\d+) *[\- −\.‐-―] *(\d+) *[\- −\.‐-―] *(\d+) *[\- −\.‐-―] *(\d)(?!\d)', r'ISBN \1-\2-\3-\4-\5'), # ISBN-13 - (ur'ISBN (\d+) *[\- −\.‐-―] *(\d+) *[\- −\.‐-―] *(\d+) *[\- −\.‐-―] *(\d|X|x)(?!\d)', r'ISBN \1-\2-\3-\4'), # ISBN-10 + # ISBN-13 + (ur'ISBN (978|979) *[\- −\.‐-―] *(\d+) *[\- −\.‐-―] *(\d+) *[\- −\.‐-―] *(\d+) *[\- −\.‐-―] *(\d)(?!\d)', r'ISBN \1-\2-\3-\4-\5'), + # ISBN-10 + (ur'ISBN (\d+) *[\- −\.‐-―] *(\d+) *[\- −\.‐-―] *(\d+) *[\- −\.‐-―] *(\d|X|x)(?!\d)', r'ISBN \1-\2-\3-\4'), # missing space before ISBN-10 or before ISBN-13, # or non-breaking space. (r'ISBN(| | )((\d(-?)){12}\d|(\d(-?)){9}[\dXx])', r'ISBN \2'), @@ -447,7 +451,7 @@ ], 'inside': [ r'ISBN (\d(-?)){12}\d', # matches valid ISBN-13s - r'ISBN (\d(-?)){9}[\dXx]', # matches valid ISBN-10s + r'ISBN (\d(-?)){9}[\dXx]', # matches valid ISBN-10s ], } }, @@ -458,7 +462,7 @@ 'correct-ar': { 'regex': True, 'msg': { - 'ar':u'تدقيق إملائي', + 'ar': u'تدقيق إملائي', }, 'replacements': [ #(u' ,', u' ،'), #FIXME: Do not replace comma in non-Arabic text, interwiki, image links or <math> syntax. @@ -565,7 +569,7 @@ 'regex': False, 'msg': { 'en': u'Robot: Fixing special page capitalisation', - 'fa':u'ربات: تصحیح بزرگی و کوچکی حروف صفحههای ویژه', + 'fa': u'ربات: تصحیح بزرگی و کوچکی حروف صفحههای ویژه', }, 'replacements': [ (u'Special:Allpages', u'Special:AllPages'), @@ -600,8 +604,8 @@ 'fa': u'ربات: جایگزینی پیوندها به دامنهها با پسوند yu', 'fr': u'Robot: Correction des liens pointant vers le domaine .yu, qui expire en 2009', 'ksh': u'Bot: de ahle .yu-Domains loufe us, dröm ußjetuusch', - }, - 'replacements': [ + }, + 'replacements': [ (u'www.budva.cg.yu', u'www.budva.rs'), (u'spc.org.yu', u'spc.rs'), (u'www.oks.org.yu', u'www.oks.org.rs'), @@ -653,12 +657,12 @@ 'msg': { 'en': u'Robot: Fixing rich-editor html', 'fa': u'ربات: تصحیح اچتیامال ویرایشگر پیشرفته', - }, - 'replacements': [ + }, + 'replacements': [ # replace <br> with a new line - (r'(?i)<br>', r'\n'), + (r'(?i)<br>', r'\n'), # replace with a space - (r'(?i) ', r' '), + (r'(?i) ', r' '), ], }, } -- To view, visit https://gerrit.wikimedia.org/r/94869 To unsubscribe, visit https://gerrit.wikimedia.org/r/settings Gerrit-MessageType: newchange Gerrit-Change-Id: I6ef4a5fa5671f462a5042fd766887f90b2b7075d Gerrit-PatchSet: 1 Gerrit-Project: pywikibot/compat Gerrit-Branch: master Gerrit-Owner: Xqt <i...@gno.de> _______________________________________________ MediaWiki-commits mailing list MediaWiki-commits@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/mediawiki-commits