Add hyphen-minus and em dash to WORD_SEPERATORS

This commit is contained in:
Basique Evangelist 2019-12-19 13:35:04 +00:00
parent 1fde14f71e
commit 6021c7d7dc
2 changed files with 3 additions and 1 deletions

View File

@ -30,6 +30,8 @@ namespace AntiAntiSwearingBot.Tests
[Theory]
[InlineData("Просто пи**ец, как хочется кушать.", "*пиздец")]
[InlineData("Ужас на*уй!", "*нахуй")]
[InlineData("еб*ть-колотить", "*ебать")]
[InlineData("еб*ть—колотить", "*ебать")]
[InlineData("Получилась полная х**ня: даже не знаю, что и сказать, б**.", "*херня\n**бля")]
[InlineData("Сергей опять вы**нулся своим знанием тонкостей русского языка; в окно еб*шил стылый ноябрьский ветер. ", "*выебнулся\n**ебашил")]
public void DetectWordsWithPunctuation(string text, string expected)

View File

@ -20,7 +20,7 @@ namespace AntiAntiSwearingBot
Regex BleepedSwearsRegex { get; }
static readonly char[] WORD_SEPARATORS = { ' ', '\t', '\r', '\n', '.', ',', '!', '?', ';', ':' };
static readonly char[] WORD_SEPARATORS = { ' ', '\t', '\r', '\n', '.', ',', '!', '?', ';', ':', '-', '—' };
public string UnbleepSwears(string text)
{