From 6021c7d7dc9e0d063e11a2b05403485c48afc600 Mon Sep 17 00:00:00 2001 From: Basique Evangelist Date: Thu, 19 Dec 2019 13:35:04 +0000 Subject: [PATCH] Add hyphen-minus and em dash to WORD_SEPERATORS --- AntiAntiSwearingBot.Tests/DetectTests.cs | 2 ++ AntiAntiSwearingBot/Unbleeper.cs | 2 +- 2 files changed, 3 insertions(+), 1 deletion(-) diff --git a/AntiAntiSwearingBot.Tests/DetectTests.cs b/AntiAntiSwearingBot.Tests/DetectTests.cs index 7734411..da19756 100644 --- a/AntiAntiSwearingBot.Tests/DetectTests.cs +++ b/AntiAntiSwearingBot.Tests/DetectTests.cs @@ -30,6 +30,8 @@ namespace AntiAntiSwearingBot.Tests [Theory] [InlineData("Просто пи**ец, как хочется кушать.", "*пиздец")] [InlineData("Ужас на*уй!", "*нахуй")] + [InlineData("еб*ть-колотить", "*ебать")] + [InlineData("еб*ть—колотить", "*ебать")] [InlineData("Получилась полная х**ня: даже не знаю, что и сказать, б**.", "*херня\n**бля")] [InlineData("Сергей опять вы**нулся своим знанием тонкостей русского языка; в окно еб*шил стылый ноябрьский ветер. ", "*выебнулся\n**ебашил")] public void DetectWordsWithPunctuation(string text, string expected) diff --git a/AntiAntiSwearingBot/Unbleeper.cs b/AntiAntiSwearingBot/Unbleeper.cs index 37c0efe..be83309 100644 --- a/AntiAntiSwearingBot/Unbleeper.cs +++ b/AntiAntiSwearingBot/Unbleeper.cs @@ -20,7 +20,7 @@ namespace AntiAntiSwearingBot Regex BleepedSwearsRegex { get; } - static readonly char[] WORD_SEPARATORS = { ' ', '\t', '\r', '\n', '.', ',', '!', '?', ';', ':' }; + static readonly char[] WORD_SEPARATORS = { ' ', '\t', '\r', '\n', '.', ',', '!', '?', ';', ':', '-', '—' }; public string UnbleepSwears(string text) {