Дe6aльцeвo-колотильцево
Dec. 21st, 2014 01:38 pmСкрипт на заглавной странице ЖЖ выпилил пару букв из названия населённого пункта Дe6aльцeвo в Донецкой области:

Машинному разуму показалось, что название этого населённого пункта происходит сами понимаете от какого глагола.
Вспомнились лихие девяностые, когда тупые скрипты любили выпилить то же роковое буквосочетание из слов типа небо, хлеб, себя и тебя. Инициатива по выковыриванию из текстовых массивов всякой непристойности исходила от руководства московского офиса корпорации «Интел», которая в ту пору была inside любой рекламной кампании в русском Интернете. Их кто-то надоумил, что при сквозном размещении баннеров на всех страницах поисковой выдачи реклама солидного бренда будет выдаваться по запросам на «ж» и «х», и такой компрометации никак нельзя допустить. Поэтому сели писать скрипт, блокирующий выдачу баннеров с логотипом «Intel Inside» по любому такому запросу. С самим скриптом проблемы не возникло, а вот со списком слов — увы. Много недель между маркетинговым отделом уважаемой корпорации, рекламными фирмами и ведущими интернет-площадками шла напряжённая переписка такого рода:
— Уважаемые коллеги! А включите в список ещё «опизденение», пожалуйста.
— Запрос на включение «опизденения» поставлен в очередь на исправление скрипта.
— Уважаемые коллеги! А мы тут ещё «мандавошину» вспомнили...
И так продолжалось несколько месяцев, покуда какой-то ленивый программист не сообразил, что нужно просто несколько корней выкусывать, а не пытаться собрать полный список возможных комбинаций и словоформ... Так появились цензурные правки н**о, р**ёнок и Л**едев.
Но, поскольку дело было в Яндексе, довольно скоро другой ленивый программист сообразил, что можно ведь подключить к этому мегатупому скрипту ещё и толковый словарь, который бы помог на лету опознавать «кошерные» слова, и не фильтровать их при выдаче. Так «Л**едев» снова стал «Лебедевым».
Но иногда они возвращаются.
Спасибо, что только в кириллический текст, а то б названию этого ЖЖ в топе не поздоровилось.
Update: а вот тут под цензурные ножницы попала экономическая политинформация для самых ватных — о том, как пятая колонна национал-предателей пришла к нам из Вашингтона обрушивать российский рубль. У подлых империалистов, как водится, ничего не получилось. Рубль, по своему обыкновению, мощно укрепился, а вражеское наступление захле**улось:


Машинному разуму показалось, что название этого населённого пункта происходит сами понимаете от какого глагола.
Вспомнились лихие девяностые, когда тупые скрипты любили выпилить то же роковое буквосочетание из слов типа небо, хлеб, себя и тебя. Инициатива по выковыриванию из текстовых массивов всякой непристойности исходила от руководства московского офиса корпорации «Интел», которая в ту пору была inside любой рекламной кампании в русском Интернете. Их кто-то надоумил, что при сквозном размещении баннеров на всех страницах поисковой выдачи реклама солидного бренда будет выдаваться по запросам на «ж» и «х», и такой компрометации никак нельзя допустить. Поэтому сели писать скрипт, блокирующий выдачу баннеров с логотипом «Intel Inside» по любому такому запросу. С самим скриптом проблемы не возникло, а вот со списком слов — увы. Много недель между маркетинговым отделом уважаемой корпорации, рекламными фирмами и ведущими интернет-площадками шла напряжённая переписка такого рода:
— Уважаемые коллеги! А включите в список ещё «опизденение», пожалуйста.
— Запрос на включение «опизденения» поставлен в очередь на исправление скрипта.
— Уважаемые коллеги! А мы тут ещё «мандавошину» вспомнили...
И так продолжалось несколько месяцев, покуда какой-то ленивый программист не сообразил, что нужно просто несколько корней выкусывать, а не пытаться собрать полный список возможных комбинаций и словоформ... Так появились цензурные правки н**о, р**ёнок и Л**едев.
Но, поскольку дело было в Яндексе, довольно скоро другой ленивый программист сообразил, что можно ведь подключить к этому мегатупому скрипту ещё и толковый словарь, который бы помог на лету опознавать «кошерные» слова, и не фильтровать их при выдаче. Так «Л**едев» снова стал «Лебедевым».
Но иногда они возвращаются.
Спасибо, что только в кириллический текст, а то б названию этого ЖЖ в топе не поздоровилось.
Update: а вот тут под цензурные ножницы попала экономическая политинформация для самых ватных — о том, как пятая колонна национал-предателей пришла к нам из Вашингтона обрушивать российский рубль. У подлых империалистов, как водится, ничего не получилось. Рубль, по своему обыкновению, мощно укрепился, а вражеское наступление захле**улось:

no subject
Date: 2014-12-21 10:45 am (UTC)no subject
Date: 2014-12-21 11:40 am (UTC)теперь тут пиарят вату
no subject
Date: 2014-12-21 11:47 am (UTC)no subject
Date: 2014-12-21 10:48 am (UTC)no subject
Date: 2014-12-21 10:52 am (UTC)no subject
Date: 2014-12-21 11:35 am (UTC)no subject
Date: 2014-12-21 11:42 am (UTC)no subject
Date: 2014-12-21 11:17 am (UTC)Разгорор в страховой компании.
- Застрахерте меня.
- Да как вы смеете так выражаться?
- Будет лучше, если я скажу "застрахуйте?
no subject
Date: 2014-12-21 11:24 am (UTC)no subject
Date: 2014-12-21 11:30 am (UTC)no subject
Date: 2014-12-21 11:42 am (UTC)no subject
Date: 2014-12-21 12:03 pm (UTC)no subject
Date: 2014-12-21 12:05 pm (UTC)no subject
Date: 2014-12-21 12:16 pm (UTC)no subject
Date: 2014-12-21 12:03 pm (UTC)no subject
Date: 2014-12-21 12:16 pm (UTC)no subject
Date: 2014-12-21 06:32 pm (UTC)no subject
Date: 2014-12-21 12:24 pm (UTC)"вонючие гои, хуле с них взять" - подумал пейсатый
no subject
Date: 2014-12-21 12:28 pm (UTC)Сам такой
no subject
Date: 2014-12-21 12:28 pm (UTC)no subject
Date: 2014-12-21 12:30 pm (UTC)no subject
Date: 2014-12-21 12:35 pm (UTC)no subject
Date: 2014-12-21 12:48 pm (UTC)Пришлите мне 99,95$ и я всё сделаю.
no subject
Date: 2014-12-21 02:18 pm (UTC)no subject
Date: 2014-12-21 12:51 pm (UTC)no subject
Date: 2014-12-21 03:08 pm (UTC)no subject
Date: 2014-12-21 04:01 pm (UTC)no subject
Date: 2014-12-21 05:33 pm (UTC)no subject
Date: 2014-12-21 05:47 pm (UTC)no subject
Date: 2014-12-21 06:39 pm (UTC)no subject
Date: 2014-12-21 07:36 pm (UTC)надеюсь фильтр не работает в личных блогах и комментариях по аналогии с антиспамовым?
А то последнее время чаще стали попадаться комментарии на чистейшем русском языке с грубыми орфографическими ошибками в терминах.
no subject
Date: 2014-12-22 01:47 pm (UTC)no subject
Date: 2014-12-22 02:04 pm (UTC)