"Лаборатория Касперского" получила 3 патента в США по борьбе со спамом

17 Мая 2010
"Лаборатория Касперского" сообщила об успешном патентовании в США технологии обнаружения спама в растровых изображениях.

 "Лаборатория Касперского" сообщила об успешном патентовании в США технологии обнаружения спама в растровых изображениях.

Для международных провайдеров электронной почты, таких как Yahoo, Microsoft, Google, а также для крупных корпораций, которые имеют свои собственные серверные решения для фильтрации почты, обработка спама является проблемой, которую приходится решать в промышленных масштабах. Поскольку необходимо фильтровать миллионы спам-сообщений в час.

Однако задача усложняется тем, что спамеры, с целью затруднить детектирование, часто распространяют свои сообщения в виде изображений. Поэтому для обнаружения такого спама требуется сначала выделить его из картинки. Чтобы усложнить детектирование еще больше, спамеры используют прием зашумления фона изображения, "прыгающие" буквы и разбивают сообщение рамками и линиями. Обычный подход к выделению текста из изображений путем использования систем оптического распознавания символов (OCR), мало эффективен. Потому что такие решения как правило, ресурсоемки и не обеспечивают требуемой точности детектирования.

В отличие от них, запатентованная технология гарантирует точное и быстрое выделение спама из изображений. Мало того, она устойчива к зашумлению и искажению, что существенно повышает уровень детектирования. В основе технологии лежит вероятностно-статистический метод, согласно которому решение о том, содержит ли изображение текст, принимается на основании характера расположения вероятных графических образов слов и строк, а также содержания в них выявленных образов букв и слов.

Автор изобретения - руководитель группы развития антиспам-технологий "Лаборатории Касперского" Евгений Смирнов. 27 апреля 2010 года Патентное бюро США выдало на технологию два патента объемом 62 страницы за номерами US7706613 и US7706614, а 4 мая 2010 года был получен еще один патент за номером US7711192 объемом 69 страниц. В последнем случае был зарегистрирован усовершенствованный вариант описанной выше технологии (в частности, текстовые объекты выделялись в отдельную группу распознавания от неграфических элементов изображения).

"Машинные методы оптического распознавания требуют единообразия размеров и расположения выделяемых символов. В отличие от них наша технология работает с различными вариантами наклоненных или искаженных букв и слов, что повышает точность детектирования, – отметила Надежда Кащенко, руководитель отдела по управлению интеллектуальной собственностью "Лаборатории Касперского". – Кроме того, запатентованный метод предлагает более высокую скорость обработки изображений".

Источники: www.freepatentsonline.com, www.cnews.ru, www.kaspersky.ru

Короткая ссылка на новость: http://un-ltd.ru/~3a42W