Добрый день всем!
Есть проблема, делаю отчет по действиям сотрудников (SRS 2000), есть поле описание действия. Если действие - электронная почта то поле описание содержит Html разметку. Чтобы избавиться от тегов решил форматировать содержимое ячейки -- поле описание обрабатывать регулярным выражением (через пользовательскую функцию).
Маска выражения - "<.+?>"
Код функции:
Код:
public function HTMLReg(str as string) as string
if str = nothing then
str = ""
end if
return System.Text.RegularExpressions.Regex.Replace
(System.Text.RegularExpressions.Regex.Replace(str, "<.+?>",""), "&\w+;|&#\d+;","")
End Function
В результате одни письма нормально отрабатываются а другие выходят в подобном виде:
Код:
Здравствуйте, Алексей! <SPAN class=090593903-31052007> В таком виде мы сделали печать списка инв. проектов (во вложенном файле). Посмотрите, если что-то не устраивает - пишите. <SPAN class=090593903-31052007>
....
Ошибки появляются когда идут теги комментариев идут <!-- или <span, хотя и они должны обрабатываться.
Собственно вопрос,
кто нибудь в курсе
- альтернативных способов решения задачи перевод html в текст
- ошибок которые наделал при данном способе решения : )
?