C#删除UL LI中指定标签里文字的方法
作者:蓝色水
这篇文章主要介绍了C#删除UL LI中指定标签里文字的方法,涉及C#针对页面HTML元素进行正则匹配与替换的相关操作技巧,需要的朋友可以参考下
本文实例讲述了C#删除UL LI中指定标签里文字的方法。分享给大家供大家参考,具体如下:
现在需求越来越,,,但是做代码只能尽量满足,这里先是扣去ul和li中的超链接里的文字
PromptHtml = GetData.GetHTTPInfo(Config.Prompt_Url, "utf-8"); PromptHtml = PromptHtml.Replace("<ul><li>", ""); PromptHtml=PromptHtml.Replace("</li></ul>", ""); string ss = @"<a[\s\S]*?href=""([^" rel="external nofollow" "]*?)""[^>]*?>([\s\S]*?)</a>"; //这里 MatchCollection mcTable = Regex.Matches(PromptHtml, ss); foreach (Match mTable in mcTable) { if (mTable.Success) { PromptHtml = mTable.Groups[2].Value; } } resultHtml = PromptHtml;
具体的数据源如下:
复制代码 代码如下:
<ul><li><a href="http://localhost/tg.aspx?ID=4194" rel="external nofollow" >哪些主题基金有望爆发?</a></li></ul>
这篇是扣去ul和li中的span里面的文字:
middlebannerHtml = GetData.GetHTTPInfo(Config.Middlebanner_Url, "utf-8"); middlebannerHtml = middlebannerHtml.Replace("<ul><li>", ""); middlebannerHtml = middlebannerHtml.Replace("</li></ul>", ""); string ss = @"<span>([^<]+)</span>"; //这里 MatchCollection mcTable = Regex.Matches(middlebannerHtml, ss); foreach (Match mTable in mcTable) { if (mTable.Success) { middlebannerHtml = mTable.Groups[1].Value; } } middleContent = middlebannerHtml;
具体的数据源如下:
复制代码 代码如下:
<ul><li><span>3年5倍涨幅的 不只是股票哦~</span> <a href="http://localhost/tg.aspx?ID=4195" rel="external nofollow" >立即查看</a></li></ul>
PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:
JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript
正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg
希望本文所述对大家C#程序设计有所帮助。