C#提取网页中超链接link和text部分的方法
作者:礼拜一
这篇文章主要介绍了C#提取网页中超链接link和text部分的方法,涉及C#正则表达式及字符串操作相关技巧,需要的朋友可以参考下
本文实例讲述了C#提取网页中超链接link和text部分的方法。分享给大家供大家参考,具体如下:
string s = ".."; Regex re = new Regex(@"<a[^>]*href=(""(?<href>[^""]*)""|'(?<href>[^']*)'|(?<href>[^\s>]*))[^>]*>(?<text>.*?)</a>", RegexOptions.IgnoreCase | RegexOptions.Singleline); Match m = re.Match(s); if(m.Success) { string link = m.Groups["href"].Value; string text = Regex.Replace(m.Groups["text"].Value,"<[^>]*>",""); Console.WriteLine("link:{0}\ntext:{1}", link, text); }
更多关于C#相关内容感兴趣的读者可查看本站专题:《C#正则表达式用法总结》及《C#字符串操作技巧总结》
希望本文所述对大家C#程序设计有所帮助。