+ -
当前位置:首页 → 问答吧 → c# 去除html代码 保存<p> 正则式该怎么写?

c# 去除html代码 保存<p> 正则式该怎么写?

时间:2011-12-27

来源:互联网

c# 去除html代码 保存<p> 正则式该怎么写?

作者: xiaoxiaoyu2018   发布时间: 2011-12-27


  /// <summary>
  /// 从HTML中获取文本,保留br,p,img
  /// </summary>
  /// <param name="HTML"></param>
  /// <returns></returns>
  public static string GetTextFromHTML(string HTML)
  {
  System.Text.RegularExpressions.Regex regEx = new System.Text.RegularExpressions.Regex(@"</?(?!br|/?p|img)[^>]*>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

  return regEx.Replace(HTML, "");
  }

作者: zhs23   发布时间: 2011-12-27