码迷,mamicode.com
首页 > Web开发 > 详细

过滤字符串的Html标记 c#函数 .

时间:2014-07-17 21:39:21      阅读:327      评论:0      收藏:0      [点我收藏+]

标签:style   blog   http   color   os   art   

bubuko.com,布布扣
 1 01.public static string StripHTML(string strHtml)  
 2 02.   {  
 3 03.       string[] aryReg ={     
 4 04.                     @"<script[^>]*?>.*?</script>",     
 5 05.     
 6 06.                     @"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""‘])(\\[""‘tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",     
 7 07.                     @"([\r\n])[\s]+",     
 8 08.                     @"&(quot|#34);",     
 9 09.                     @"&(amp|#38);",     
10 10.                     @"&(lt|#60);",     
11 11.                     @"&(gt|#62);",       
12 12.                     @"&(nbsp|#160);",       
13 13.                     @"&(iexcl|#161);",     
14 14.                     @"&(cent|#162);",     
15 15.                     @"&(pound|#163);",     
16 16.                     @"&(copy|#169);",     
17 17.                     @"&#(\d+);",     
18 18.                     @"-->",     
19 19.                     @"<!--.*\n"     
20 20.                   };  
21 21.  
22 22.       string[] aryRep =   {     
23 23.                       "",     
24 24.                       "",     
25 25.                       "",     
26 26.                       "\"",     
27 27.                       "&",     
28 28.                       "<",     
29 29.                       ">",     
30 30.                       "   ",     
31 31.                       "\xa1",     
32 32.                       "\xa2",     
33 33.                       "\xa3",     
34 34.                       "\xa9",     
35 35.                       "",     
36 36.                       "\r\n",     
37 37.                       ""     
38 38.                     };  
39 39.  
40 40.       string newReg = aryReg[0];  
41 41.       string strOutput = strHtml;  
42 42.       for (int i = 0; i < aryReg.Length; i++)  
43 43.       {  
44 44.           Regex regex = new Regex(aryReg[i], RegexOptions.IgnoreCase);  
45 45.           strOutput = regex.Replace(strOutput, aryRep[i]);  
46 46.       }  
47 47.       strOutput.Replace("<", "");  
48 48.       strOutput.Replace(">", "");  
49 49.       strOutput.Replace("\r\n", "");  
50 50.       return strOutput;  
51 51.   }
View Code

过滤字符串的Html标记 c#函数 .,布布扣,bubuko.com

过滤字符串的Html标记 c#函数 .

标签:style   blog   http   color   os   art   

原文地址:http://www.cnblogs.com/yangpeng-jingjing/p/3851652.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!