<p>今天在日常维护一个网站时,发现该网站的留言程序没有经过严格的验证过滤,导致了将近十万条垃圾数据。而其中又不乏重要信息,需要清理数据,以及增加更为严格的验证措施。<br /> 而通过在数据库中直接删除又不太科学,会误删很多重要信息。<br /> 通过 模糊查询语句:<br /> 引用内容.select * from Feedback where Comments like %http% .<br /> 结果:<br /> 引用内容.&ldquo;内存溢出&rdquo;<br /> <br /> 经过不断的搜索,找出了问题的主要原因:<br /> 引用内容.asp 中用 LIKE 关键字查询日文符号就会出错,比如说Chr(-23075),提示内存溢出。<br /> 如果数据表中的数据包含日文或者一些特殊非简体汉字符号,也会出现内存溢出的错误<br /> <br /> 而网上说,上述问题已经得到微软动力营的微软工程师确认,为产品的 BUG,无法解决。唯一的办法就是将整个数据库中的数据编码为ANSI 文本格式,然后保存。显示的时候再DECODE。<br /> 无解,只有按上面所说,进行字段转换保存到另外一个新字段中,然后再进行清理操作。面对这个超标数据真是困难。<br /> EncodeString 函数进行字符转义<br /> <br /> 程序代码.<br /> Function EncodeString(strWords)<br /> Dim i As Long<br /> Dim strEncodeWords<br /> For i = 1 To Len(strWords)<br /> strEncodeWords = strEncodeWords &amp; CStr(Asc(Mid(strWords, i, 1))) &amp; &quot;,&quot;<br /> Next<br /> EncodeString = strEncodeWords<br /> End Function.<br /> <br /> 这样经过转义后,在模糊搜索时,将关键字进行转义一下<br /> 引用内容.delete * from Feedback where Comments_new like %&amp;EncodeString(&quot;http&quot;)&amp;%</p>
返回顶部 留言