<p>今天在日常维护一个网站时,发现该网站的留言程序没有经过严格的验证过滤,导致了将近十万条垃圾数据。而其中又不乏重要信息,需要清理数据,以及增加更为严格的验证措施。<br />
而通过在数据库中直接删除又不太科学,会误删很多重要信息。<br />
通过 模糊查询语句:<br />
引用内容.select * from Feedback where Comments like %http% .<br />
结果:<br />
引用内容.“内存溢出”<br />
<br />
经过不断的搜索,找出了问题的主要原因:<br />
引用内容.asp 中用 LIKE 关键字查询日文符号就会出错,比如说Chr(-23075),提示内存溢出。<br />
如果数据表中的数据包含日文或者一些特殊非简体汉字符号,也会出现内存溢出的错误<br />
<br />
而网上说,上述问题已经得到微软动力营的微软工程师确认,为产品的 BUG,无法解决。唯一的办法就是将整个数据库中的数据编码为ANSI 文本格式,然后保存。显示的时候再DECODE。<br />
无解,只有按上面所说,进行字段转换保存到另外一个新字段中,然后再进行清理操作。面对这个超标数据真是困难。<br />
EncodeString 函数进行字符转义<br />
<br />
程序代码.<br />
Function EncodeString(strWords)<br />
Dim i As Long<br />
Dim strEncodeWords<br />
For i = 1 To Len(strWords)<br />
strEncodeWords = strEncodeWords & CStr(Asc(Mid(strWords, i, 1))) & ","<br />
Next<br />
EncodeString = strEncodeWords<br />
End Function.<br />
<br />
这样经过转义后,在模糊搜索时,将关键字进行转义一下<br />
引用内容.delete * from Feedback where Comments_new like %&EncodeString("http")&%</p>