SB SOSO

这几天站被弄得打不开,基本上都是数据库链接失败,链接失败的日志都有100多M了,远程连接到服务器都连不上,刚开始以为是被谁攻击了。后来想想,不对呀,我一个小破站,谁没事攻击我。
今天早上7点爬起来,连了N次才连上服务器,赶紧把 apache 和 mysql 关了,CPU降下去了,看日志,全是来自一个IP段的访问: 124.115.4.* 以及 124.115.0。 查了查,是陕西电信,百度了一下,发现N多人封了这个IP段,貌似是 soso 的。封了以后,没事了。
不会做搜索就别爬嘛,晕,爬的全是列表页,还是搜索的列表页,一秒钟十多次,连续抓了两三天,全是 like 出来的结果,直接把服务器搞挂了。
还有一个IP也老来,怕是百度的,没敢封:61.135.168.18。不过频率还行,没什么影响。

网上查到的:http://www.quickshare.com.cn/closing-today-in-the-server-124_115_0_x-of-ip

封IP段:
deny from 124.115.4.0/24
deny from 124.115.0.0/24

PS:
发现自今年2月份就有很多网站被SOSO抓死,到6月才来抓我,我真命好~~~

,

就做了三个简单的操作:
1、过滤非英文字符,然后依据空格来划分;
2、把复数单词转化为单数形式;
3、过滤 Stopwords。

很简单的分词,用来做英文 tag,分好后过一次词典就可以了。

例子:http://phzzy.org/code/en_seg/seg.php
代码:http://phzzy.org/code/en_seg/en_seg.zip

参考:
Stopwords: http://www.uspto.gov/patft/help/stopword.htm

,

MyISAM:
优势
– 查询速度快
– 数据和索引压缩
问题
– 表级锁
– 数据丢失

InnoDB:
优势
– 行级锁
– 事务支持
– 数据安全
问题
– 数据文件庞大
– 启动慢
– 不支持FULLTEXT索引

比较:

, ,

来源:http://www.never-online.net/blog/article.asp?id=216
由于position设为绝对定位(absolute),会导致该层里的textbox和textarea光标丢失。导致的原因已经查到,是gecko内核的bug。该bug可能在3.0以上版本后修复。

overflow:auto;
overflow-x:auto;
overflow-y:auto;
overflow:scroll;
overflow-x:scroll;
overflow-y:scroll;
overflow-x:hidden;
overflow-y:hidden;
position:absolute;

解决方法:
1. 在该容器加入css属性overflow:auto,position:relative
2. 在显示时使用延迟显示

原来被这个搞死了,找半天没找着怎么解决。

,

Again

重新开始了,原来那个空间忘续费,没注意空间商的提醒邮件,结果过了三个月被强制删了,啥都没了,我郁闷。
现在用 tony 的空间重新开了个,希望不会被老删了,懒得自己管空间,太麻烦了。皮肤用的 underone 的,清淡得好,就是用液晶的时候有些浅色的边框看不见,有空改改细节,改成偶喜欢的样子。新版 WP 的后台已经不会用了,找半天没找到改文章 Plus 的地方。
这还是关于技术的,以及一些自己做的站和小东西,可能更新比较慢。老惦记着要更新这太累了,呵呵。
博客的 PR 从今年初的 5,降到 三个月前的 4,现在已经变 1了,可有可无的一个博客,嘿嘿。