31

3月

2011

Akismet 工作原理猜想: 黑名单和筛选字典

前段时间我的新博客收到大量的垃圾评论,深受其害,在网上搜一些解决的办法,最后竟然是Wordpress后台控制面板中的自带发垃圾评论插件Akismet最好用。

 

使用的方法不难,安装后最重要的是注册 Akismet API Key,在WP后台直接就有提示链接的,这里摘录一段转载内容:

 

Akismet 安装使用

 

Akismet 的安装使用非常简单,不过还是大概说一下。

  1. 查看服务器状态: 进入worpress后台,插件– Akismet 配置。首先看一下服务器状态,如果服务器状态为绿色,恭喜你,可以使用 Akismet 了,请看下一步;如果服务器状态为不可用,那我建议您换个 wordpress空间 吧。
  2. 注册 Akismet API Key: 我们作为个人博客,肯定是免费的单博客的授权,点击这里进行注册。填入相关信息之后,就会有一封题为“Your Akismet API key”的邮件到您的邮箱了,然后找到“Your Akismet API key is:”字样后面的一串字符串,填入刚才的“Akismet 配置”页面中,点击更新选项,done!如果您对英语实在不行,可以留下姓名、邮箱,我帮您注册。
  3. 日常操作: 开启 Akismet 插件之后,当有新的评论,你只需要在后台查看一下就可以。如果发现有遗漏的,请毫不犹豫地把它扔到垃圾评论里,如果有误判的,也请第一时间弄出来。判断的依据主要还是是否与您的文章内容相关。

 

关于Akismet的工作原理的推测,除了网上被大多数人公认的黑名单原理外,如下转载:

 

一:Akismet黑名单

 

Akismet 工作原理推测

  • 云记录对比判断方式: Akismet 要求wordpress所在空间能正常连接到它的4组服务器当中的一个,所以,应该是把各种评论发表人的名称、邮件、网址和评论内容进行归类,当有新的留言发表时,通过对比数据库中的记录,然后自动判断是垃圾留言还是正常评论。
  • 用户人工判断: Akismet 还没有强大到能和人类一样思考的地步。所以,数据库中对垃圾评论和正常评论的判断依据还是用户的反馈。当时古博刚建立的时候,在很多站点上留言,几乎统统进入待审状态;而一两个月后,同样的数据都是通过Akismet直接第一时间显示出来。所以可推测, Akismet在接收到新用户数据的时候,先统统放入待审状态,等到用户进行判断,积累足够多的数据之后,就把这些数据归类为“垃圾”或“正常”,可以直接判定了。

 

二、Akismet筛选词典

 

我自己测试后,觉得应该Akismet的服务器上还应该存在一个筛选词典,词典中保存一个英文单词词库,当有毫无实际意义的字母堆砌被发布成评论时,Akismet系统自动将其屏蔽掉,无论发布人的信息是否存在于黑名单中。

 

一个简单的测试可以验证上面的猜测:找一个家养的宠物狗在键盘上任意抓挠并造成在博客上的留言,当该留言被点击发布后,会立即被已安装的Akismet插件屏蔽掉,而这只狗肯定不在Akismet的黑名单中。

 

 

 

相关的解惑:

 

其实,一直很困惑,为什么会有人发布大量根本没有任何意义的留言和链接,大多留言中的英文单词和网址都是根本不存在的,有什么意义呢? 后来发现,其实在众多毫无意义的垃圾留言中,总能找到一些有意义的留言和网址,正是发布垃圾留言者的真正用意。稍微想一下,也不难理解,在同一个博客上一次发布大量的相同留言,再弱智的发垃圾评论插件都会轻易的将其识别出来,这些无意义的垃圾评论其实做掩护用的。

撰写评论

评论: 6

  • #1

    yaya (星期一, 04 四月 2011 11:16)

    这个插件遇到第一次评论是做拦截的,当作了垃圾评论,没事要去看看误判了没有,把它当作非垃圾待审了~
    wp后台可以设置必须审核第一次后才可以发言,这个基本不会和插件冲突,第一次是待审而不是垃圾

  • #2

    三六八高清电影网 (星期三, 26 十月 2011 23:53)

    三六八高清电影

  • #3

    个人show (星期二, 13 十二月 2011 15:52)

    用了akismet还是很多垃圾评论 加了个验证码 整个世界清静了
    楼上的就是一个垃圾评论哦

  • #4

    地源热泵 (星期三, 28 十二月 2011 00:33)

    呵呵,我也来碰一碰这个akismet。看看能否通过呢

  • #5

    Directory (星期三, 11 一月 2012 00:06)

    貌似我的网址进入黑名单,咋办,我应该如何处理。

  • JimdoPro
    #6

    老胡 (星期三, 11 一月 2012 18:43)

    在望月的博客上看到这样的解决办法:http://akismet.com/contact/ 上填写自己博客的信息,申请解封,内容栏就这样写“My comments get caught by akismet by mistake. What can I do to make akismet identify my comments on others’ blogs as non-spams?”

    然后等上3~5天,就会有结果了。

    原文链接:http://wangyueblog.com/2008/05/30/akismet-black-list/

  • loading