域名行业新闻 域名应用/周边 抢注/争议报道 成功交易报道 拍卖叫价新闻域名时事评析 域名商家动态 域名人物档案
返回首页

安恒信息李麒谈域名扫描和备案监测系统

时间:2010-04-12 08:59   来源:比特网   作者:佚名
近年来,关于网站备案以及监测也是热门的话题,国家出台的政策,从网站备案管理和网站不良信息检测来看,首先信产部《非经营性互联网信息服务备案管理办法》规定,首先在中华人民共和国

近年来,关于网站备案以及监测也是热门的话题,国家出台的政策,从网站备案管理和网站不良信息检测来看,首先信产部《非经营性互联网信息服务备案管理办法》规定,首先在中华人民共和国境内提供非经营性互联网信息服务的,应当依法履行备案手续;二是互联网接入服务提供者不得为未经备案的组织或者个人从事非经营性互联网信息服务提供互联网接入服务。七部委电视电话会议也是开展整治互联网低俗之风专项行动,包括“扫黄打非”办公室强调,迅速掌握手机网站制作、传播淫秽色情信息的方式和手段,包括利益链条。对所管辖范围内的手机网站进行全面、严厉查处,甚至采取严厉措施。这些都是近年来国家几个部委和相关部门出台的标准和法规。

对于非法网站监管和备案来说,IDC很大程度上承担相关责任,同时也遇到很多问题:一是对域名完整性的问题;二是网站备案验证的问题;三是不良信息检测问题;四是违规网站跟踪问题。举个例子来说,对于整个IDC,对于网站监管如果说没有一套很好的监控手段,或者集中对所管辖的域名或者IP地址,我们无法进行深度的采集,我们不知道到底我们所管辖的域名有多少。目前我们所面临的,比如IDC,很多对于所管辖的网站,包括域名全都是由IDC人员手工编写完成的,也是没有一个非常主动或者自动的形式,对于内容的验证问题。

对于不良信息检测这一块,比如低俗内容、黄色网站、色情图片,包括违规网站,反动言论的网站,目前也没有一个很好的手段,或者说做起来也是比较复杂,不是个人举报,就是人工检测发现。一方面工作效率比较低;另一方面工作进展起来也比较困难。

对于违规网站的跟踪问题,比如我们强令将网站进行关闭,他们会不会更换了域名,更换了服务器IP地址,继续进行非法的行动?对于违法网站的跟踪和监控也是目前的一个关键问题。

事实上,在整个市场主流的解决方案和产品也是有一定的不足。比如说,我们和大量的IDC用户进行沟通交流,他们也是跟我们提到,比如安装硬件型探针或者软件型探针,这两方面都有不足。我们跟用户交流,用户也提出来,有的时候我们部署硬件探针,流量一大,要不就内部夹死;再一方面用户也抱怨为什么建设成本这么高,效果也达不到要求。这两方面用户都提出了质疑。

包括对于服务器探针型软件的安装,用户也是跟我们说,很多网站用户不希望在主机上安装监控型的软件,一方面怕对于网站整个正常运行带来影响;另一方面,整个安全的自身安全性也是需要重点关注。如果说他没有做到自身的安全防护机制,一样达不到监控的效果,再就是整个工程量非常之大,无形之中给我们的安全人员带来的维护工作量递增。这也是传统的问题。

包括当时和广东群英网络,这是比较大的广东IDC,他们采用两种方式,一种是硬件的方式部署到安全出口,另一方面是软件的方式部署到服务器。

刚才说了半天,也结合了用户的想法,到底我们需要怎样的一个对于网络备案以及不良网站有什么需求呢?第一是域名采集,对于整个所管辖的IP地址、所管辖的域名到底有多少,做到一个完整的采集。包括结合(BNS);第二是否可以自动和工信部的备案系统进行联动,自动查询网站到底备没备案,备案信息是否准确真实;第三是不良信息检测,当发现低俗、违规网站,是否能够发现之后及时通知管理人员进行告知。

安恒公司针对上述分析的背景来说,有自己的一套解决方案,开发了明鉴安全备案、不良信息监测系统满足于IDC用户的需求。实际上,安恒整套明鉴系统是集WEB及WAP网站域名自动收集、备案自动验证、网络不良信息检测三大功能于一体的。我们设计的原则一方面兼顾IDC业务和专线业务;二是同时支持WEB网站、WAP网站;集中管理、分权分域监管,监管工作常态化,包括安全功能模块可选化以及良好的可扩展性。甚至说拿一台笔记本,就可以对部署在笔记本上的管辖范围域名进行监管。

八大功能模块在三大接口和平台机制上,通过任务调度实现三大主流功能。图象检测和附带均衡,其中我们的WEB拨测技术也是纳入到国家的专利之中,现在这在正在申请当中对于全球域名的基础数据库,安恒信息具有业界权威的全球域名基础数据库。我们长达5年时间通过互联网对全球域名进行不间断的整域搜索和爬行,获取全球网站域名数量四千多万个。同时采用正向域名解析技术实现网站域名与IP地址的一一对应。 对于智能的识别技术,采用国内比较领先的OCR技术,对图片、图象进行预处理,识别各种类型的图片对应文字信息,支持字幅的载连。对于目标网站的网页进行爬取,并对爬取网页中的超链接进行分析和递归爬取,完整抓取整个网站的URL数据,并提供给内容检测层进行检测。

针对WAP拨测技术,针对手机网站的不良信息的检测面临较多技术难题。包括图像检测技术,这一块抛弃了原有的图像检测方式方法,我们采用大量高效的样本训练的特征,提取和优化SVM分类机,这两种技术现在已经在申请国家专利,从而使正检率和误检率保持稳定,远远超过国内主流产品。包括图形方面的模块采用都有比较强的可移植性。与市场主流图片检测对比,安恒信息的正检率大于98%,误检率小于5%.经过实际测试表明,因为人工干预正检率和误检率不能保持稳定,这两个值相差甚远。对于泳装三点式,特别是对于黄色面积大的图片,比如加啡猫、粉红色的猪等非色情图片,由于对人脸的肤色特征的依赖,所以误检率比较高。另外对人种的色情图片、背面裸体,检测率也是比较低的。

智能分词技术是安恒信息自主研发的业界领先不良信息关键字检测技术。通过提取被检测叶面中的全部文字信息,根据丰富完善的辞典将待检测文字信息自动分解为多个单个词组,自动匹配所需检测的不良信息关键字。对比传统的全文搜索技术,智能分词技术可有效降低漏报率。最后就是负载均衡技术。

系统优势有这么七个方面的技术,整个平台是可以跨平台的,也是考虑到现实中的应用性和实用性,建设成本比较低,这也是IDC用户比较关心的。一方面不会给IDC流量带来问题;另一方面也不会给用户带来麻烦。而且从平台整个工作原理、BS构架非常简单,工作起来比较方便,一套系统可以多个IDC或者运营商共同使用,避免重复建设。分权分域的管理机制,比如各省的运营商可以进行独立管理,互相不干涉、互不影响。包括适用于专业用户和普通的IDC托管。

有良好的可扩张性,对于这一块也有领先的负载均衡技术,当我们需要检测的效率增加的时候,我们不需要改动原来的网络部署构架,只需要分布式部署相应的服务器提高检测效率就可以了。

全面的安全功能,根据需求我们我也提供集WEB、WAP网站域名自动收集,发现所管辖范围内所有的域名、网站、IP地址进行统一的收集,完整的进行采纳,自动和工信部网站后台备案系统对接,从而验证备案信息是否真实有效,是否是可靠的,以及是否是未备案的网站,之后才能够对网站的信息,比如含有低俗内容、色情图片、非法内容进行检测,当发现有不良信息的时候,直接发出报警。所以也是集三大功能于一身的系统。

良好的系统收益,长期监测有效避免管辖范围内未备案网站或不良信息发布网站的出现,积极响应了国家相关部门的政策规定。以上就是技术,包括我们我们的成功案例,上海网域网、浙江联通等等都有成功的应用。

责任编辑:晓楠 

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
相关内容关键词:安恒信息,域名扫描


推荐内容
赞助商广告