很好奇,舆情监控系统是怎样抓取信息的呢??

这比人工的要强多了吧!!
匿名用户    2014-07-01 16:02    

为您推荐:

其他回答

舆情监测系统信息抓取一般分为三种方式,一是搜索引擎结果的聚合;一是智能爬虫的爬取;还有一种就是定向信息源的采集,也就是把网站的站点录入到采集系统中,网站中的所有信息就会自动被系统抓取到了,现在市场上的舆情监测厂商很多,各式各样的都有,能将三种方式结合使用的却不多,据我所知,泰一舆情监测系统就是这样抓...取信息的,信息采集还是很全面的,可以了解看看。

全部展开 收起
匿名用户    2014-07-10 11:22

模拟浏览器的http请求,再从服务器返回的数据中抽取指定的内容保存到数据库,速度不是人工可以比拟的,速度快的1秒钟可以抓取20+个页面

匿名用户    2014-07-02 13:52

特殊词语过滤系统,

匿名用户    2014-07-01 19:26

靠网络爬虫,网上有源代码,抓取原理跟百度一样

匿名用户    2014-07-01 16:18