摘要:随着互联网的快速发展,传统的浏览器已经很难满足用户对于特定领域的新闻需求。为针对此需求,本项目以webmagic为框架构建爬虫,以CSS选择器,Xpath和正则表达式为抽取方式来抽取所需信息,从中国西藏新闻网上抓取有关新闻,下载到本地并存储进数据库,经过整理分析后,最终以网页的方式呈现给用户。该技术能够准确、迅速的获取数据,且爬虫简单易维护。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
热门期刊服务
相关文章
影响因子:--
期刊级别:省级期刊
发行周期:月刊
期刊在线咨询,1-3天快速下单!
查看更多>
超1000杂志,价格优惠,正版保障!
一站式期刊推荐服务,客服一对一跟踪服务!