【三分钟风采】把日常使用的浏览器打造成数据挖掘神器——谷歌浏览器插件Web Scraper分享

2019-03-20 09:21:38 / 打印

分享者 | 造价1741卜杨晋

分享主题 | 《把日常使用的浏览器打造成数据挖掘神器——谷歌浏览器插件Web Scraper分享》

Web Scraper是一款可以从网页中提取数据的谷歌浏览器插件,是一款非常好用的爬虫工具。它的优点是不用写代码,对新手非常友好。它的特征是免费、跨平台(在windows/mac系统上都可以使用)、容易学(三分钟就能上手)、功能强大。

插件安装好之后在浏览器右上角会有一个蜘蛛网一样的小图标,鼠标右键点击检查即可调出它的使用界面。

既然它是一款工具,那么它适合什么人群呢?

这款工具适合做产品、运营、电商、新媒体的同学,也可以是创业者以及对数据有获取需求的同学。掌握这个工具能让你提高收集信息的效率,对于即将走上职场的同学也可以增强你的职场竞争力。

这款工具可以抓取网页上95%的数据,但前提是看得见的数据。对于看不见的数据,比如淘宝后台用户的隐私数据,是不可以抓取的。

在使用Web Scraper时我也踩过一些坑,那么它不能做什么呢?

1.没有搜索功能;

2.不能定时也不能实时抓取数据;

3.没有分析功能(抓取到数据后,根据自己的需要进行分析);

4.不是黑客,比如说在淘宝服务器里的用户数据是抓取不了的;

5.使用时不需要翻墙;

6.推荐使用谷歌浏览器;插件在其他浏览器上会出现一些bug;

7.法律风险,分清学习和商用,不能用于不正当竞争。

学好一项技能最好的时间是十年前,其次就是现在。学会这项技能之后能够提高你收集信息的效率以及增强你在职场上的竞争力。

罗胜老师点评:卜杨晋同学的分享让我想到一些985、211高校的计算机以及统计学专业,这些大学除了讲授本专业的知识之外,还开设有数字化营销课程,用技术结合营销。给大家带来的启发是除了学习书本上的知识,也要去探索一些书本之外的知识,通过学习赋予大家更多的能量。在多变的时代需要挖掘更多的东西,找到学习的零界点,探索新的知识,跟上时代的步伐。

刘倩倩老师点评:在上学期我有了解到爬虫,没想到卜杨晋同学这个假期回来就能给大家带来一场关于这方面的分享。不过在小细节上还需要多加注意,特别是一些排版上的小细节。而且,在分享的时候可以先给同学们一条逻辑的主线,这样有助于同学们更好的理解分享的内容。

罗雷同学点评:Web Scraper这个黑科技功能强大,回去也想亲自体验一下。

赖春梅同学点评:比前几期的分享有进步,继续努力。但是也要注重点滴的积累、不断总结和反思,在修炼中得到成长。

文编 | 卜杨晋

主编 | 木木王

责编 | 团子

审核 | 新财子