谈谈抓取网页技术在移动办公中的应用

4313人浏览  10人回答  作者:贝贝  2017-8-1

需求分析:

移动办公兴起之前,抓页面或者又称为抓网页技术只在搜索引擎的小众范围被应用,随着移动办公需求的增多,这个技术受到了其它相关领域的关注。
移动办公的应用分为原生类和延伸类,延伸类则意味着是将原有的办公系统延生出移动端,实现在手机上进行收发文审批等功能。而原有的办公系统在建设的初期是没有考虑到现在的移动化需求的,说白了就是没有接口,想新做接口也很难,这就引入了抓页面技术。

抓页面技术:

现在信息系统大多是基于WEB 2.0模式进行开发的,属于B/S应用模式,有浏览器就可以使用。B/S应用的底层是HTTP协议,每一个功能界面都是网页构成的,而HTTP协议本身也是明文的。于是,通过这个模式来取到原有办公系统上的页面数据来实现移动化的需求就成为了一个很好的方案。
各种开发语言都提供了针对URL进行请求的功能,很轻松就能获取到一个页面,在移动办公兴起初期很多公司都进行了抓网页的尝试,还有一些平台提供了抓网页的功能模块。随着时间的推移,这个最理想、最让人期待的技术模式在很多公司项目中都失败了,理想很好,做进去才发现现实很残酷。

技术复杂性:

不是抓网页技术失败,应该说是很多公司应用失败了。他们低估了技术的复杂性,取一个页面是简单的,但是取各种页面就变得复杂了。这还不最主要的,办公系统更多的功能是流程处理和提交,而流程走向完全是动态配置的,这个映射到HTTP协议上就变的异常复杂了,一个流程往往是多个处理步骤,它们之间还是连贯的,所有页面URL和参数都是动态变化的,这就使得抓页面变得很困难。
流程的处理更多还是写入功能,需要修改流程字段、回写意见,而在办公系统的开发技术上,有很多都是通过前端JS异步实现的,你要根据JS进行写入数据就变得更加复杂了。所以说,在移动办公应用使用抓页面技术,不是简单的抓一个页面。

移动办公平台:

MASTUDIO移动办公平台是国内最早使用抓页面技术的,在其产品体系中称为无缝对接技术。在不要原有办公系统提供任何接口的情况下,通过HTTP协议单向实施实现移动办公的延生需求,对原有办公系统零影响、零耦合。
长期以来,MASTUDIO移动办公平台为了实现无缝对接技术,自主研发了浏览器HTTP协议引擎,并且根据办公系统流程处理进行了二次提炼。无缝对接技术不能靠简单的抓页面就实现了,需要在各种服务器环境、各种开发语言、各种流程引擎上进行适配。MASTUDIO历经多年,适配了各种行业的信息系统、国内所有OA系统、国内所有工作流系统方才达到今日的高度成熟度。
MASTUDIO 成功案例
基于我们的优势,众多客户信任并使用MASTUDIO移动中间件,部署他们的移动应用:
MASTUDIO 帮助与文档