非结构化大数据在互联网 时代的应用思考演讲初稿(文案)由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“互联网大数据时代论文”。
非结构化大数据在互联网+时代的应用思考
尊敬的主持人,各位嘉宾,各位同仁: 标题页
互联网+时代改变了我们的生活,也为非结构化大数据管理注入了新的内涵。作为多年来专注于此领域的公司,在长期实践过程中形成了一些粗浅的认识,很荣幸受邀在数博会这个舞台上与大家共同分享,我的分享主题是《非结构化大数据在互联网+时代的应用思考》。第一页
先给大家报告一个我们福建交通治理的新方法,“随手拍”平台,我们可以将在路上遇到的交通乱象实时拍照,实时上传“随手拍”平台,可作为交通违章处罚的依据。这实际上告诉我们,一是互联网+要发挥民众参于的力量,二是照片这样的非结构化数据可以作为凭证使用。第二页
照片是典型的非结构化数据。根据IDC调查报告显示,在企事业单位中非结构化数据占比达80%,包括电子合同、电子病历、电子证照、法律文书等,这些非结构化数据既真实反映了业务办理过程,有的更多的是人与人协作的结果,对企业生产运行和经营管理具有重要的应用价值。第三页
当今中国,面临着互联网+时代,大数据时代的新常态,新机遇。国家出台了一系列方针政策对这一新的历史时期下的政务工作进行了总体部署。上面列举了几个重要的文件,第一个是隶属于中央办公厅的国家电子文件部际联席会议办公室发文,在5个重点领域推行电子文件试点。第二个是国务院国办发 〔2016〕23号文,全面推行互联网+政务服务,全面推行信息惠民,实现一号,一窗,一网办理。第三个是,国税总局2015年84号公告,明确了电子发票的凭证地位,第四个是克强总理尽快落实五证合一,一证一码。我们认为,这为新常态、新时期下非结构化数据的发展带来了新的重大机遇。第四页
为了更积极主动地应对互联网+带来的机遇与挑战,贯彻落实国家各项具体要工作部署,我们认为需要构建“以数据为中心,实现政府,企业、个人、业务全要素互联”的创新业务模式。这种模式的突出特征是“以人为本,协同联动,广泛互联”。这十二字很简单,但做起来很不容易。我们的目标是实现习总书记的网信工作“419”重要讲话中提出的,变“群众跑腿”为“信息跑路”,变“群众来回跑”为“部门协同办”,变“被动服务”为“主动服务”的要求。我们相信,今后,“证明你妈是你妈”的奇葩问题一定不会再出现!第五页
我们认为,要实现全要素互联的业务模式,需要紧紧把握住业务数据这个关键,做到“数据可信,管理可控、协同共享、驱动运营”,建立工作倒逼机制。为此,我们提出“三化”,即“业务凭证化,凭证资产化、资产价值化”,下面我想围绕三化,重点谈谈我们的理解。第六页
关于“业务凭证化”,今天我谈谈我的理解。我们在平时和用户的咨询沟通过程中,有的领导提出十年前,就实现了无纸化。对此,我提出我的理解,不一定对,和大家交流。我们提出无纸化1.0,2.0.3.0。1.0实现电子表单+流程审批(1.0),2.0实现凭证电子化+在线流转(2.0),3.0可信+无纸化。今天我们谈的是无纸化3.0,具备凭证可信+法律效力+长期保存的特征,核心是法律效力,我国《电子签名法》、《民事诉讼法》等司法解释明确了符合特定技术规格的电子文件具有法律效力,等同于纸质文件原件。如,国家税务总局明确了电子文件可作为入帐的依据,国家档案进一步明确了电子档案与纸质档案具有等同的法律效力;
第二个是,可信是通过KPI、版式封装等技术手段来固化业务数据的内容、背景和结构,实现业务数据凭据化,具有可取证、防篡改、防抵赖的效力,前段时间,工信部刚刚公示了OFD版式文件标准,国产化的版式文件标准即将出台,这对推动无纸化,国产化,凭证可信应具有很大的推动作用。
第三个是,长期保存,我们希望未来这些凭证能够在我国自主可控的国产化技术中实现原封不动的再现读取。
这就是我们对无纸化的理解。通过这样的技术实现的电子证照,电子病历等非结构化数据类型很多。第七页
接下去,我和大家分享4个具有典型性的案例:
第一个是国家开发银行的助学贷款业务,我们在金融行业进行了国家开发银行助学贷款电子合同应用的实践,每年服务贫困生约300万人,纸质合同需要一式4份(学生,共同借款人,县资助中心、开发银行)各存一份,每年6000元的助学贷款也需要签署4份合同,每份合同具有6个纸质附件。对这些纸质档案的采集、运输、保存、查询都面临很大的难题。实现合同电子化后,每年减少280万份合同1500万页纸质打印、运输和存储成本,取得显著的成效。
第二个案例是电力行业我们进行客户营销档案电子化的实践,这个核心很简单,即实现用电申请时实现业务免填单。目前已经服务3亿用电客户。服务于3亿户用电客户,已办理800万笔业务,实现2000万份资料归档,建立了客户档案管理中心实现了客户资料一次生成、多方复用,一库管理、互认共享。
除上述两个案例外,我们财务凭证电子化、电子发票服务平台、电子证照管理等全生态业务无纸化技术研究,并逐步在各地区和行业进行应用。第八页
第二个化是凭证资产化。我们认为,其核心是实现凭证“全生命周期管理”。我们提出资产的全生命周期管理,完成从凭证生成、文件流转、文件采集、分类整理直至鉴定处置的全环节管理。其中,在文件流转环节,凭证作为受信任的信息载体,支撑跨区域、跨单位、跨业务的信息流转和对凭证的业务应用,在分类整理环节,对资产的分级分类,将大量电子表格、文本文件、图表等各种形式的凭证经过价值识别、元数据管理、自动化分类、多维视图整理,最终进行鉴定处置移交档案馆,构建起横向贯穿各业务类型、纵向覆盖各个管理层级资产管理。第九页
下面为大家展示的是我们的电子文件数据资产管控平台,这是一个实景图,目前在国家电网公司完成部署应用,也是国家电子文件首批试点项目。该平台完成了包括国家电网生产、营销、调度、基建及人财物管理等12类核心业务中的868种海量电子文件资产体系建设,完成从凭证生成、分类整理、鉴定处置,最终移交归档到数字档案馆的电子文件全生命周期管理过程,已具有6亿条数据,覆盖全国2600家单位,已经成为国家电网公司最权威的数据资产管理平台。第十页
第三个,即资产价值化。重点解决海量的非结构化数据凭证价值利用问题,我们将其归结为“存,通,转,智、询、融”,“存”即“统一存储”,“通”即“全平台贯通”,“转”即电子化流转,“智”即“业务智能”,“询”即“多维度查询”,“融”即“数据融合”,通过这6个字,这是我们的目标,我们认为通过“全面覆盖、深度融合“,实现“交互贯通、业务智能”这个一个资产价值链。第十一页
根据上述原则,我们在资产价值化的利用上,进行了以下实践,(1)是开发了面向银行业的贷款业务数据资产生命树,正如大家所见,该生命树能将中小企业贷款的整个业务办理过程中涉及到的各系统、各业务环节对应的业务凭证自动聚合,每张业务凭证对应了相应的国家及行业政策,当政策变化引起业务规则变化时,能够自动回溯。这实际上可作为银行业连接政策、客户与业务的新型信息链条,可用于银行业风险控制及战略决策。第十四页
(2)是开发了客户全方位数据资产应用体系,以电力系统中的业务报装为例,实现以客户为中。举个例子,本图为“上海输变电工程”将电力营销的业务报装、工程施工、故障申报、客户服务的全过程,客户可通过95598,输入客户编号,所有文件全过程展示。第十五页
(3)大家看到,这不是一本书,而是每个项目。开发了项目全过程数据资产应用体系,以电力系统中的核心的变电站项目构建为例,将项目的立项前期、工程前期、建设施工、工程验收所有的数据资产进行全过程组织,作为大型建设项目管理的新方式,这种方式对项目合规性审计、实现目标管理转入流程管理,经验管理向标准化管理具有重要作用。前段时间,在财务审计中发挥了重要作用。第十六页
(4)开发了设备全寿命数据资产应用体系。将设备的立项期,划、设计、采购、建设、运行、检修、技改、报废的全过程等所有的数据资产自动组织,生成了设备运行的全景式、动态化的数据视图,提高资产质量和使用效率。
目前,客户全方位、项目全过程、资产全寿命数据资产管理方式已广泛地应用于国家电网特高压建设过程中,并取得了显著的成效。在国家电网“五横五纵”的特高压建设中,举个例子,哈密南到郑州跨越了5个省,通过实施三全管理,能够很好地展示项目过程、资产过程,取得显著的效益。第十七页
近年来,伴随着大数据的发展浪潮,公司在全面研究非结构化大数据语义分析及计算技术,力求实现业务智能化,这本质是实现非结构化数据从资产到知识的再升华。目前,亿榕公司自主开发了智能客服机器人,即将维基百科,百度百科、国网语料库、营销档案库等材料进行了语义建模,通过机器学习方法,能够自动分析客户要求,实现智能的人机交互,实现无人值守式客服,大大降低客服成本。第十八页
回顾公司的发展历程,公司现有在非结构数据及业务领域的一点小小的成就存在着必然与偶然。但与我们多年的耕耘也分不开,从2009年开始,我们始终专注非结构化领域,历经十余载,坚持业务、技术双向驱动,紧跟国家政策、行业特点,两条腿“小步快跑”、在平台建设、标准实施、和典型应用上取得了一些成果。第十九页
花了5年时间,打造出的“基于UDB非结构化数据库的三四三产业实践”,围绕企业内部、会化、互联网三大数据对象形成面向非结构化大数据存储、支撑业务运行和辅助数据洞察三大应用领域的数据采集、存储、处理、分析的四大产品套件。第二十页
我在实际应用中,我们始终以”业务分析、技术设计、整体实施”思路,以推动“提升客户业务质量、发现用户数据价值”,提炼和总结了面向企业应用,从数据存储、业务支撑到数据洞察的7大解决方案。最后,收?