税务系统数据质量管理的研究与实践_税收数据质量管理

其他范文 时间:2020-02-28 01:19:34 收藏本文下载本文
【www.daodoc.com - 其他范文】

税务系统数据质量管理的研究与实践由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“税收数据质量管理”。

税务系统数据质量管理的研究与实践

内容提要:数据质量管理是加强税收征管、实现信息管税的重要手段。本文介绍了数据质量的概念和属性,研究了异常数据的类型和产生的原因。通过分析税务系统数据质量管理工作中存在的主要问题,结合我局实际,提出了加强数据质量管理的方法和策略。最后介绍了山东省国税局加强数据质量管理的工作实践和具体做法,对税务系统加强数据质量管理实现信息管税具有很强的借鉴意义。

关键词:数据质量数据应用异常数据数据管理

数据是税务信息化管理和辅助决策分析的基础,是推进税务系统信息化建设不断发展的重要保障。经过多年的发展,税务信息化目前已基本形成数据省级大集中、网络覆盖各级税务机关、应用系统涵盖主要税收管理业务的格局。随着应用系统数据量的急剧增加、新应用系统的不断出现、应用之间的整合以及数据仓库、联机分析等数据应用新技术的引入,数据质量问题变得日益突出。税收业务数据一方面是事务处理过程的反映,另一方面更是领导决策的基础和依据,数据质量的好坏将直接影响税务信息系统运行的质量和效率,并成为影响决策支持的重要因素。

一、数据质量的概念和属性

在不同时期,数据质量有不同的概念和标准。20世纪80年代以前,数据质量的标准基本上是以提高数据准确性为出发点。随着数据质量含义的不断延伸,准确性不再是衡量数据质量的唯一标准。目前业界对数据质量有多种定义,一种观点认为数据质量是数据适合使用或满足特定用户期望的程度,而另一种观点认为数据质量主要是指一个信息系统在多大程度上实现了正确性(Correctne)、一致性(Consistency)、完整性(Completene)和最小性(Minimality)。

数据作为信息化应用的主体,它具有多重属性,其基本质量特性包括准确性、完整性、及时性、有效性等四个方面。对数据质量进行较好地控制,必须认识数据的基本质量特性,多方面采取措施,杜绝数据质量问题出现,使数据监控工作能够真正达到控制数据质量的目的。

(一)数据准确性

准确性是指数据的测量值与真实值的一致程度。在数据监控和质量控制的过程中,准确性越好的数据,误差越小。影响数据准确性的因素很多,数据误差在数据采集、审核、录入、传输和处理等各个环节都可能产生。我们需要从各个方面分析影响数据准确性的因素,同时有效控制不同类型数据的合理变化范围,将数据误差控制在尽可能理想的范围内,以保证数据准确性。

(二)数据完整性

数据完整性是指数据库中的数据正确无误并且相关数据具有一致性。数据是否完整关系到数据能否真实的反映现实世界。数据完整性分为域完整性、实体完整性、引用完整性和用户定义完整性。域完整性是指关系表中任一列数据必须具有正确的数据类型、格式以及有效的数据范围,如性别列的值只能是男或女;实体完整性要求在表中不能存在完全相同的记录,而且每条记录都要具有一个非空且不重复的键值;引用完整性是指作用于有关联的两个或两个以上的表,通过使用主键和外键或主键和唯一键之间的关系,使表中的键值在所有表中保持一致;用户定义完整性是应用领域需要遵守的约束条件,允许用户定义不属于其他任何完整性分类的特定业务规则。

(三)数据及时性

在税务部门日常数据的管理中,往往要求更快、更准地收集到所需的数据,把这些要求应用到数据上,那就是要求数据具有及时性。一个好的应用系统在使用数据时不仅要求数据的准确性还必须考虑数据的及时性,税收管理信息化的一个主要目的是提高工作效率,把大量复杂、繁重的计算、统计、分类工作交由计算机处理并迅速得出准确结果。如果数据不及时,那么应用系统的处理结果可能就违背了程序设计和使用者的初衷。因此根据数据应用需求及时采集数据是保证数据及时性的重要环节。

(四)数据有效性

对于一条及时采集获得,准确、完整的数据,还需要考虑数据的有效性问题。一堆无效的数据无异于废

品或垃圾,是不产生价值的,因此在使用数据时,要考虑它是否有效。例如,假如我们采集了某户小规模纳税人去年全年的申报税额和代开发票预缴税额数据,最后发现预缴税额大于申报税额,那么这户企业的申报税额数据还是否有效呢?这是显而易见的。

二、数据质量问题的分类

信息系统中可能存在的数据质量问题有很多种,其表现形式主要有以下几种类型:

(一)重复数据

重复数据是指在一个数据源中有指向同一个实体的重复信息,或在多个数据源中有同一个实体的重复信息。

(二)不完整数据

由于录入错误等原因,字段值或记录未被录入数据库,造成信息系统数据源中应有的字段或记录缺失。

(三)不正确数据

由于录入错误、未及时更新或不正确的计算等,导致数据源中数据过时,或者一些数据与现实实体中字段的值不相符。

(四)无法理解的数据

无法理解的数据值指由于某些原因,导致数据源中的一些数据难以解释或无法解释,如伪值、多用途域、古怪的格式、密码数据等。

(五)不一致数据

数据不一致包括多种问题,如由不同数据源形成的数据很容易发生不一致;同一数据源的数据也会因位置、单位以及时间不同产生不一致。

三、数据质量管理的研究方法与提高策略

(一)研究现状与方法

90年代中期美国麻省理工学院开展了全面数据质量管理(TDQM-Total Data Quality Management)研究,通过借鉴物理产品质量管理体系的成功经验,提出了基于信息生产系统的数据质量管理体系。该体系的主要方法包括质量定义、度量、分析和改进四个步骤。

1、质量定义:定义质量要求,反映数据提供者、生产者和管理者对数据产品不同角度的质量要求。

2、度量:根据数据产品及其质量定义,确定数据质量指标体系,跟踪数据的量度,监控数据质量。

3、分析:分析数据质量问题产生的原因。

4、改进:根据分析结果,采取措施消除产生数据质量问题的根源。如采用数据清理、转换等技术方法改进重码、数据不一致等问题,或者制定策略改进数据的生产过程和管理方法。

目前数据质量的研究主要围绕两个方面展开:一是数据质量的评估和监控;二是从技术的角度如何保证和提高数据质量。

数据清洗是检测并消除数据中错误和不一致的主要技术手段,它包括以下几个方面:(1)重复对象检测;

(2)缺失数据处理;(3)异常数据检测;(4)逻辑错误检测;(5)不一致数据处理。

(二)提高策略

提高数据质量的策略有多种,从数据的生命周期来看,数据质量的提高策略可以从两个角度来分析:一是从事前预防和事中控制角度,即在数据生命周期的任何一个阶段,都有严格的数据规划和约束来防止异常数据的产生;二是从事后诊断的角度,即由于数据的演化或集成,会有异常数据不断出现,需要用特定的算法检测出现的异常数据。从数据质量管理所需要的知识来看,数据质量的提高策略可分成两类:一类提高策略不依赖特定业务规则,是应用独立的,如数据拼写错误、数据分布异常、某些缺失值处理等,这类问题的解决不依赖于特定的业务规则,可以从数据本身中寻找特征来解决;另一类解决方法与特定业务规则相关,是应用依赖的,相关领域的业务知识是消除数据逻辑错误的必要条件。由于数据质量问题涉及方面较多,成功的数据质量提高方案必然是综合应用上述各种策略。

四、税务系统数据质量存在的问题和原因分析

(一)存在的问题

税收基础数据质量不高,一方面表现为数据不全面,部分相关信息未能纳入系统管理,削弱了信息系统的作用;另一方面是数据不准确,纳税人提供的信息有误、税务人员操作错误或系统程序问题引起的数据错误、以及数据采集标准不统一都会导致异常数据的产生,进而影响到在此基础上的一系列应用的准确度。税务系统当前数据质量管理工作中主要存在以下问题:

1、数据准确性不高,异常数据多。

主要体现在:征收品目与行业税种不匹配,缴款方式鉴定错误,定额户无税种,登记信息不完整,预算科目错误,税种删除频繁,上解入库误填滞后,延期申报预缴税款不足,期末欠税余额增减异常,文书审批时间异常等。

2、异常数据监控不及时。

一些单位对数据质量不重视,平时不检测不监控,问题出现后当月不解决,等到通报考核时才开始清理,导致一些只能当月修改的数据前台无法修改,形成异常数据。如临时一般纳税人到期问题,未能及时进行转正处理,造成临时一般纳税人又变成小规模纳税人;定额户到期,变成查实户,还得重新定额;资格认定不及时,社会福利企业按年认定不及时;操作人员业务环节不熟练,文书审批不及时,造成数据重复录入等。

3、数据入口把关不严,数据完整性不够。

通过监控发现,每月都存在着大量的基础信息未录入或录入不全错误。例如税务登记中未录入街道乡镇、主管税务人员、电话号码等,一般纳税人申报未录入财务报表等,纳税人主营、兼营信息录入不全等。通常这些异常数据占全部异常数据的一半以上,都属于稍加注意即可避免的错误。

4、操作人员业务不熟练

由于操作人员对业务流程不熟悉,对政策把握不准确,特别是不能及时掌握税收新政策、新规定在业务软件中的处理流程,出现了一些文书类、核定类的错误。

(二)异常数据的类型

根据异常数据的来源,税务系统的异常数据可以分为以下四类:

1、业务操作类异常数据

业务操作类异常数据是由于软件操作错误、数据采集录入不完整造成的,它反映了信息系统的数据完整性水平,同时也反映了一个单位业务人员的整体操作水平。

2、历史数据类异常数据

历史数据类异常数据是由于系统切换、升级、历史数据迁移等原因造成,它反映了信息系统的历史数据可用性水平。

3、数据维护类异常数据

指在信息系统运维工作中对日常问题处理时,修改数据方法不正确、不规范等原因造成,反映了信息系统的运维能力水平,特别是对一个系统的数据结构、数据流程、业务能力掌握的水平。

4、外部接口类异常数据

由于外部程序调用接口异常、程序控制不严格、系统配置错误、源数据错误等原因造成,反映了外围软件的建设水平。

(三)异常数据产生原因

1、认识存在误区

有些人员认为一个软件系统会解决所有的问题,通过数据分析可以查找所有的管理漏洞,通过数据分析可以发现所有的薄弱环节。对系统的严密性和数据分析应用的期望值过高,导致出现问题后不能正确认识,甚至把一些人为操作的因素也归结为系统问题。

2、缺乏科学、规范、完整的数据质量标准

有些情况下对录入数据的格式或来源没有统一明确的要求,缺少统一、规范的审核程序和标准,在录入后就成为问题数据,或在数据加工、利用过程中形成异常数据。

3、数据采集手段相对单一,不能全面采集纳税人数据

当前税务部门主要依靠纳税人自行申报来实施管理,信息来源面窄,获取信息的手段落后,致使数据质量受到影响。数据采集不全的问题比较突出,多侧重于对纳税人静态信息的收集,而对动态数据的采集不够全面,不能真实掌握纳税人的实际经营状况。

4、数据信息共享程度差

一方面表现为系统内部各软件间数据定义没有统一标准,数据关联性差,信息资源无法得到充分利用;另一方面,由于受社会条件的制约,国税、地税、工商、银行等部门之间信息化建设程度各不相同,部门之间数据交换协调难度大,不能有效利用社会信息资源。

5、缺乏系统的数据质量管理机制

如前台操作人员查询不便、修改不便,导致数据纠错机制运转不畅;没有统一规范的数据质量标准,导致对数据审核、监督和考核机制缺失;当前的考核体系更多的强调了责任追究和事后问责,对承担工作量大、差错少的成绩优异者缺乏奖励措施,缺乏按“差错率”进行考核的措施,导致多做业务多出错的不良后果。

6、人员操作水平制约数据质量的提升

一方面,有些操作人员信息化基础薄弱,操作的熟练程度、准确程度有所欠缺;也有个别人员工作责任心不强,对待一些简单重复性的工作缺少工作耐心,致使错误数据经常出现。另一方面,纳税人对网上申报等系统的掌握程度不一,诚信纳税的意识不同,也很大程度上影响到了原始数据的真实性和准确性。

7、技能培训不足

任何一个软件系统无论其信息化程度多高,最终还是需要人来操作、运用。有些单位近年来只注重信息系统的硬件建设和软件开发应用,而对操作人员的技能培训关注不够,针对性的知识更新培训不足,造成基层人员的知识结构、操作技能与我们的信息化水平和工作要求脱节,不能适应工作要求。

五、山东国税系统在数据质量管理方面的实践与经验

数据质量问题可归纳为管理因素和技术因素。建立健全科学、规范的数据质量管理机制,从组织、制度、技术等层面保障对数据的有效监控,是破解数据质量难题的关键。针对目前我省数据质量管理工作中存在的问题,结合工作实际,提出以下解决思路。

(一)建立统一规范的数据质量运行机制。

我省各级国税机关把数据质量作为信息化建设的一项全局性、长期性的重要基础性工作来抓,不断完善管理制度,创新工作机制。省局制定下发了《山东省国家税务局数据质量管理办法》,明确了各级各部门在数据质量管理中的主要职责,各级信息中心牵头,具体数据质量指标落实分解到各业务主管部门负责,从数据采集、数据录入、数据审核、数据提报、数据修改等方面进行了全面规范,进一步明确了数据采集、录入、审核、提报、修改等数据质量管理的具体工作流程,保证了数据管理工作的持续稳定开展。

(二)建立全面完善的异常数据检测机制。

通过信息化课题研究等方式,不断完善数据审计规则,进一步拓展数据监控范围,丰富检测指标体系,形成了103项异常数据检测指标,涵盖综合征管系统、车购税征管系统、防伪税控系统、出口退税审核系统等四个核心应用系统。同时将指标体系开发到在数据综合分析利用平台中,形成数据质量管理子系统,每天自动与各业务系统进行数据同步,定时完成各项检测指标数据的运算,前台操作人员每天可查询新产生的各项异常数据,及时进行整改,保证了数据的准确完整。结合总局综合征管系统健康检查数据质量检查工作,不断补充检测指标,形成更加完善的数据质量异常数据指标检测体系。如综合征管系统“资格认定文书时间交叉”指标,检测同一资格认定类文书有效期起止存在多条且日期交叉情况,2011年1-9月份全省该指标共发现异常数据179条,今年同期下降到26条,同比下降85.5%.(三)建立基于过程管理的数据监控机制。

在数据质量管理过程中做到预防为主,通过源头控管、事中控制等措施保证数据质量,减少了异常数据发生。在加强纳税人端网上办税录入环节数据审核和规则校验的同时,开发了税务端嵌入式数据检测工具,部署在综合征管系统等前台工作站,操作人员录入相关数据时实时进行校验和提醒,把好数据入库质量关;利用腾讯通RTX开发应用工作实时提醒系统,从数据综合分析利用平台异常数据质量模块提取发现异常数

据进行提醒,每天自动推送到主办人员电脑桌面,提醒其及时进行整改,把好数据事中控制关。数据质量管理工作已由简单的数据检测、维护、修改上升为常态化日常工作,全省总结形成了《数据质量监控指标说明手册》等多个规范性文档,有力地指导了数据质量工作的有序开展。

(四)建立严格完善的数据质量考核机制。

将基础数据正确率作为考核指标纳入了全省重点工作年度目标管理考核,并每年进行调整完善,各市、县局根据工作实际进一步细化考核内容,实现了数据差错率与部门负责人挂钩、错误数据与岗位操作人员挂钩的双项考核机制,全面落实考核标准。省局每季度下发一次《全省数据质量分析报告》,定期通报考核结果,已累计下发数据质量分析报告20期,督导基层累计修改异常数据36140笔,全省电子数据质量明显提高。截至2012年上半年,全省综合征管系统等四个核心应用系统103项异常数据检测指标仅发现异常数据499笔,较上年同期下降84%,全省考核指标基础数据平均正确率首次达到99.999%以上,部分市局基本接近零过错,高质量的数据为信息管税夯实了基础。

(五)建立全面的数据质量工作交流机制

一是转发部分单位的先进经验。省局通过正式公文先后多次转发市、县局数据质量管理工作经验和措施,加强了基层单位数据质量管理工作交流,使得部分市县局先进的数据管理经验在全省推广、借鉴,取长补短,以点带面,促进了全省数据质量的全面提升。二是加强省、市、县(区)三级数据质量管理部门的沟通。通过基层调研、开座谈会等方式,针对全省数据质量管理薄弱点进行深入探讨研究,查找原因,有针对性制定防范措施,促进全省数据质量的持续提高。三是加强对关键指标的监控督导,有效避免错误数据的产生。基层局定期组织各部门召开数据分析工作例会,及时研究遇到的数据质量与数据管理问题,做到数据质量问题早发现、早反馈、早处理。四是组织开展全省数据质量管理工作培训。针对总局关于数据质量管理工作要求,结合全省数据质量管理指标体系,组织了全省范围内的数据质量管理工作培训,重点讲解了数据质量管理办法、数据指标口径、异常数据检测机制、异常数据产生原因以及如何及时预防、消除异常数据的方法等知识,进一步提高了各级数据质量管理人员的业务和技术水平,促进了全省数据质量管理工作的持续开展。

六、结束语

2012年7月宋兰副局长在全国税务系统深化税收征管改革工作会议上的讲话中指出要建立“以风险管理为导向,以专业化管理为基础,以重点税源管理为着力点,以信息化为支撑的现代化税收征管体系”,就必须要“加强数据管理,充分利用各种信息,不断提高信息管税水平”、“狠抓数据质量,确保信息真实准确”。数据是信息管税的关键。从实际情况看,涉税信息的采集与利用一直是我国税收工作的“软肋“,信息数量少、质量低、利用差,最为重要的是税务部门与纳税人之间存在严重的信息不对称,对纳税人所知晓、掌握的情况严重缺乏,这是我们信息化运用多年而利用层次一直受限的主要屏障。在新的形势下,加强数据管理,提高征管数据质量,对进一步规范税务信息化建设,深入推进“信息管税”工作开展,以信息化带动税收工作的科学化、精细化、专业化具有重要意义。

下载税务系统数据质量管理的研究与实践word格式文档
下载税务系统数据质量管理的研究与实践.doc
将本文档下载到自己电脑,方便修改和收藏。
点此处下载文档

文档为doc格式

    热门文章
      整站推荐
        点击下载本文