为什么清洁数据和清洁能源一样重要由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“清洁能源包括哪些能源”。
为什么清洁数据和清洁能源一样重要
日前,可再生能源计划已经成为新闻议题。财富五百强企业中很多企业都已经设定了自己的采用清洁能源目标,以回应采用可再生能源的要求。随着企业积累了庞大的数据量,无论企业是否在云中还是在数据中心构建或使用这些数据,实现其雄心勃勃目标的重大战略都将涉及数据中心。
当然,为了评估进展和成功,企业也需要跟踪和报告可持续性的能效指标。可靠的数据至关重要。但是,如果企业把可持续性作为其业务战略的核心,那么他们制定的指标将会被严格审查。如果来自数据中心的原始数据没有得到适当的清理和验证,会导致数周甚至数月的不正确和误导信息。其结果将是由此产生的业务报告中将会出现异常,并向管理人员,利益相关方以及潜在的客户和股东进行解释时会产生许多尴尬。
准确、可靠的数据是一项严肃的可持续性倡议的核心;收集原始数据和提出原始数据是不够的。毕竟,有关设施环境状况的重要决策是根据这些数据做出的,因此需要加以考虑。实现环境目标的关键是收集,清理,验证和分析有关能效,碳排放和用水量的数据,以使企业对此信心十足。通过这种方式,数据中心管理人员可以快速了解哪些方面需要调整,并消除因计划对每个设施进行更改或改进时,由于数据不正确而做出错误决策的风险。
数据清洗,对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。
数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为“脏数据”。我们要按照一定的规则把“脏数据”“洗掉”,这就是数据清洗。而数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。数据清洗是与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。
一般来说,数据清理是将数据库精简以除去重复记录,并使剩余部分转换成标准可接收格式的过程。数据清理标准模型是将数据输入到数据清理处理器,通过一系列步骤“ 清理”数据,然后以期望的格式输出清理过的数据。数据清理从数据的准确性、完整性、一致性、惟一性、适时性、有效性几个方面来处理数据的丢失值、越界值、不一致代码、重复数据等问题。
具有清洁能源目标的组织的另一个关键点在于数据中心的规划。包含错误数据的报告可能会导致设计难以满足业务需求,或导致大量预算没有可证实的投资回报。现有数据的分析可以帮助确定企业确定经济,可持续和成本效益高的设计选择和位置。
令人欣慰的是,行业巨头正在启动这么多具有可再生性和环保意识的项目。人们希望他们能像清洁能源那样重视清洁数据。