邮件数据分析工作总结0104_工作总结邮件

其他工作总结 时间:2020-02-28 08:55:53 收藏本文下载本文
【www.daodoc.com - 其他工作总结】

邮件数据分析工作总结0104由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“工作总结邮件”。

邮件数据分析工作总结

1.问题背景分析

公司内部人员交流主要有电话、邮件以及面对面等三种方式,邮件系统作为三种沟通方式中唯一进行交互数据存储的平台,其大量的数据信息是可以进行分析和挖掘的,并且可以从中获取有价值的信息与发现。

在大数据技术快速发展的今天,通过对公司邮件系统中的交互数据进行科学的分析和挖掘,可以发现公司各部门之间潜在的关联关系,如部门间业务关联度;公司一些员工之间潜在的工作关系,如员工的沟通关系网等。

本项工作主要依据公司现有邮件系统的历史数据,采用一些合适的数据处理、分析与数据可视化方法,力求从邮件历史数据中挖掘出公司各部门之间业务的关联程度、沟通的主题以及一些员工之间的工作关系等信息,以对公司的组织架构调整或员工的工作岗位调动提供一些有价值的决策建议。

2.数据源

数据源由信息中心邮件系统相关负责人提供,数据信息的基本情况如下:

(1)邮件主要信息数据,包括字段:发件人、收件人、主题、开始时间、完成时间、状态、结果信息、发件人摘要、收件人摘要、邮件大小、IP地址。每月的邮件信息数据导出为一个csv格式文件。

邮件主要信息数据存在的问题:数据信息表中存在很多Null值,如主题(有的邮件没有主题)等;垃圾邮件;邮箱、邮件主题中存在非法字符,这些可能导致数据文件读写时出现问题。

(2)邮件联系人主组信息,包括字段:父组(公司编号)、组(部门编号)、显示名(部门名称)。

邮件联系人数据存在的问题:数据信息表中有废弃的组;有的组没有父组等;这些也可能导致数据文件读取时出现问题。

(3)邮件联系人子组信息,包括字段:组(部门编号)、用户(个人邮箱)。

3.数据处理过程

数据处理过程主要包括数据的预处理、数据的读取、数据的存储等三个操作。

(1)数据预处理:数据主要信息中包括很多字段、但真正有用的信息就3个,发件人、收件人、以及主题,其它信息主要是一些系统信息,没有实际的分析意义和价值,需预处理掉这部分数据。同样,邮件联系人主组信息数据中也包括一些废弃和无效的数据,也需要预先处理。

(2)数据读取:经过验证,处理后的数据文件很多数据分析软件都不能正常读取(包括Matlab、SPSS),究其原因是数据文件中有非法字符和很多Null空格,最后只能采用.NET编程读取数据文件。

(3)数据存储:应用VS.NET编程读取所有数据文件后,将数据表插入设计好的数据库中,应用WinForm编程将数据处理过程中的重要信息显示出来。

图1-1:发件人-收件人所属部门分析

图1-2:部门间收发邮件详细信息、部门名称(按查询顺序)、部门收发邮件总和信息

数据处理阶段需要得到的数据信息:

(1)收件人所属部门、发件人所属部门,可能有的发件地址找不着所属的部门(如系统垃圾邮件等),有的收件地址找不着所属的部门。

(2)部门间收发邮件的详细数据信息。

(3)部门名称(按查询顺序排序)。

(4)部门的收发邮件的数量总和。

4.分析方法

(1)数据分析工具:VS2010+SQL Server2008,用于读取数据文件以及分析基本的邮件数据信息;Matlab2008,用于读取VS2010输出的数据信息文件以及进一步的统计分析和数据结果可视化。

(2)数据分析步骤:

Step1:计算各部门的发件正交数据表:47*47维矩阵,元素为目标部门发给其它部门的邮件总数。

Step2:计算各部门的收件正交数据表:47*47维矩阵,元素为目标部门收到其它部门的邮件总数。

Step3:计算排序后的各部门发件数据矩阵:47*47,元素为目标部门发给其它部门邮件从小到大排序后的下标。

Step4:计算排序后的各部门收件数据矩阵:47*47,元素为目标部门收到其它部门邮件从小到大排序后的下标。

Step5:计算各部门收发邮件的数据矩阵:47*2,元素为各部门收发邮件的总和。

(3)数据分析方法

分析1:以发件数量为研究对象,取发件数量排名前N的部门,分析部门间相互发件的数量之和,部门间相互发件的数量之和越大,说明两部门的关联程度越紧密。

分析2:以收件数量为研究对象,取收件数量排名前N的部门,分析部门间相互收件的数量之和,部门间相互收件的数量之和越大,说明两部门的关联程度越紧密。

分析3:分析所有部门对其它部门发件排名前N的部门,形成部门间发件活动的网络关系图,部门连接的节点越多,说明该部门主动与其它多个部门的关联越紧密,该部门对外的信息需求量越多。

分析4:分析所有部门收到其它部门发送邮件排名前N的部门,形成部门间收件活动的网络关系图,部门连接的节点越多,说明该部门被其它部门关注的程度越高。

(4)其它分析思路

上面的分析过程只是根据数据处理过程中得到的一些重要数据信息而采取的一些分析方法,可能在实际应用的过程中还有很多其它的分析思路,这需要进一步去思考这方面的问题。

5.分析结果与可视化

图1-3 发件总数排名前十的部门之间相互发件的网络关系图

说明:(1)部门之间有连线的说明部门之间有过联系(可能是部门间相互给对方发过邮件,也有可能是一个部门给另一个部门发过邮件),部门之间没有连线的说明部门之间没有联系。(2)部门之间的连线越粗,说明部门之间相互发件的数量之和越大。

图1-4 收件总数排名前十的部门之间相互收件的网络关系图

说明:(1)部门之间有连线,说明两部门之间有过联系(可能是部门相互收到对象的邮

件,也有可能是一个部门收到另一个部门的邮件)。(2)部门之间的连线越粗,说明部门之间相互收到的邮件数量之和越大。

图1-5 各部门对其它部门发件排名前三的网络关系图

说明:本图用于描述各部门对其它所有部门发件排名前三的部门网络关系图,从此图可以得到两层信息:(1)每个部门给其它部门发件数量排名前三的部门是谁。(2)部门连接的节点越多,说明该部门与其它有业务关联的部门越多。

图1-6 部门收到其它部门发送邮件排名前三的网络关系图

说明:本图用于描述各部门收到其它所有部门发送邮件排名前三的部门网络关系图,从此图可以得到以下信息:(1)各部门收到其它部门发送邮件数量排名前三的部门是谁。(2)部门连接的节点越多,说明该部门被其它部门关注的程度越高。

6.后续工作与改进方向

本次探索工作在实现的过程中可能存在着各种不足,如网络关系图的可视化方面,在实际应用过程有一些现成的软件可以使用如:pajek、gephi,只需要将数据结果整理成软件要求的格式文件,就可采用这类软件来绘制各种网络管理图,下去可以了解一些这类软件的使用方法。另一方面,在邮件数据的分析目标和分析方法方面,需要进一步去思考怎么去实现,才能真正从数据中得到有价值的信息,这也是以后工作的改进和提升方向。

下载邮件数据分析工作总结0104word格式文档
下载邮件数据分析工作总结0104.doc
将本文档下载到自己电脑,方便修改和收藏。
点此处下载文档

文档为doc格式

    热门文章
      整站推荐
        点击下载本文