英语论文艺术论文会计审计论文土建类论文农业科学论文代写论文专区公文范文代发论文代写作业论文检索代写论文价格论文格式留学生论文高中教学论文哲学论文政治论文经济学论文理工科学论文护理学论文管理科学论文教育学论文其他资料计算机科学论文医药学论文法律论文日本语论文文学媒体论文文化历史学论文社会学论文代写体育论文

英语翻译论文英美文学论文英语语言学论文英语其它商务英语论文英美文化论文

学科教育论文信息技术论文德育管理论文素质教育论文图书馆学论文教育心理学论文小学语文高效课堂论文小学语文电教论文小学英语电教论文小学数学电教论文中学英语电教论文中学音乐电教论文小学电教教育论文小学科学电教论文中学数学电教论文初中数学电教论文生物自然教学论文历史教学论文地理教学论文教育理论论文教育管理论文基础教育论文中等教育论文高等教育论文职业教育论文英语教学论文语文教学论文政治教育论文数学教学论文物理教学论文化学教学论文体育教学论文美术论文音乐论文中学化学电教论文

药学论文医学论文题目医学论文投稿医学论文格式医学其他泌尿科论文眼科论文外科论文医学硕士论文呼吸消化论文医院管理论文临床医学论文中医学论文医患关系论文

建筑工程论文土木工程论文城市规划论文建筑论文

工商管理论文管理基本理论论文成本管理论文档案管理论文企业研究论文管理理论论文企业文化论文项目管理论文MPA论文经济管理论文风险管理论文行政管理论文图书馆管理论文公共管理论文工程管理论文旅游管理论文市场营销论文人力资源管理论文秘书文书论文物流供应链管理论文信息管理论文电子商务论文战略管理论文代写mba论文

财政税收论文技术经济学论文农业经济论文债务市场论文投资决策论文融资决策论文宏观经济论文经济相关论文货币银行论文保险论文金融证券论文国际贸易论文中国经济论文经济学理论论文行业经济论文国际经济论文发展战略论文国民经济核算论文

财务分析论文MPACC论文财务控制论文会计研究论文财务管理体制论文成本会计论文审计论文电算化会计论文CPA行业论文管理会计论文会计理论论文会计毕业论文

国际法论文法学史论文公司法论文合同法论文经济法论文知识产权法论文司法制度论文法学理论论文国际商法论文宪法论文行政法论文刑法论文民法论文诉讼法论文

软件工程论文计算机网络论文计算机应用论文计算机安全论文计算机专业论文计算机论文范文

汉语言学论文古代文学论文现当代文学论文新闻传播学论文

中国古代史论文中国近代史论文传统文化论文文化战略论文宗教文化论文

农村研究论文人口问题论文伦理道德论文心理学论文社会其他民俗学论文

民主制度论文毛泽东思想论文政治学论文国际关系论文科学发展观论文马克思主义论文资本主义论文社会主义论文政治哲学论文邓小平理论论文

逻辑学论文中国哲学论文西方哲学论文国学论文美学哲学论文

音乐舞蹈论文环境艺术设计论文园林艺术论文网页设计论文室内设计论文戏剧论文动漫设计论文平面设计论文美学论文艺术理论论文电影电视论文美术绘画论文传播学论文

面向教育数据的校验软件关键技术研究

时间:2018-11-05 21:57来源:硕士论文作者:lgg 点击:
本文是一篇软件工程论文,软件系统能最有效的利用计算机的时间和空间资源。各种软件无不把系统的时/空开销作为衡量软件质量的一项重要技术指标。
本文是一篇软件工程论文,软件系统能最有效的利用计算机的时间和空间资源。各种软件无不把系统的时/空开销作为衡量软件质量的一项重要技术指标。很多场合,在追求时间有效性和空间有效性时会发生矛盾,这时不得不牺牲时间有效性换取空间有效性或牺牲空间有效性换取时间有效性。时/空折衷是经常采用的技巧。(以上内容来自百度百科)今天为大家推荐一篇软件工程论文,供大家参考。
 
1 绪论
 
1.1 课题背景与研究意义
随着互联网技术的迅猛发展,传统的依靠手工进行数据统计的过程转变为基本单位数据库的建设,这一点已成为国际统计界的共识[1]。以前,数据生产的整个过程由统计部门牢牢把握,难以得到机构及民众的有效监督,随意授权篡改数据以达到国家标准的事件屡见不鲜。统计数据是反映教育事业的“晴雨表”,通过对统计数据的分析,既可以为政府部门提供决策依据,同时也是检验政府决策的有效手段[2]。大数据时代,数据将不仅仅局限于自身的圈子中,而是成为一种共享资源。在教育基础数据库建设中,数据质量问题产生的主要原因有:1)人为捏造或修改信息造成的,一些关键的数据指标面临再加工的风险,有的单位会虚报、瞒报、漏报,严重影响了基层统计数据的客观性和真实性[2];2)教育工作人员对于统计数据的理解欠缺以及现有的校验手段比较单一[3],只是解决了基本数据问题,没有深入到数据之间的关系内部,数据校验方法还有待完善;3)教育行业的数据来源丰富且类型多样,几乎涵盖幼儿园、中小学、特殊教育学校以及各大高校等业务,以及在数据项、上报形式和数据规模上多元化的区别,导致收集数据时数据类型不一致、上报精度不统一、彼此关联的数据项不满足业务关联,以及相关指标超过限定阈值,导致误差偏差很大[3];4)由于各数据终端在采集原始数据时采用的方法和技术各不相同,使得在汇总数据时很难做到统一处理导致质量很难满足要求[4];5)针对我国教育统计工作部门的工作人员统计能力水平低下,因此数据的统计存在不真实性[5]。各级各类学校学年事业统计数据是全面反映本地区教育发展现状的基础资料,也是政府对外公布教育发展水平和制定今后教育发展规划的重要依据,是各级各类机构检查、评估验收等的数据源,将逐级上报至国家教育部。数据报表在统计完成后,或多或少会出现一些不准确或不合理的数据。针对这些数据制定一套合理的校验方法则至关重要。如果没有有价值的数据,再先进的技术、再新的模式,也是“无根之术”,教育大数据的价值难以体现。究其根源,数据校验是当下优化教育数据的最为高效的方式。
.........
 
1.2 国内外研究现状
在对数据校验中统计质量的研究中,国内大多数的学者只是对定义、管理以及评估体系的理论探索阶段[7]。陈凤兰、王秀琴 2005 年提出从以下几个方面进行改进:1)改革干部考核制度、完善管理体制;2)改革统计从属关系,实施垂直管理制度;3)依法加强统计工作;4)健全统计数据质量评估体系;5)提高统计人员素质[8]。2015 年彭江华从统计数据质量的理论研究及实践历程方面进行了探讨,提出了统计工作的三个策略,分别为统计体制的完善、统计标准的规范和统计方法的科学性[9]。在实践方面,2014 年朱松、高喜燕分析了在统计数据质量评估方面,国内的使用方法主要是一维评估法,而国外主要是多维评估法,主要包括 ROSC-DM 法、指标集测评法和质量综合评价法[10]。在相关技术方法研究方面,围绕提高统计数据质量,前期我国研究者针对统计误差方面的理论进行了相关研究,从统计数据产生误差的原因方面分析,1990 年马安提出了误差产生的原因以及如何有效避免误差的手段[11];从误差控制方法出发,文献[12]中傅德印2000 年提出了包含基于误差文档的分类控制和基于误差模型的技术控制在内的政府统计数据质量控制技术体系;在统计数据收集及处理过程中,2005 年周奕辛提出了利用有效权值和长度过滤的优化算法对 SNM 算法进行了改进[13];2009 年陶然等人提出基于统计数据质量成本关系模型,分析最优质量水平与质量投入之间的关系[14]。
........
 
2 教育数据校验的相关理论和技术
 
2.1 教育统计基础数据概述
教育统计基础数据主要包括机关单位统计数据、科学研究数据和其它机构数据[2]。(1)机关单位统计数据。国家相关机关单位部门所统计的基础数据,如《中国教育统计年鉴》以及国家统计局发布的教育数据。(2)科学研究数据。研究者或者个体团队组织获得的问卷调查、调研或实验数据。(3)其它机构数据。其它机构系统采集的数据及发布的专业数据,例如世界银行教育统计数据门户 EdStats 提供的教育数据。其中,其它机构数据中的教育事业统计反映了我国现有的教育发展情况,对于我国各级教育行政部门进行教育资源决策和发展规划都具有很重要的意义。因此如何确保教育统计基础数据的质量变得尤为重要[2]。统计内容主要包括各类学校的教育信息、学生信息、教职工信息、固定资产、办学条件情况等。工作流程一般采用自上而下逐级布置、自下而上逐级汇总的工作方式。数据统计数据要流经校级、区县级、市级和国家级教育部门,下属单位向上一级部门进行数据上报,上级发现错误后将结果反馈给下级机构,直至没有错误再将数据进行上报,通过如此的迭代过程,最终将数据汇总至国家,公布于社会,具体统计流程如图 2-1 所示:
..........
 
2.2 教育统计基础数据校验
 
2.2.1 教育统计基础数据校验概述
教育统计数据在收集过程中,难免产生错误数据,为了保证数据质量的准确度,将统计单位最小化,对数据进行全生命周期管理,一般过程中的校验主要包括以下几个方面:(1)记录完整性。数据记录的完整度依据属性特征的不同,表现方式也各不相同。其主要分为三种情况:模式完整性、列完整性和整体完整性。其中,模式完整性取决与数据结构设计,列完整性值指数据记录的某项属性值的完整程度,整体完整性指数据记录是否完全记录在列。如,每个学校的组织机构编码OrganizationID唯一,则学校OrganizationID列完整度为 100%;若某市某县具有 300 所学校,而数据库表中只有 280 所,则整体完整度为 280/300=93%;(2)符合规范的数据组织和精度。如面积取值精度保持在小数点后两位;学校经纬度中,经度表示形式:经度.经分.经秒,有效值范围为东经 73 度~135 度,纬度表示形式:纬度.纬分.纬秒,有效值范围为北纬 4 度~54 度;(3)正确的逻辑关系。如学生所选学段为小学,政治面貌变更为群众;若学生所选学段为初中,学生政治面貌变更为群众、中国共产主义青年团团员;(4)符合常识性经验关系。教育属性在一定的区域范围内或者学校分布特征下,呈现出一定的规律性,通过专家知识或者人工统计分析等手段可以推断经验值,统计数据属性应该符合一般的常识;(5)准确性。用来表明数据信息是否存在错误,指在数据收集或调查过程中的观测值与其真实值的接近程度。例如,学生和教师信息的性别属性值,只能存在男和女或者规定的男(0)和女(1)两种形式,若出现别的字符或者数字之外的则为错误数据。
.......
 
3 基于人机交互的数据校验方法.......13
3.1 相关理论...........13
3.2 人机交互型数据校验模型.....15
3.2.1 数据校验模型构建.......16
3.2.2 数据校验步骤....17
3.2.3 算法设计............20
3.3 仿真及数据结果..........21
3.4 本章小结...........29
4 基于规则的数据校验方法....31
4.1 校验规则...........31
4.2 规则管理...........34
4.3 规则模型设计..............35
4.4 规则表达...........36
4.5 基于规则的数据校验过程.....39
4.5.1 数据校验过程....40
4.5.2 数据校验质量评价.......42
4.6 本章小结...........46
5 数据校验方法在教育统计平台中的应用.............47
5.1 系统总体架构设计......47
5.2 主要功能模块..............47
5.3 数据校验实现方式......50
5.4 本章小结...........53
 
5 数据校验方法在教育统计平台中的应用
 
本章主要介绍第三章和第四章校验方法的应用。首先对教育统计基础数据库平台进行详细介绍,然后对系统的主要功能模块进行阐述,介绍了数据校验在该系统中的重要性,最后对系统校验结果进行分析并得出结论。
 
5.1 系统总体架构设计
如图 5-1,整个系统的开发采用 B/S 架构,主要包括本地 Web 浏览器(客户端)和远程 Web 服务器(服务器端)两部分。为了保证安全,客户端通过 VPN(虚拟专用网络)与服务器进行连接,当用户进行校验任务时,为了保证校验的速度,通过多台客户端并发访问多台数据服务器,系统网络架构图如图 5-1 所示。本文所提出的数据校验方法应用于某市教育统计平台项目,该教育统计平台与教育支撑平台对接,实现统一身份平台、统一基础数据访问、统一消息平台及统一信息服务门户,并且具有市交通局、旅游局、市统计局开放接口,主要在业务办理和统计基表部分进行数据校验,该系统对数据准确性有很大的要求,务必从数据源头控制数据质量。业务办理模块主要包括统计台账、统计基表、学校机构对比和异常数据三个功能模块。统计台账是反映一个机构统计数据的整体情况的资料记录,使用电子化表格进行存储,即电子台账。统计基表是国家规定的反映学校基本信息内容的记录表,包含机构基本情况、教师、学生、校舍等基本情况,一般由明细或者台账通过统计计算生成。异常数据主要对违反非空约束规则和数据值有误数据进行可视化显示,包括校内异常和校间异常。校内异常描述学校内部问题数据,如根据学生身份证件号码的编码规则可以确定其性别,与学生所填写的性别信息进行对比,找出不一致数据,学生身份证件号码和出生日期不匹配,专任教师授课情况为空等;校间异常对学校之间疑似重复数据进行相似度计算,并进行显示。当区级用户进入系统,显示区级含区级以下机构校间异常数据,省级用户进入系统,显示省级以下机构校间异常数据。当前机构可对该机构异常信息进行处理。学校机构对比是检查标准库与当前库是否具有差异。如学校今年被撤销,但结转过来的学校信息可能还没有及时更改,就会出现数据不一致现象。
.......
 
总结
 
本文首先分析了不同的因素下数据校验原理,随后分析了现存几种校验方法的优缺点,然后本文在分析现存校验方法缺陷的基础上,针对教育统计基础数据进行了全方位的校验方法设计,补充了现有校验方法的不足,确保教育统计基础数据的规范性,为日常查询、统计、分析的准确性提供依据。主要做了以下工作:
(1)分析了数据校验原理,对教育统计数据的校验需求做了详细的介绍。
(2)设计基于人机交互的客户端数据校验方法本文研究发现现有统计数据采集过程中普遍没有对输入做实时控制的需求,针对这一问题,分析教育数据的特征,选取合适的预测算法,设计利用最小二乘支持向量机方法与教育统计指标体系相结合的人机交互型校验模型,其特征在于针对不同类型学校进行分析,如小学范围实现小学数据的限制、中学范围实现中学指标数据的限制,使数据阈值范围更加合理,从数据源头制止错误数据发生的概率。
(3)设计基于规则的数据校验方法通过研究教育数据统计基础数据库的质量要求,定义教育数据的质量元素,提出规范性校验规则、数据唯一性规则、数据完整性规则在内的五大校验规则,提出的规则校验方法,分为两个部分,规则引擎校验和规则库校验。规则引擎校验主要实现的是业务规则校验,规则库校验主要实现的是多表之间的数据校验,侧重点不同,都能很好地使得程序设计与业务逻辑分离,降低耦合度,具有很好的动态适应性。经过系统验证,基于规则的校验方法在很大程度上提高了数据的真实性,并且减少了上报时间。
(4)基于规则的数据校验质量评价模型本文分析了教育数据质量的几个维度,并对每种规则进行详细分析,在此基础上为教育统计基础数据建立了基于规则的评价模型,直观显示数据质量差异程度。
..........
参考文献(略)
(责任编辑:gufeng)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
论文代写请联系:

论文代写电话:
论文代写电话:
email:@qq.com
论文代写qq:

\
论文代写 价格合理
QQ在线客服
中华论文网
咨询QQ
4006227154
400-622-7154
13795489978