《计算机科学》-2019年第02期目录-好期刊

计算机科学 2019年第02期杂志文档列表

计算机科学杂志大数据与数据科学

1-10

供应链金融大数据分布特征的分析与洞见

作者：刘颖单位：吉林财经大学管理科学与信息工程学院; 长春130117; 吉林省物流产业经济与智能物流重点实验室; 长春130117; 吉林财经大学互联网金融重点实验室; 长春130117

摘要：半结构、非结构化、海量的供应链金融数据使得大数据环境下金融数据分析的模式和方法相对复杂。面向大数据样本研究,如何将大样本相比于小样本的独有特征体现在分类模型中值得深入探索。文中从供应链金融数据分布特征入手,分析影响信用风险分类模型的主要因素;对多年来的相关研究成果进行归类分析,概括信用数据分布特征,包括信用数据非均衡与不对称性、信用数据噪声和离群点的存在以及信用数据的非线性多维特征,并探讨了进一步的解决策略。供应链金融大数据分布特征的分析旨在助力挖掘隐含在海量金融数据背后的知识信息,为信用风险模型的构建奠定了坚实的基础。

11-17

质量嵌入的大数据产品生产系统超图模型及其生产线决策研究

作者：王旸; 蔡淑琴; 邹新文; 陈梓桐单位：华中科技大学管理学院; 武汉430074; 华中科技大学软件学院; 武汉430074

摘要：大数据产品(Big Data Product,BDP)在原材料、用户需求、加工工艺等方面具有不同于实体产品的特征,而现有BDP生产系统的研究仍停留在概念模型阶段。为了解决该问题,提出BDP生产线的概念,基于生产线特征研究了生产线决策要素,强调了质量作为关键决策要素在BDP生产中的作用机理;采用超图理论建立了嵌入质量、质量传递函数和质量聚集函数的BDP生产系统模型,设计了BDP生产线决策流程;提出了供给侧稳定和需求侧稳定的BDP生产线决策模式。实例验证结果表明,所提出的模型和决策方法能够满足用户对BDP质量的要求。

18-23

BioPW+:基于Linked Data的生物途径数据可视化系统

作者：刘源; 王鑫; 甘瀛; 杨朝洲; 李维熙单位：天津大学计算机科学与技术学院; 天津300050; 天津大学国际工程师学院; 天津300072

摘要：自Linked Data项目被提出以来,大量的开放关联数据被到语义Web上,这其中就包含了许多的生物途径数据集。为了使生物学家能够有效地利用这些开放的数据集,对基于Linked Data的生物途径数据可视化系统进行研究,提出了生物途径可视化模型和展示布局方案,并且采用标识符动态映射实现了多源生物途径数据的浏览,最终开发了基于Linked Data的生物途径数据查询可视化系统——BioPW+。该系统应用语义Web技术,依靠SPARQL查询来定位生物途径的基本信息,然后基于Open PHACTS平台获取生物途径元素的详细信息,最终Web界面采用力导向图布局、Sankey图布局对生物途径数据进行展示并提供多种交互操作。与已有的仅仅基于某一特定数据库的生物途径工具相比,BioPW+系统基于Linked Data,可以同时一次性展示多个数据集中的生物途径数据及与其相关的其他生物化学数据,极大节省了时间并增强了数据的完整性。

24-29

一种基于混合布局策略的高校教师业绩数据可视化方法

作者：丁维龙; 薛莉莉; 陈婉君; 吴福理单位：浙江工业大学计算机科学与技术学院; 杭州310023

摘要：高校教师的业绩数据对于教师的考核评优、薪资提升、岗位聘任和职称晋升等人事决策具有十分重要的作用。针对其兼具复杂层次特征和多维属性的特点,提出了一种基于圆形嵌套图和平行坐标的VPM(Venn Parallel Coordinates Mixing)混合可视化方法。该方法首先采用基于D3布局算法的圆形嵌套图表示层次结构,而后划分叶子节点的圆周为不同的属性轴,通过布局设计、属性映射、属性点连接及缩放、高亮等用户交互来实现层次结构中多维属性的可视化。将该方法用于教师业绩数据,实现了对学院、研究所、教师各层级结构的可视化,可清晰展示数据项的细节信息。实验结果表明,提出的VPM方法能有效地展示教师的业绩数据,评价结果亦符合实际情况,能帮助系统用户——院校管理者对教师进行更好的管理及业绩考核。

30-34

重复数据中关键属性值缺失填补的改进ROUSTIDA算法

作者：樊哲宁; 杨秋辉; 翟宇鹏; 万莹; 王帅单位：四川大学计算机学院(软件学院); 成都610065

摘要：随着数据分析研究的兴起,数据预处理越来越得到研究者的重视,其中缺失数据填补问题的重要性也逐渐显现。在ROUSTIDA数据补齐算法的基础上,针对具有关键属性的重复数据的特点,文中提出了一种改进的ROUSTIDA算法——Key&Rpt_RS算法。Key&Rpt_RS算法继承了ROUSTIDA算法的优势,同时考虑了目标数据的重复性特点,分析了关键属性对填补效果的影响,得到了更加准确且有效的填补结果。

35-41

基于城市安全知识图谱的多关键词流式并行检索算法

作者：管健; 汪璟玢; 卞倩虹单位：福州大学数学与计算机科学学院; 福州350116

摘要：我国智慧城市安全概念的普及和建设的逐渐落地,以及大数据在智慧城市安全建设方面的深度应用,对关键词检索的处理响应速度提出了更高的要求。针对这一问题,提出了基于城市安全知识图谱的流式知识图谱多关键词并行检索算法(MKPRASKG),该算法能够根据用户输入的查询关键字,通过关联类图的构建、剪枝和融合操作实时构建基于知识图谱实体的查询子图集,再结合评分函数,以高评分的查询子图为指引,在知识图谱实例数据中进行并行搜索,最终返回Top-k查询结果。实验结果证明,该算法在实时搜索、响应时间、搜索效果以及可扩展性等方面均具有较大的优势。

42-49

大数据环境下基于公共服务平台的资源多级智能寻租与匹配策略和价值创造

作者：毕娅; 原惠群; 初叶萍; 刘慧单位：湖北经济学院工商管理学院; 武汉430205

摘要：资源的高效寻租与匹配是其价值创造的关键。文中研究大数据环境下基于公共服务平台的资源寻租与匹配问题,针对公共服务资源的非结构化特点,考虑本体树的路径距离、连接深度和广度,重新定义了语义距离,提出了基于语义距离的五元组形式化描述模型,消除了公共服务资源在底层结构和类型上的复杂性;针对公共服务平台上资源及其相关数据信息规模巨大的问题,提出了资源多级智能寻租与匹配策略,首先通过对参数相对较少且简单的Scategory和Sstatus进行粗粒度过滤,大幅缩小资源寻租的范围,快速提高算法的匹配速度,再通过对Sability和SQoS的细粒度匹配,最终得到符合需求方匹配阈值要求的资源排序集合。实验算例表明,该方法的计算效率显著高于传统的多线程算法,且与目前常用的资源寻租与匹配算法相比,查准率和查全率更优。实验结果证明,该方法有效可行,不仅能够实现公共服务平台上资源的快速寻租和高效匹配,而且还能够在大数据的驱动下实现资源的价值创造。

50-55

一种基于质心空间的不均衡数据欠采样方法

作者：金旭; 王磊; 孙国梓; 李华康单位：南京邮电大学江苏省大数据安全与智能处理重点实验室; 南京210023; 江西省经济犯罪侦查与防控技术协同创新中心; 南昌330103; 数学工程与先进计算国家重点实验室; 江苏无锡214000

摘要：针对目前的分类算法在不均衡数据集上的分类效果不理想的问题,将监督学习和无监督学习相结合,提出了一种基于质心的欠采样——ICIKMDS。在现实应用中,一些数据并不容易获得,或者不同类型的数据本身在数量上就存在着差异性,因此造成了数据集分布的不均,如疾病检测中疾病患者和正常人比例的不均、信用卡欺诈中欺诈用户和正常用户比例的不均等。所提方法很好地解决了数据集不均衡的问题,首先通过求解样本之间的欧氏距离得到初始质心,然后采用k-means算法在大类样本集上进行聚类,使不均衡数据集在分布上更加均衡,有效地改善了分类器的分类效果。所提方法使分类器在测试集小类上的分类准确率远远高于随机欠采样和SMOTE算法,在整个测试集上的准确率几乎与其他算法相同。

56-61

基于知识图谱和频繁序列挖掘的旅游路线推荐

作者：孙文平; 常亮; 宾辰忠; 古天龙; 孙彦鹏单位：桂林电子科技大学广西可信软件重点实验室; 广西桂林541004

摘要：大数据在提供海量多源信息的同时,也带来了信息过载问题,这在旅游领域内表现得尤为突出。针对当前游客在制定旅行路线时需要花费大量时间和精力的现状,首先,提出一种融合多源旅游数据构建知识图谱的方法,有效地抽取相关旅游领域知识;其次,利用知识图谱及大量旅行游记生成旅游路线数据库,并提出一种能够根据游客类型生成海量候选路线的频繁路线序列模式挖掘算法;最后,设计了一种多维度路线搜索和排序机制来为用户推荐个性化的旅游路线。基于真实旅游大数据的实验结果表明,该方法可以同时考虑旅行天数、人物类型和景点类型喜好等多方面因素,帮助游客快速制定个性化的旅行路线,有效提升游览体验。

62-67

基于核函数的稀疏属性选择算法

作者：张善文; 文国秋; 张乐园; 李佳烨单位：广西师范大学计算机科学与信息工程学院广西多源信息挖掘与安全重点实验室; 广西桂林541004

摘要：鉴于传统属性选择算法无法捕捉属性之间的关系的问题,文中提出了一种非线性属性选择方法。该方法通过引入核函数,将原始数据集投影到高维的核空间,因在核空间内进行运算,进而可以考虑到数据属性之间的关系。由于核函数自身的优越性,即使数据通过高斯核投影到无穷维的空间中,计算复杂度亦可以控制得较小。在正则化因子的限制上,使用两种范数进行双重约束,不仅提高了算法的准确率,而且使得算法实验结果的方差仅为0.74,远小于其他同类对比算法,且算法更加稳定。在8个常用的数据集上将所提算法与6个同类算法进行比较,并用SVM分类器来测试分类准确率,最终该算法得到最少1.84%,最高3.27%,平均2.75%的提升。

计算机科学杂志网络与通信

68-75

F-OFDM系统中的自适应EM相位噪声抑制算法

作者：陈大爽; 李英善; 吴虹单位：南开大学信号处理与传感网络实验室; 天津300351; 天津市光电传感器与传感网络技术重点实验室; 天津300351

摘要：滤波正交频分复用技术(Filtered Orthogonal Frequency-Division Multiplexing,F-OFDM)是针对下一代移动通信的新技术,它在保持4GOFDM技术强抗干扰能力等诸多优点的基础上,能够适应未来各种灵活的业务配置;但其对相位噪声更加敏感,相噪会导致其出现子带共同相位误差(Sub-Band Common Phase Error,SCPE)和子带载波间干扰(Sub-Band Inter-Carrier Interference,SICI),严重降低系统性能。基于最大期望准则(EM),提出一种自适应EM相噪抑制算法(AEM-PNS),其中包含EM-SCPE和EM-SICI两个子算法,算法通过在符号帧中插入的相噪指示符(Phase Noise Instruction Symbol,PNIS)和导频指示符(Pilot Instruction Symbol,PIS)自动选择子算法。仿真结果表明,新提出的算法能自适应跟踪相噪的变化,有效降低相位噪声的影响,同时具有较低的计算复杂度和较高的频谱效率。

76-80

基于网络熵的域内节能路由方案

作者：张举; 耿海军; 刘洁琦单位：山西大学软件学院; 太原030006; 网络与交换技术国家重点实验室; 北京100876

摘要：减少网络能耗和建立绿色网络已经成为学术界和工业界研究的关键科学问题。已有的节能方案均在已知流量矩阵的前提下展开研究,但是获得实时流量数据并不容易。因此,文中研究了如何在未知流量矩阵的情况下降低网络能耗,提出了一种基于网络熵的域内节能路由方案(Intra-domain Energy Efficiency Routing Scheme Basedon Network Entropy,EERSBNE),该方案通过关闭网络中的链路来实现节能的效果。首先提出了链路关键度模型和网络熵模型,然后根据链路关键度计算网络中所有链路的重要程度,最后根据链路的重要性和网络熵模型依次关闭网络中的链路。实验结果表明,该算法在降低网络能耗的同时不会引入较大的路径拉伸度。

81-87

移动社会网络中基于多维上下文匹配的数据转发算法

作者：徐方; 邓敏; 熊曾刚; 叶从欢; 徐宁单位：湖北工程学院计算机与信息科学学院; 湖北孝感432000; 武汉大学计算机学院; 武汉430072

摘要：通过研究移动社会网络中的多种上下文信息对节点移动模式的影响,提出了基于多维上下文认知的数据转发算法MCMF。该算法综合考虑物理邻接性、社会相似性以及社会交互性3个维度的上下文信息来进行动态数据转发决策。首先消息携带者节点通过物理邻接匹配获得邻居节点集合;然后通过社会相似性匹配在邻居节点集合中选出候选节点子集,并基于社会网络的社群特征,采用马尔可夫预测方法在候选节点子集中选出最优中继节点;最后设计高效的数据转发算法。仿真实验表明,相比于其他3种著名算法,该算法在交付比率和开销比率方面具有较好的性能。

88-94

无线车载网络中一种基于跨层优化的网络编码TCP协议

作者：陈杰; 谢显中; 黄倩; 黎佳单位：重庆邮电大学宽带接入网络研究所; 重庆400065

摘要：无线车载网络(Wireless Vehicular Networks,WVN)具有研究价值和重要应用价值,目前关于WVN中的网络编码TCP协议的研究并不多,且对跨层的优化也没有被重视。文中首先针对无线车载网络中不同的丢包原因,给出了一种基于随机线性网络编码的跨层联合优化方法VC-TPC/NC,可以针对不同丢包原因采取不同的处理方式;进一步,重新设计了网络编码层发送端的发送策略,并通过理论分析说明了VC-TCP/NC在时延和网络吞吐量方面的优势;最后,在不同场景下的仿真结果表明,VC-TCP/NC的性能相比于传统TCP与TCP/NC等性能有较大提高。

计算机科学杂志信息安全

95-101

多维敏感特征的Android恶意应用检测

作者：谢念念; 曾凡平; 周明松; 秦晓霞; 吕成成; 陈钊单位：中国科学技术大学计算机科学与技术学院; 合肥230026; 安徽省计算与通讯软件重点实验室; 合肥230026

摘要：应用程序的行为语义在Android恶意应用检测中起着关键作用。为了区分应用的行为语义,文中提出适合用于Android恶意应用检测的特征和方法。首先定义广义敏感API,强调要考虑广义敏感API的触发点是否与UI事件相关,并且要结合应用实际使用的权限。该方法将广义敏感API及其触发点抽象为语义特征,将应用实际使用的权限作为语法特征,再利用机器学习分类方法自动检测应用是否具有恶意性。在13 226个样本上进行了对比实验,实验结果表明,该方法的分析速度快且开销小,选取的特征集使Android恶意应用检测得到很好的结果;经机器学习分类技术的比较,我们选择随机森林作为检测方案中的分类技术,所提特征策略的分类准确率达到96.5%,AUC达到0.99,恶意应用的分类精度达到98.8%。

计算机科学杂志北大期刊 CSCD期刊 统计源期刊

基本信息

BASIC INFORMATION

计算机科学 2019年第02期杂志文档列表

计算机科学杂志北大期刊CSCD期刊统计源期刊

基本信息

BASIC INFORMATION

计算机科学 2019年第02期杂志 文档列表

计算机科学杂志北大期刊 CSCD期刊统计源期刊

计算机科学 2019年第02期杂志文档列表