《计算机科学》-2017年第03期目录-好期刊

计算机科学 2017年第03期杂志文档列表

计算机科学杂志研究快报

1-2

深度学习改变保险精算定价模式

作者：张宁单位：中央财经大学中国精算研究院; 北京100081

摘要：介绍了一种基于生理年龄的精算定价新方式,该方式基于手背纹理照片,利用深度学习技术获得可靠的生理年龄评价结果,从而将其应用于保险上以获得更能反映投保人风险的定价。该技术和框架是深度学习在保险公司应用上的尝试,变革了数百年来保险公司基于日历年龄定价的传统模式。

计算机科学杂志云计算

3-9

云服务环境下的密钥管理问题和挑战

作者：杨璐; 叶晓俊单位：清华大学软件学院; 北京100084

摘要：为了在云环境下安全地交互各种云数据服务,存储这些服务生成或处理的敏感性数据,云服务提供商应提供多种类型的安全加密机制。相比于传统IT环境,由于云用户和云服务供应商之间的所有权不同,各种云计算服务模式（基础设施即服务、平台即服务、软件即服务）在加密服务中产生了大量密钥,使得密钥的管理和使用变得更为复杂。明确了云环境中的密钥类型、可能的状态、基本的管理功能及通用安全要求,讨论了3种典型云服务模式中密钥管理安全功能的架构方案,并从密钥管理服务互操作性需求方面给出了密钥管理互操作相关应用系统的架构和功能设想。

10-15

云环境下的突发关键字查询算法

作者：郑诗敏; 秦小麟; 刘亮; 周倩单位：南京航空航天大学计算机科学与技术学院; 南京211106

摘要：基于Spark Streaming计算框架下的分布式突发关键字查询是监测流数据中关键字突发时间的热点研究问题。多数研究方法存储统计所有的关键字,并未考虑热点关键字。在数据呈爆炸式增长的背景下,获取热点关键字的突发时间更具有价值。针对这个问题,提出一种分布式突发关键字查询算法,该算法采用动态的更新策略,通过设置检查点的方法提取热点关键字,并在线性的时间内查询突发的时间范围。实验结果表明,该算法的性能比现有算法更优。

计算机科学杂志2015全国高性能计算学术年会

16-19

路网中高吞吐量移动对象实时查询算法

作者：薛忠斌; 白利光; 何宁; 周烜; 周歆; 王珊单位：神华国华北京电力研究院有限公司; 北京100069; 教育部数据工程与知识工程重点实验室中国人民大学; 北京100872; 中国人民大学信息学院; 北京100872

摘要：随着无线通信技术、空间定位技术和移动计算技术的快速发展,基于位置的查询成为数据库领域的一个重要研究问题。研究了路网中移动对象的KNN查询,一系列的算法被提出用于解决移动对象的KNN查询问题。然而,这些算法关注于查询的快速响应问题或者专注于解决移动对象的快速更新问题。随着移动对象数量的不断增加,当查询和更新大量涌入时,吞吐量成为一个更重要的问题。针对移动对象的更新数据流和查询数据流,提出了一种基于内存的高吞吐量移动对象KNN查询算法——DSRNKNN算法,用于处理路网中移动对象的KNN查询。DSRNKNN算法采用了基于快照的模式。在每个快照中,DSRNKNN算法通过重新构建索引的方式避免了复杂的索引维护操作,充分发挥了硬件的性能;通过每次执行一组查询的方式,充分利用查询内和查询间的并行,增加了数据的局部性,提高了算法的效率。在基于实际路网生成的数据集上对算法进行了测试,实验验证了DSRNKNN算法具有很好的性能表现。

20-22

异构集群上的宏基因组聚类优化

作者：韦建文; 许志耿; 王丙强; Simon; SEE; 林新华单位：上海交通大学高性能计算中心; 上海200240; 国家超算深圳中心; 深圳518055; NVIDIA公司; 新加坡

摘要：宏基因组基因聚类是筛选致病基因的新型方法,其依赖于海量的测序数据、有效的聚类算法以及高效的计算机来实现。相关系数矩阵的计算是进行聚类前必须完成的操作,占总计算量的比重较大。以某基因库为例,包含1300个样本、每样本百万基因的数据,单线程运行需要27年。充分发挥多核CPU的潜力,利用GPU加速卡强大的计算能力,将程序扩展到多节点集群上运行,是重要而迫切的工作。在仔细分析算法的基础上,首先针对单CPU节点和单GPU卡做了高效实现,获得了接近理想的加速比;然后利用缓存优化进一步提升性能;最后使用负载均衡方法在MPI线程间分发计算任务,实现了良好的扩展。相比未优化的单线程程序,16节点CPU获得了238.8倍的加速,6块GPU卡获得了263.8倍的加速。

23-26

一种MapReduce架构下基于遗传算法的K-Medoids聚类

作者：赖向阳; 宫秀军; 韩来明单位：天津大学计算机科学与技术学院; 天津300072; 天津市认知计算与应用重点实验室; 天津300072

摘要：由互联网时代快速发展而产生的海量数据给传统聚类方法带来了巨大挑战,如何改进聚类算法从而获取有效信息成为当前的研究热点。K-Medoids是一种常见的基于划分的聚类算法,其优点是可以有效处理孤立、噪声点,但面临着初始中心敏感、容易陷入局部最优值、处理大数据时的CPU和内存瓶颈等问题。为解决上述问题,提出了一种MapReduce架构下基于遗传算法的K-Medoids聚类。利用遗传算法的种群进化特点改进K-Medoids算法的初始中心敏感的问题,在此基础上,利用MapReduce并行遗传K-Medoids算法提高算法效率。通过带标签的数据集进行实验的结果表明,运行在Hadoop集群上的基于MapReduce和遗传算法的K-Medoids算法能有效提高聚类的质量和效率。

27-31

基于压缩域的脑成像大数据体可视化方法

作者：时学凯; 王文珂; 黄辉; 李思昆; 傅艺绮单位：国防科学技术大学计算机学院; 长沙410073; 国防科学技术大学海洋科学与工程研究院; 长沙410073

摘要：脑科学是当今国际科技研究的前沿邻域,而对高精度脑成像数据进行可视化是脑神经科学在结构成像方面的基础性需求。针对高精度脑成像数据可视化过程中存在的数据量大以及绘制效率低的问题,提出了基于分类分层矢量量化和完美空间哈希相结合的压缩域可视化方法。首先对体数据进行分块,记录每块的平均值并依据块内体数据的平均梯度值是否为0进行分类;其次运用分层矢量量化对平均梯度值不为0的块进行压缩;然后用分块完美空间哈希技术存储压缩得到两个索引值;最后对上面的压缩体数据进行解码得到恢复体数据,采用分块完美空间哈希对原始体数据与恢复体数据作差得到的残差数据进行压缩。绘制时,只需将压缩得到的数据作为纹理加载到GPU内,即可在GPU内完成实时解压缩绘制。实验结果表明,在保证较好图像重构质量的前提下,该算法减少了数据的存储空间,提高了体可视化的绘制效率,从而可以在单机上处理较大的数据。

32-35

Calculix三级并行优化及其在天河二号超级计算机中的应用

作者：姜文超; 林穗; 王多强; 李东明; 金海单位：广东工业大学计算机学院; 广州510006; 华中科技大学计算机学院; 武汉430074; 广州船舶及海洋工程设计研究院; 广州510250

摘要：针对开源有限元软件Calculix传统计算模式在大规模数值计算中的低效问题,提出了Calculix三级并行优化策略,即预处理并行优化、节点间并行调度以及节点内多核多线程并行改造。预处理并行优化在方程组分解过程中与分解过程后,分别对其参数矩阵进行有条件的动态舍弃,据此构造了部分列选主元多行双门槛不完全LU分解预处理算法,并对算法的可行性、有效性以及收敛性给出了证明。为充分发挥TH-2超级计算机强大的资源优势,相继给出了基于QoS的节点间任务动态调度算法,以及节点内多核多线程并行任务调度算法,进一步实现计算任务与资源之间的优化匹配和QoS需求。在实验环节中搭建了针对天河二号（TH-2）超级计算环境的有限元并行计算与分析平台,并完成了针对船舶疲劳强度分析问题的实际工程应用测试。理论分析与工程算例测试结果充分证明：Calculix三级并行优化方案能够有效提高Calculix求解线性方程组的速度,在可获取足够计算资源的前提下,与传统计算模式相比,实际工程算例的计算速度平均提高了2~4倍。

36-37

基于Pthreads的车辆图像兴趣区域提取并行算法研究

作者：周艺华; 王文东; 陈宏彩; 王婷; 张常有单位：北京工业大学计算机学院; 北京100124; 中国科学院软件研究所并行软件与计算科学实验室; 北京100190; 河北省应用数学研究所; 石家庄050081; 可信计算北京市重点实验室; 北京100124

摘要：为了提高公安机关查找犯罪车辆的效率,提高车辆识别的效率很必要。据统计,提取兴趣区域（Region Of Interest,ROI）约占车型识别过程的60%,因此如何加速提取ROI过程尤其重要。首先,通过数据划分方法实现基本并行算法;然后,经过实验分析,在基本并行算法的基础上,精心设计预处理过程的分解方案,设置多队列缓冲区,减少共用缓冲区的线程数量和每个缓冲区互斥锁锁定的次数。实验证明,所提算法在双CPU 12核（支持超线程到24线程）的服务器上运行,相对于串行算法,实现了13.1x的加速比。

38-41

一个面向任务图并行程序的错误检查工具

作者：刘艳娜; 陈莉; 唐生林单位：中国科学院计算机研究所; 北京100190

摘要：AceMesh是一种基于数据流描述的任务并行编程语言,它允许程序员从串行程序出发,追加并行区域、并行循环的制导以及任务区的数据访问信息,AceMesh编译系统则自动把该程序转化为异步任务图并行的程序。分析了AceMesh程序改写中常见的并行化错误,介绍了其错误检查工具AceMeshCheck的结构,描述了访存轨迹的高效收集、存储方法以及逻辑形状推导的三维压缩算法。实验表明,AceMeshCheck不仅能分析出制导程序中的典型错误,而且开销较小。

42-47

气象数据检索区域查询优化及并行算法设计

作者：许婧; 任开军; 李小勇单位：国防科技大学计算机学院; 长沙410073; 国防科技大学海洋科学与工程研究院; 长沙410073

摘要：随着数值天气预报水平和分辨率的不断提高,气象科学数据呈海量增长趋势,导致气象资料归档与检索系统（MARS）处理大数据服务请求的效率较低。针对此情况,开展了基于MARS检索区域查询方式的优化研究,结合数学补集思想与多路数组聚集计算原理,提出了一种高效的补集转换区域查询方法（CTRQ）,从而实现大范围区域查询下的“大数据”计算转换为“小数据”计算。其基本思路是通过超立方体聚集维尺寸与区域查询服务请求的属性值集合大小比较,执行“过半求补”的索引计算操作,利用二次求补实现气象场数据物理存储信息的检索。实验表明,相比原始的索引计算方法,该方法能够有效降低数据检索时元数据索引计算的系统开销。在此基础上,结合并行处理方法,设计并实现了CTRQ并行算法,相比其改进后的串行算法最大获得1.9倍加速比,进一步提高了MARS的检索效率。

48-50

并行计算水下大尺度弹性壳体的低频声散射

作者：张建民; 安俊英; 慈国庆; 王宁单位：中国科学院声学研究所北海研究站; 青岛266023; 中国海洋大学信息科学与工程学院; 青岛266100

摘要：有限元与边界元耦合模型是研究水下弹性壳体目标低频声散射常用的数值方法。应用该模型计算大尺度弹性目标的声散射时需要大量的计算时间与存储空间,采用并行数值的方式可以解决这一问题。首先并行计算生成有限元矩阵和边界元矩阵,然后应用并行化的广义极小残差（GMRES）迭代算法求解大型非对称线性方程组。详细叙述了并行GMRES（m）迭代算法的执行过程,并以球壳的声散射计算为例分析了迭代步数对算法收敛情况的影响。最后计算了Benchmark目标模型的低频散射声场,分析了其收发分置散射目标强度以及表面声场的分布。

51-54

基于MPI和OpenMP混合编程的非负矩阵分解并行算法

作者：唐兵; Laurent; BOBELIN; 贺海武单位：湖南科技大学计算机科学与工程学院; 湘潭411201; 中国科学院计算机网络信息中心; 北京100190

摘要：非负矩阵分解（NMF）作为一种数据降维和特征提取的有效工具,已经在文本聚类、推荐系统等多个领域得到应用,但是其计算过程比较复杂。对此,提出一种基于MPI＋OpenMP的混合层次化并行NMF方法,其充分利用基于MPI的消息传递模型和基于OpenMP的共享存储模型各自的优势,并基于多核节点集群进行测试。实验结果表明,所设计的并行NMF算法达到了较高的加速比,能有效处理高阶矩阵的非负分解,极大地提高了计算的效率。

55-58

一种层次式远程数据持有检测方法

作者：马海峰; 杨家海; 姚念民; 关明山单位：黑龙江科技大学计算机与信息工程学院; 哈尔滨150022; 清华大学网络科学与网络空间研究院; 北京100084; 大连理工大学计算机科学与技术学院; 大连116024

摘要：在云存储环境下,云服务器并不完全可信。用户如何以较低开销验证云上数据的完整性成为用户日益关心的问题。目前已提出多种保护方法,这些方法在认证多个文件时需要对文件逐一进行认证,因此当文件数很大时其计算和通信开销仍较大。针对此问题,提出一种层次式远程数据持有检测方法。该方法与远程数据持有检测方法相结合,能提供高效且安全的远程数据完整性保护,并支持动态数据操作。对提出的方法进行了安全性分析和实验评估,结果表明,提出的方法安全可靠,在较低的漏检率下,相比远程数据持有检测方法有45%～80%的性能提升。

59-62

基于B样条的Level-Set GPU演化算法

作者：袁斌单位：北京应用物理与计算数学研究所; 北京100088

摘要：大部分Level-Set演化模型基于平均曲率或梯度,这对去除3D数据的噪声时保持线状特征是不利的;在解Level-Set演化方程时一般采用迎风格式,精度较低。设计了基于曲率差的高阶演化方程以及基于B样条和中心差分的混合GPU解法器。实验结果表明,基于曲率差的演化方程能够在光顺数据时保持线状特征。

计算机科学杂志北大期刊 CSCD期刊 统计源期刊

基本信息

BASIC INFORMATION

计算机科学 2017年第03期杂志文档列表

计算机科学杂志北大期刊CSCD期刊统计源期刊

基本信息

BASIC INFORMATION

计算机科学 2017年第03期杂志 文档列表

计算机科学杂志北大期刊 CSCD期刊统计源期刊

计算机科学 2017年第03期杂志文档列表