HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

数据分析解决方案集锦9篇

时间:2022-08-23 17:42:48

数据分析解决方案

数据分析解决方案范文1

大数据市场确实存在。Gartner预测,到2015年,70%的信息基础架构扩展与投资的主要驱动因素是业务分析需求。以前,人们把精力主要放在如何存储好海量的数据上,而没有想到深入挖掘数据的内在价值。随着数据与业务之间的关系越来越紧密,以及一些大数据分析工具不断涌现,数据分析成了企业决策的前提。

大数据不一定是复杂的分析

许多人一提到大数据,首先想到的是复杂的数据分析。这让有些希望采用大数据分析工具的用户产生了畏难情绪,也让有些用户产生了误解,认为大数据分析只是那些拥有复杂业务流程和海量数据的大企业的事。市场研究机构麦肯锡的研究人员表示:“要创造新的重大价值,并不一定要采用复杂的大数据分析方法,有时只要能保证数据的可用性或对数据应用进行基本的分析,就能获得所需的重要价值。”

不同的企业或一个企业内部不同的部门对数据分析和数据价值的理解都不相同。企业处于不同的信息化发展阶段,也会设定不同的数据分析目标,采用不同的数据分析工具。正是基于此,戴尔率先提出了大数据成熟度模型。戴尔公司全球企业级解决方案副总裁Cheryl Cook表示:“这一模型已经得到了业内许多分析机构的认可。所有行业以及所有数据应用都适用于此模型。”

如下图所示,大数据成熟度模型分成五个阶段。第一个阶段,数据处于混乱状态,数据存储无章可循,数据难以访问,企业的信息系统处于高风险状态。第二个阶段,实现数据的保留。在这个阶段,企业被动地对数据进行存储。数据虽然经过一定的处理,但还不具有高质量,数据的访问也会受到一定限制。第三个阶段,实现存储的优化。在这个阶段,通过对存储系统的进一步优化以及基于策略的控制与管理,用户可以逐步发现数据的价值。第四个阶段,实现简单的分析。在存储优化的基础上,用户可以进行数据建模和简单的数据分析,对归档数据进行搜索等。第五个阶段,实现复杂的分析。在这个阶段,大数据分析工具将得到充分应用,用户可以进行比较复杂的建模、分析和决策。经过上述五个阶段,曾经杂乱无章的数据也将经历从数据到信息再到知识的转变过程,最终成为企业决策的重要依据。

这个大数据成熟度模型可以解答人们对于大数据应用的几个疑惑。第一,用户使用大数据分析工具,并不意味着一定要进行复杂的分析。举例来说,处于存储优化阶段的用户就可以实现无障碍的数据访问,并能获得所需的数据价值。第二,大数据的应用要经历一个逐步完善的过程,必须循序渐进,先做好数据存储和优化,然后再进行数据分析。第三,大数据解决方案通常包括两个部分:一是大数据保留解决方案,二是大数据分析解决方案。将两类解决方案有机地结合在一起,才能有效降低大数据分析应用的成本,更好地挖掘数据的价值。Cheryl Cook表示,戴尔可以提供上述两种解决方案。一方面,戴尔可以提供针对结构化和非结构化数据的大数据保留解决方案,主要包括存储虚拟化与整合、应用程序优化、数据保护、灾难恢复以及数据保留与管理解决方案;另一方面,戴尔还能提供支持Hadoop、Cloudera等开源软件的大数据分析解决方案。

记者曾与包括大庆油田、太平洋保险公司等在内的一些用户进行过交流。它们目前都没有计划部署大数据应用。“从全球范围来看,大数据应用还处于起步阶段。”戴尔亚太及日本地区商用事业部企业解决方案副总裁Philip A. Davis表示,“与云计算兴起时一样,可能要经过两三年的市场培育,用户才能逐渐接受大数据应用。”

中国东方航空股份有限公司信息部总经理严振红介绍说:“在大数据的概念出现以前,我们就在做客户数据、经营数据的分析工作。但是客户数据库、经营数据库等都是相互独立的,数据不能共享。现在,我们要做的是将这些系统的数据整合起来,统一进行分析。”

Hadoop不是万能的

简单来说,Hadoop是一个能够对大量数据进行分布式处理的软件框架。Hadoop最独特的优势在于为用户提供了一个分布式的、高容错的文件系统和加速数据处理的办法。随着Web 2.0、社交网站的大规模兴起,人们需要一个高效的处理非结构化数据的平台。Hadoop正好可以满足人们的需求。有些人甚至在Hadoop和大数据之间划上了等号。Hadoop能够解决大数据应用的所有难题吗?

“Hadoop是一个复杂的工具套件。如果没有厂商或专业技术人员的帮助,用户自己部署Hadoop是一件十分困难的事。目前,Hadoop的应用并不普及。互联网用户是最早采用Hadoop平台的。”Philip A.Davis表示,“如果想让大数据解决方案充分发挥其作用,就必须搭建一个高效的信息基础架构,实现信息基础架构的自动化、智能化,同时提高其可管理性。”

Hadoop的应用是有一定技术门槛的。如今,许多IT厂商都推出了基于Hadoop的解决方案包,其目的是帮助用户简化Hadoop的部署与应用。Philip A.Davis表示:“戴尔提供的基于Hadoop的大数据分析方案可以将Hadoop的部署周期从原来的两个月缩短至两天。”

VMware全球高级副总裁范承工也认为,由于缺少精通Hadoop技术的专业人才,Hadoop的部署对于用户来说是一件费时费力的事。如今,VMware可以将Hadoop部署在虚拟化架构之上,将部署工作从半自动化变为全自动化,从而减少了人工干预,使得Hadoop的部署变得更加简单,也不容易出错。

“很多中国企业的CIO认为,大数据解决方案是有价值的,但实施起来确实有许多困难。”戴尔全球副总裁、中国区大型企业及公共事业部总经理容永康举例说,“国内懂得在Hadoop上进行开发的专业技术人员非常少。一些金融行业的用户很想现在就部署大数据解决方案,但是苦于找不到既懂Hadoop技术,又懂得金融业务的专业人才。”

Informatica首席技术官James Markarian表示:“在IT环境中,Hadoop不可能作为一个孤岛存在。为了让Hadoop跨越不同平台,用户需要将Hadoop作为其IT大环境中的一部分来管理,并通过Hadoop重复使用他们的开发技巧、资产及数据,同时还要统筹管理全部数据。”

在美国市场上,70%的大数据应用处理的还是结构化的数据。从技术的角度看,虽然Hadoop也能处理结构化的数据,但是目前基于Hadoop的大数据分析解决方案主要还是用于处理非结构化的数据。因此,用户处理结构化数据和非结构化数据通常是用两套不同的分析工具。这种混合的大数据处理模式是一种普遍现象。

从未来的发展看,非结构化数据的快速增长是大数据分析的主要驱动因素。从这个角度讲,Hadoop的应用前景还是十分广阔的。

大数据不仅仅是一个解决方案

数据分析解决方案范文2

随着全球气候日趋变暖和能源日趋紧张、能源成本不断上涨,企业中的高能耗部门之一 ―数据中心正面临着降低能耗、提高资源利用率、节约成本的严峻挑战,构建节能型的数据中心受到越来越多的数据中心管理人员和IT厂商的关注,并成为未来数据中心的必然发展趋势。根据IDC的估算,在企业数据中心里,存储设备的电力消耗约占整个数据中心的37%~40%,而数据却正以52%的复合年均增长率不断攀升。当多数企业及大中型机构面对呈指数型快速增长的数据量时,它们必须对如何构建环保型、节能型的数据中心予以考虑和足够的重视,企业需要采取的是一个经济高效、环保并且对社会负责的方式,建立一个绿色的数据中心成为今后必然的选择。

IDC指出,从运行成本控制的角度看,在IT行业中,能源消耗成本已经达到其硬件采购成本的25%。电力系统消耗成本和冷却系统消耗成本的迅速增加,使用户在采购存储设备时将首选绿色存储解决方案。目前在国际上,建立绿色数据中心正得到越来越多的重视。在欧洲,对于自身碳排放量、不断上涨的能源成本以及能源附加费的征收可能性给予了极大关注。在美国,公众法109-431现已正式生效,其目标是在美国研究并推广节能型计算机服务器的使用。该法令反映了人们环保意识正在日益提高,它声明:“为了美国的最高利益,在购买计算机服务器时,采购方应将节能特性作为评定服务器性价比的首要因素之一。”

毫无疑问,构建绿色数据中心以及绿色存储系统也正在被中国用户关注。据一些存储厂商介绍,近来在企业用户的项目招标中,已经有用户要求厂商所提供的产品必须符合ROSE(环境状况报告),这说明环保意识正在深入人心,并开始在IT设备采购中成为考察因素之一。相信随着绿色观念的不断加强和被重视,相关的绿色规范和标准也会随之出台,而实现节能和降耗的绿色技术也会最终成为IT存储设备的通用特性和基本配置。

近年来,一些厂商不断致力于绿色存储技术和产品的研发,尤其是今年以来,许多存储厂商都相继推出了包括存储硬件和存储软件在内的节能、环保型的存储解决方案,比如降低能耗、减少散热量、使用更少的容量存储更多的数据、减小存储设备的占用空间等,用绿色存储构建绿色数据中心已经成为存储业界一个新的热点话题。为了使数据中心和企业用户能够充分认识到构建绿色数据中心、实施绿色存储方案的重要性,并帮助数据中心的企业用户选择适合的解决方案,计算机世界》报社近期开展了“构建绿色数据中心”的大型系列活动,其中一项重要的内容就是《计算机世界》方案评估中心与《网络存储》杂志联合进行的绿色存储解决方案评析活动,我们对所征集到的绿色存储解决方案,邀请业内知名专家进行了认真的分析和点评,并向读者隆重推荐7个绿色存储解决方案。通过此项活动,我们希望让更多的行业用户对绿色存储和绿色数据中心的应用趋势、需求要点、实施技巧等有更加深入的了解,从不同的角度、不同的应用层面,对绿色存储的实现方式及技术手段进行深入分析和比较,为国内企业实施数据保护提供有效的借鉴。

本次绿色存储方案的征集和评析活动得到了存储厂商的大力支持,我们表示衷心地感谢。参加的厂商中既有存储业界享有盛誉的著名厂商,也有国内读者不太熟悉的存储厂商,但它们所提供的解决方案都在不同程度上为数据中心和企业用户提供了构建绿色存储系统的方案选择,不同的技术、不同的产品、不同的实现方式,但最终都是为了一个“绿”字。

对于这次绿色存储方案的评析,我们要特别感谢由存储技术专家和行业应用专家组成的评析专家组,他们都是业内的知名专家,在百忙之中对所征集到的方案进行了逐个的认真分析和点评,并写出了精彩的点评意见,同时阐述了对绿色存储的独到的见解和观点。

由于版面所限,本次推荐方案在刊登时都做了不同程度的删节,感兴趣的读者可登录本报发起的“中国IT绿色行动”官方网站(省略/GreenIT)浏览全文。

《计算机世界》方案评估中心

推荐绿色存储解决方案

博科通讯系统公司

博科减少设备数量的绿色存储方案

COPAN Systems公司

COPAN应用MAID技术的绿色方案

美国EMC公司

EMC大型数据中心节能降耗方案

日立数据系统有限公司(HDS)

HDS始于存储整合的绿色方案

惠普公司

惠普全面绿化存储解决方案

美国NetApp技术有限公司

NetApp从源头上节能的解决方案

Nexsan公司

数据分析解决方案范文3

关键词:海量数据存储;分布式数据库;MPP架构;并行处理

目前海量数据处理还是一个比较新的研究方向,大多数都是各公司或者是组织各自研究自己的处理方法,国际上没有通用的标准,研究的方式和结果也都是各有千秋。针对项目中带有复杂业务逻辑的海量数据存储,主要从容量扩展和并行处理两个方面考虑。前文己论述过NoSQL分布式数据库由于其数据结构简单、不善于做JOIN连接等复杂操作,存在数据迁移问题,并不适用于本项目,所以本解决方案依旧从关系型数据库入手。其次为了支持多样的切分策略,本论文将实现range、list、consis

tent-hash模式。最后系统借鉴MPP并行处理架构,使得整个项目能部署在便宜的PC集群上,不仅能保证稳定性,还节省项目成本。

物理设施包含数据库服务器的基础架构、web服务器的选择,以及资源分配管理服务器的选择。这三者分别负责数据的存取、数据的分析处理以及资源工作的均衡分配,它们协同合作,共同搭建一个高效的协同的后端服务管理,使存储系统均衡工作、高效运行。

作为解决海量数据的存储方案,首要必须考虑是存放海量数据的需求。根据前文可知,分布式数据库的出现其根本原因是解决存放不下数据的问题,故而将数据依照策略存放在不同的数据库服务器上,存放数据的策略以及数据之间的并行查询处理是研究的重点。第二个问题是分布式处理方案,现有技术从各个方面进行过尝试,有的基于关系型数据库提出了多种shard

ing方案。将关系型数据库迁移到非关系型数据库上代价太大,所以本解决方案基于关系型数据库的系统。

根据以上的设计思路与实现目标,设计出分布式海量数据存储解决方案。该系统主要包含以下四个模块:

SQL解析模块。SQL语句复杂、格式多样、形式多变,解析结果作为数据切分的依据。解析SQL语句的方法是编译成字节码,生成语法树,这种方式的优点是准确率高、数据层次清晰、结构正确,但设计到相关语法树知识,比解析字符串更难以理解。

数据分发模块。如果集群系统中没有进行数据切分,则多台数据库服务器存储的是完全一样的数据,这实际上是对硬件资源的浪费,也在同步数据保持一致上浪费了更多的时间和效能。而且一旦数据再上升一个等级,很可能一台服务器就无法存储下大量数据。所以合适的数据切分策略是迟早的,本解决方案将结合现有的数据切分策略,结合业务逻辑,提供多样的切分策略,并且预留切分接口使用户灵活地自定义自实现,系统的可用性更高。

并行处理模块。由分发服务器和多台数据库服务器构成。相对于集中式数据库来说,分布式询代价需要考虑以下因素:

CPU处理时间,I/O消耗时间,还有数据在网络上的传输时间。在设计系统的时候,应该根据分布式数据库中各个数据库的地理位置的不同情况来设计。在局域网且传输率高的系统中,通信代价和局部处理的开销差别不大,在优化中则应平等对待;在数据传输率较低和通信网速度较慢的系统中,网络传输可能会比花费在查询中的CPU及I/O的开销更大,则应首要考虑优化网络通信。

汇总处理块。结果汇总大致分为两种情况:单机单库情况下,直接返回结果;多机多库的情况则需要在转发节点处进行一个汇总。

基于架构的工作流程大致如下:首先,转发节点收到客户端发来的SQL语句,将依据各个解析节点当前工作量、预计完成解析工作的时间、本条查询语句预估需要时间、历史响应需求时间等因素,将SQL语句转发给各个解析节点,对其进行语法解析。当所有的工作量都经过这个转发节点的时候,必然会产生高并发的问题。在存在多个分发节点的情形下,为了消除单个转发节点的性能瓶颈,本文设计多个分发节点,每个节点都可以将任务转发到不同的解析节点。采用RoundRobin策略将任务依次分发给每个解析节点,让工作量保持均衡。其次,解析节点解析本次查询的SQL语句,生成便于理解的SQL对象,通过调用相应的接口方法可以实现对SQL语句的操作。最后,各个数据库服务器执行了 SQL语句,便对查询结果进行一个汇总并返回,划分倘若是单机查询,那么处理的结果可直接返回给客户端。

SQL解析、数据切分以及转发归并的工作都由以上四个模块协同完成。

基于MPP架构的设计了关系型数据库的海量数据分布式存储解决方案。本章采用解析SQL语句、分发SQL语句,并行处理、归并汇总处理结果的方式完成整个框架。与MySQL

Cluster的区别在于采用的存储引擎就是MySQL,适应于本身就用MySQL进行存储的集中式数据库的改造,或是业务逻辑复杂的报表展示等,无论是业务的扩展,迁移都十分方便。

参考文献:

数据分析解决方案范文4

关键词:数据挖掘;推理研究;公共工程决策

中图分类号:F27文献标识码:A

一、公共工程及决策中存在的问题

公共工程是政府为了公共利益直接或间接投资形成的基础性建设项目和社会公益建设项目,主要包括:交通、邮电、水利水电煤气等公共基础设施和科教、医疗卫生、体育场馆、文化娱乐等社会性基础设施。因此,公共工程存在投资大、建设周期长、不确定性因素多因而风险高、宏观效益和社会效益突出等特点。

改革开放以来,我国各方面的建设都取得了举世瞩目的成就。三峡大坝水利工程、青藏铁路、北京奥运场馆、载人宇宙航天项目等项目的实施为我国物质文明和精神文明建设的提高起到了巨大的推动作用,但要巩固和实现可持续发展战略,国家和企业有责任也有必要继续加大对公共基础设施建设的关注和投入。与此同时,我们还应看到,诸类大型公共工程的建设大多仍然处于初期运营阶段,其是否能够达到预期的效果仍是个未知数。另外,工程中存在诸如超预算、超工期、设计过于标新立异与周围环境不相协调、项目没有经过充分的可行性论证便草草上马等诸多问题,使得项目频繁变更,沟通和索赔方面的成本费用增加,导致效率极其低下,最终影响到项目建设的成果。分析其原因,突出表现为对公共工程项目决策的短视行为,也就是政府官员的短期任职制与公共项目的长期运作不合拍。此外,政府公共项目决策标准单一、决策程序不完善、决策缺乏约束等都是不容忽视的原因。但归根结底还是决策者对项目前期决策阶段没有清醒充分的认识。在我国,工程决策很大程度上取决于决策者的知识水平、背景、经验以及性格,人的非理性因素决定了决策的感,调查研究趋于形式化,并没有或很少考虑参与、透明、民主的原则。因此,需要新的方式来提高公共工程决策的科学性和效率。

现有的工程管理系统能够对数据进行收集、储存、传输和简单分析,并为项目决策人员提供实时动态、进展报告,最终为其决策和反馈服务。但该类系统缺乏对工程数据进行深入分析和综合利用的能力,前瞻性较差,决策很大程度上还是依赖管理决策者的经验和直觉。随着工程项目日益庞大、复杂,管理难度的加大,使得现有的管理手段和工具已无法满足现代工程决策的需要。因此,研究和开发新方法来解决公共工程决策问题是工程实践的当务之急。本文在已有研究的基础上,通过数据挖掘(DM)和基于案例推理(CBR)的结合,探讨该平台在公共工程决策机制中的应用。(图1)

二、数据挖掘(DM)

(一)DM概念及阶段划分。数据挖掘是一种在大型数据库中寻找你感兴趣的或有价值的信息的过程,根据Berry and Linoff的说法:分析报告给你后见之明,统计分析给你先机,数据挖掘给你洞察力。可见,数据挖掘的影响力和价值。它是一门结合了数据库、人工智能、数理统计、信息检索、知识获取、模式识别、数据可视化等的科学,该技术已经在许多领域得到发展和应用,如商业、银行、保险、网站开发和生物信息等领域。

Berry and Linoff将一个通用的数据挖掘过程定义成了不同的阶段。在利用数据挖掘技术之前,工程管理决策人员需要明确工程项目的目标和要求,在此基础上,广泛的搜集相关数据和信息。下面就数据挖掘在银行和商业中的应用做简要描述:首先,对潜在目标客户进行分类,也就是说将办理相同储蓄或者贷款的客户分为一组,分析其消费习惯和偏好,通过应运数据处理转换和人工智能等技术有助于识别主要核心客户组,对其制定相应特色服务;同时对潜在的可能流失的客户进行跟踪分析行为特点,避免流失过多。然后,对客户感兴趣的负债和收入等数据指标进行统计,对贷款偿还可能存在风险的各因素进行识别,以确定并维护客户信用等级和规避风险。最后,通过大量客户的交易信息找出已有数据库中隐藏的关系网,并对新加入客户的收入水平、消费习惯、居住区域、文化程度以及购物类别等指标挖掘分析,进而不断的丰富数据库资源。这样银行作为客户和商品厂商的纽带,在掌握消费者需求的基础上,可以更好地为客户服务。

(二)DM主要分析方法。数据挖掘的主要分析方法包括:关联分析、聚类分析、分类、预测、时序模型、偏差模型。下面就各种分析方法及其在公共工程中的应用做简要叙述:

1、关联分析:找出数据库中隐藏的关系网。它分为简单关系、因果关系和时序关系。一般情况下,工程项目成功的标准是按时完工、节约成本、客户满意等。与传统工程项目不同的是,公共工程项目有社会效益大、生命周期长、后期影响较大等的特点,其评判标准不一。实际中,存在超预算、超工期并且在当时备受争议的项目,建成后不仅取得了成功有的还成为国家和时代的标志。这就需要分析背后成功的原因,是必然造成的还是偶然造成的,对其进行详细记录和说明。最终完善公共工程项目成功的标准以及这些标准对工程项目的影响程度。当新项目遇到类似争议时,通过关联分析比较研究后,可以提高决策的科学性。

2、聚类关系:对记录分组,把相似的记录归在一个剧集里。它和分类的区别是聚类不依赖预先定义好的类,不需要训练集。这里用Davies-Bouldin index来评判集群分离质量:DB(U)=,其中(Xk)表示聚类Xk内部网的距离,(X,X)定义为聚类X和X的距离,c为U的组成部分的聚类数量。一般来说,值越小对应的聚类效果越好。

3、分类:找出一个类别的概念描述,代表这类数据的整体信息,一般用规则或决策树模式表示。在公共工程中,我们可以将其影响因素分为:目标层、准则层和方案层。目标层是寻求影响公共决策的主要因素,准则层影响因素的各个指标,比如决策的科学性、决策的可操作性、决策的效率和决策的稳定性等,方案层为影响公共工程决策的具体因素,包括:社会效益、经济效益、技术条件、人员素质和管理水平、国家和区域政治经济状况和筹资能力等。另外,我们还可以将项目实施期间国家的经济状况分为:过度膨胀、稳定增长、略微下滑和严重紧缩,以应对不同时期项目该采取的措施。

4、预测:利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类和特征进行预测。众所周知,对于大型公共工程来说,项目的投资方为国家或各级政府,而他们的资金和管理水平是有限的,这就需要结合社会其他各方的资源。现在常见的融资方式有:BOT、TOT、PPP、PFI和ABS等。具体选择哪种形式的融资方式或组织形式需要对比类似成功项目,结合新工程项目的特点,选择出具有可行性和可操作性强的模式。

5、时序模型:通过时间序列搜索出重复发生概率较高的模式。对于公共工程项目而言,其建设周期长,并且部分项目展现的是我国的时代特征和精神风貌,我们需要更多地关注经济发展周期和房地产市场运行周期,避免毫无目的地扎堆重复建设。例如,奥运会的举办是个复杂的系统工程,但如果能够对其经济周期各阶段(申办、筹办、举办和后期运营)所要完成的任务进行研究,才能达到事半功倍的效果。另外,对公路、桥梁和大型体育设施中出现的维修、改建、扩建情况进行追踪记录,这样有助于合理安排资源和减少资源的浪费。

6、偏差模型:发现或排除数据库中数据存在的异常情况。一方面如果数据库中存在大量异常情况的案例,那必将影响到整个样本的可信度;另一方面特殊情况下工程项目也必然会导致异常数据结果。例如,在公共工程项目中,涉及投资额巨大,如果投资方不能按时发放进度款,将会影响工期的进度计划;再如,如果项目所在区域发生各种不可预测的地质条件或气候的变化(地震、干旱),也必将影响项目的整体运行。因此,要对这部分数据进行分析处理,如实反映项目情况的应保留,否则排除。

(三)DM数据分析工具。当应用数据挖掘的分析方法来解决工程项目中的实际问题时,各种分析方式是建立在相应的数据分析工具的基础之上的。数据挖掘技术中包含了一些用于分析历史数据的分析工具,主要有决策树工具、贝叶斯分类工具、神经网络工具以及基于案例推理工具。尽管所有这些工具能够用于分类或者预测,但每个工具只有在某种特定的条件环境下才能正确地执行。例如,决策树和贝叶斯工具不能用于支持预测,而神经网络和案例推理工具能同时支持分类和预测功能;决策树和神经网络工具只需要在第一次使用时建立模型,而贝叶斯和案例推理工具在遇到一个新的案例时重新建立模型。

在公共工程项目中,这些工具可以帮助参与人员分析数据并使得决策更有效率,同时更重要的是,它对于潜在的问题更具有洞察力。它能够提供如下问题的解决方法:①项目应该选择一种什么样的结构形式?②项目适合的组织形式和融资方式?③投资额多大,工期多长?④项目中可能遇到的风险有哪些?可以采取的应对措施包括哪些?

三、基于案例推理(CBR)

基于案例的推理是为决策者提供充分利用经验、具体问题的情况和公共工程案例的专门知识,案例可以是具体的经历或者相似案例的集合。根据Aamodt and Plaza,CBR方法的中心任务是明确当前情况,寻找与新项目类似的已完成工程项目,利用该项目来寻求对新问题的解决办法、评估建议的解决办法以及通过对新项目经验的总结来更新系统。大体上一个CBR周期可分为以下四个阶段:检索与目标项目最匹配的案例;重新利用信息和知识用于新项目;修改建议的解决办法;保留案例用于解决今后问题。而检索又包括:条件分析、初步匹配和最终确定三个阶段。

(一)案例检索阶段。主要任务是应用检索工具通过比较新工程项目与历史记录的案例进行相似度的比较,如果它们之间的相似度值大于预定于的阈值,那么历史案例将被选择作为参照。因此,计算相似度就成为本阶段的关键步骤。应用这样一个工具,每个输入的参数都会被赋予相应的权重,权重的大小由专家根据参数间的两两比较分析得出,相似度可以用下面的表达式计算:

Similarity(N,O)=×100%(1)

其中,N和O分别代表新旧工程项目,n表示输入值的数量,N和O为它们各自区间的值,w则是所对应权重,f是N和O所对应的域i的函数。

对于逐项描述性参数,当相比较的案例参数具有相同的值时,相似度函数输出1,否则返回0。对于清单型参数,返回值由下面的表达式计算:

f(N,O)=(2)

其中,f(N,O)表示相似度,N∩O指在N和Oi域中由子值所构成的一个新的清单型数值,而Count(X)是X域子值的数量。

(二)案例使用阶段。用以往的解决方法来处理新工程项目的问题,通过分析历史案例的情况,借鉴其经验教训来指导本阶段的决策。

(三)案例修订阶段。调整匹配案例的解决方案来寻求问题的新解决途径。并对新的工程项目决策的质量做出评估,并及时反馈。解决方案得出的是一个清单型参数,它是由一个或者多个子值构成。可以通过下面的公式来计算出匹配案例中解决方案的值:

Score(v)=(3)

v表示一个子值,Score(v)则是v的得分,k是匹配案例的数量,O是匹配项目之一,而g(v,O)是一个判断函数,当v包含了O的一个解决方案的时候返回值1,否则返回值0。

(四)案例保留阶段。当新的工程项目被验证通过之后,它将被加入数据库中。通过这个过程可以丰富数据库资源并进一步改进系统。

四、结论

我国公共工程决策一直以来都存在诸多问题,这也迫使有关人员不断探索一套解决其问题的有效方法。数据挖掘是能够从历史数据中获取有用信息并辅助决策者进行决策的强大工具。同时,通过DM-CBR的结合可以帮助参与决策人员简化数据的利用和分析过程,以提高公共工程决策的效率。本文阐述了DM与CBR结合的理论框架,也就它们如何提高公共工程决策进行了说明。尽管本文把焦点集中于DM在公共工程决策中的运用,但更为重要的是它为其他建筑领域的研究提供了新的研究方向,如风险分析、可行性研究、人力资源研究以及价值工程等领域。

(作者单位:重庆大学建设管理与房地产学院)

主要参考文献:

数据分析解决方案范文5

2013年,惠普了大数据解决方案平台HAVEn,这是一个能够处理所有数据类型,能够实时分析且安全的开放架构。目前,该平台在国内外的金融、电信、能源、互联网等行业中已经拥有了许多成功应用。惠普中国区副总裁、软件集团大中华区总经理于志伟表示,HAVEn的推出标志着惠普已经脱离了初始的数据汇集的阶段,步入了大数据应用的新阶段。

行业、能力、人才

于志伟认为,目前中国的大数据应用还处于起步阶段,而且由于行业需求、区域和人才储备等情况的差异,造成了大数据应用水平参差不齐的现象。在某些行业,用户对大数据的需求是十分迫切的,但是相当多的用户仍纠结于数据量“大”这个问题,还没有考虑结构化、半结构化和非结构化等不同类型的数据应该如何处理。

国外的大数据应用水平已经达到很高的程度。举例来说,在美国,一个区域内的所有医院的信息都会被搜集起来用于分析,据此可预测某种疾病的死亡率。“国外的大数据应用已经走入行业,可以挖掘出行业中真正有价值的东西。虽然国内的大数据应用还停留在初始阶段,但在某些行业,比如互联网,其大数据应用的复杂程度比国外更甚,发展水平也较高。”于志伟向记者表示。

大数据的应用要经历一个过程,不同的行业对大数据应用的需求是不同的。于志伟表示,企业在实施大数据应用时应注意以下几个问题:第一,注重大数据的行业应用价值;第二,企业要不断提升自身的能力去获得想要的信息;第三,大数据人才非常重要。“目前,我国大数据行业面临着人才严重匮乏的局面,从数据模型专家到通晓行业应用的复合型大数据人才都十分短缺,这会影响大数据应用的发展速度。”于志伟表示。

HAVEn是一种方向

今天,产品集成并不是难事,那么HAVEn是不是简单地将相关产品攒到了一起呢?于志伟澄清说,从HAVEn本身的标准架构来看,H代表Hadoop,表明HAVEn是一种分布式的架构,能够支持各种类型的数据,而且存储成本非常低廉;A代表Autonomy,表明HAVEn可以高效地处理非结构化信息,特别是机器语言;V代表Vertica,表明HAVEn可以实时处理和分析大量信息;E代表Enterprise Security,主要针对半结构化数据的处理;n代表的是各种在大数据平台上开发的应用。

HAVEn是一个平台,它可以处理所有类型的信息,而且能做到实时分析,同时具有安全性。那么,HAVEn能不能代表未来大数据方案的发展方向?于志伟并没有正面回答记者的问题,而是举了一个例子,全球最大的社交媒体公司,之前采用Hadoop架构对信息进行处理。但是在半年前,它们采购了Vertica。很多人认为,Hadoop代表了大数据主流的发展方向,那么这家企业为什么会转而选择Vertica呢?最主要的原因是,Vertica可以实现实时分析。对于以广告收入为主要来源的这家企业来说,实时推送精准的广告是至关重要的,而Vertica可以实现。这家企业用Hadoop处理非实时的数据业务,而用Vertica进行实时的业务分析。虽然相比Hadoop,Vertica的采购价格略贵,但这家企业还是一次性采购了20PB。还有一家美国的知名电信公司,一次性采购了25PB的 Vertica解决方案,用于4G业务。

“我们不去争论HAVEn是不是业界最先进的产品,但是综合上述这些已经使用了HAVEn的代表性企业的实践,HAVEn代表了一种发展方向。”于志伟分析说,“Hadoop将来会不会更全面,也能实时处理信息?有这种可能性,但需要时间。三年或五年以后,什么都可能发生,一种新技术甚至会消失。事实证明,我们的大数据平台能够解决用户的问题,而且很多用户都在使用。”

在中国,也有用户在使用HAVEn,比如一个运营商使用HAVEn中的Vertica,分析用户的上网行为,每天分析的记录达到几十亿条。以前,这样的分析工作很难在一天之内完成,而使用Vertica,分析速度提高了60倍。另外,国内某知名能源公司采用HAVEn中的Autonomy,支持其信息共享平台。

于志伟认为,HAVEn还只是一个大数据平台,而用户购买的是应用。因此从这个角度说,惠普提供的解决方案还不够全面。HAVEn中为什么会有一个“n”,就是表明惠普要在大数据领域开发更多的应用。惠普与全球最大的几家咨询公司合作,并在亚太和中国市场上寻找类似的合作伙伴。“行业解决方案是有区域性特征的,不可能直接照搬国外的。在一些垂直细分领域,我们一方面自己开发,另一方面也和合作伙伴共同开发解决方案。”于志伟补充说,“我们与政府合办的IT培训基地也把大数据当作一个重点。中国极缺大数据人才,我们从现在开始就要培养。这些人才今后可以为我们的合作伙伴所用,有利于我们共同构建一个良好的大数据生态体系。”

树立行业样板

记者在采访很多用户时,他们都表示已经认识到了大数据、云计算的重要性和可能给企业带来的收益。但是认识与接受是两回事,目前真正将大数据、云计算用于业务并取得显著经济利益的用户毕竟是少数。大数据是当前用户最迫切需要的、关系企业成败的技术,还是只是起到了锦上添花的作用?

于志伟对于大数据的前景十分乐观:“目前在客户中,真正使用大数据的比例可能低于5%,但即使是这5%已经是巨大的客户量,而且这5%的企业都是超大型的企业和最需要大数据的企业。惠普一定是先与这些企业合作,树立大数据的应用标杆,然后再引导更多的企业加入。惠普目前在做的人才教育和培养工作,也是为了更好地普及大数据应用。我们不确定大数据市场何时会井喷,但我们会一直持续地给用户和市场更多方案、经验和信心。”

大数据的一个典型特征就是实时处理和分析,能够实现实时处理的解决方案价格相对昂贵,而客户往往追求的是高性比的解决方案。那么,价格会不会是阻碍大数据普及的一个因素呢?Vertica是实时分析工具的一个代表,它的价格是普通企业用户能接受的吗?“相对于Hadoop大数据方案来说,Vertica的成本高相对高一些。”于志伟并不讳言,“Vertica运行于开放的硬件平台架构之上,不管是惠普自己的硬件还是第三方的硬件,即使在低端的x86平台上也可以良好运行。我们可以为用户提供灵活的选择,既能提供Vertica软件,也可以提供软件与硬件组成的整体解决方案,包括一体机。无论从整体拥有成本,还是灵活性的角度来分析,相比市场上的其他一体机或大数据解决方案,Vertica大数据解决方案还是非常有竞争力的。”

链接

惠普中国软件集团的四件大事

2014年,惠普软件的整体战略相较去年不会有太大变化。于志伟表示,惠普软件在今年将主要做好以下四件事。

第一,在大数据、云计算方面继续加强与政府的合作,同时抓好人才培养工作。

第二,在大数据、云计算、移动应用等领域,寻找并树立更多的成功用户样板,吸引更多新客户。

数据分析解决方案范文6

[关键词] 投资分析 层次-价值分析法 投资决策

一、前言

项目投资分析方法有很多,如量本利法、回收期法、净现值法、等值年金法等。每一种决策方法都是对备选方案进行财务分析,得到相关财务数据,从财务角度显示备选方案的利弊得失及其成本、效益的优劣。但作为现代项目投资管理,还应考虑项目内外环境因素,如完整性、可靠性、适应性、敏捷性、先进性等诸多综合评价因素。显然,项目投资决策仅仅考虑财务经济指标有失偏颇,特别是对于供应链管理某一结点上的投资决策,常常应考查整个供应链的总体效益,若只考虑投资项目的财务经济指标,则不符合系统的“项目森林”原理,导致决策失误。现代项目投资管理不仅要考虑财务经济效益,而且要考虑项目内外环境因素等诸多综合评价因素。目前一些学者运用了价值分析法进行投资分析,取得了一定的效果,可这种方法不能解决各评价因素因隶属不同层次,其重要性不能两两比较而导致评判值不准确的问题。但这正是层次―价值分析法所要解决的问题。

二、层次――价值分析法的基本原理

如前所述,现代项目投资管理既要评价财务经济指标,又要评价项目内外环境因素。由于各种评价因素所处的层次不同,相对项目的重要性有差异,即重要性权数不同,且不同的投资决策方案对各评价因素的满足程度不同,因而,在对投资决策进行综合评价时,若单一将两个备选方案的指标一一对比,很难比较出方案的优劣,还应结合评价因素的重要性和满足度来评判。

为了解决这个问题,首先利用层次分析法,把项目投资决策各评价因素的隶属关系由高到低排列成若干层次,建立不同层次评价因素之间的相互关系,即层次结构模型,从而考察项目的结构和功能。并用排序理论求出各评价因素的重要性权数,然后进行价值分析。进行价值分析时,先将每一评价因素与备选方案进行比较,分析备选方案对于该评价因素的满足程度,求出每一评价因素相对于比较方案的满足系数,最后将满足系数与层次分析所得到的重要性权数相乘,求得每一评价因素的价值,再对每一评价因素的价值求和,就得到了某一项目投资决策方案的系统评价值。

该分析法采用1~9及其倒数的标度法构造判断矩阵,用环比法求重要性权数和满足程度,舍去了用烦琐的数学方法求矩阵的特征根、特征向量、一致性检验等步骤,得出的结果客观、明了,计算方法简单,在实际工作中具有很强的可操作性。

三、层次―价值分析过程

1.建立层次结构模型

层次――价值分析的层次结构模型为金字塔型。

第一层为层次――价值分析的评价目标;

第二层的评价因素集合为:

P={P1,P2,P3,…Pn},可以描述为P={P1(完整性),P2(可靠性),P3(适应性),…Pn(经济性)}

第三层的评价因素是针对上一层中某一评价因素进行分层,集合为:

Pn={Pn1,Pn2,Pn3,…Pni} 其中 i=1,2,3, …

第m层的评价因素是针对上一层中某一评价因素进行分层,集合为:

Pni…i ={Pni…i1,Pni…i2,Pni…i3,…Pni…ij} 其中 i…i有m-2个,j=1,2,3, …

根据上述评价因素集合,分出一级指标、二级指标,建立层次模型:

图1 层次结构模型

2.构造判断矩阵

根据上面建立的层次模型结构,由上往下构造,某一层针对上一层的某评价因素分层的所有评价因素为一个。第一层有一个判断矩阵,第二层有n个。将所有的判断矩阵列出来后,采用1-9及其倒数的标度方法对矩阵进行标度。标度的确定方法有二:一是根据有关的行业参数确定;二是根据对有关专家、财务人员及投资分析人员对各因素相对重要性的不同认识进行统计而定。

构造第二子目标层判断矩阵,以同为第二层的评价因素排成横排和竖排,分别两两对比,如第一横排P1相对P1的重要程度为1,则P1相对P2的重要程度为P2的一半,相对P3的重要程度为P3的三分之一,以此类推得出矩阵的标度。然后求重要性权数:取任一列的标度相加求得标度和,再将P1―Pn构造判断矩阵对应的标度除以标度和,即为重要性权数。

构造第三层及以下判断矩阵,标度方法和重要性权数的计算方法与第二子目标层的方法相同。但在第三层以下判断矩阵中还需计算判断因素的总权数,计算总权数的方法是用该判断因素的重要性权数乘以对应的上一层的某一评价因素的重要性权数。

四、计算各因素对比较方案的满足系数Sij

采用环比评分法确定各因素对比较方案的满足系数Sij。具体方法是:(1)由上而下,将相邻比较方案对于评价因素的满足程度进行评判,将评判结果作为暂定满足系数;(2)对暂定满足系数进行修正。设最后一个方案的修正满足系数为1,该系数乘上相对于上一方案的暂定满足系数,得到上一方案的修正满足系数;(3)将两个方案的修正满足系数的和除各方案的修正满足系数,结果为满足系数Sij。

例如,对于某评价因素――机械化性能,有两个备选方案。方案一满足机械化性能的程度是方案二的1.5倍,则方案一的暂定满足系数为1.5,方案二的暂定满足系数为空;设方案二的修正系数为1.0,1.0乘上1.5得到方案一的修正系数为1.5,二者相加得修正满足系数和2.5;将1.5除以2.5得方案一的满足系数为0.6,将1.0除以2.5求得方案二的满足系数为0.4。

五、价值评判

利用以上的重要性权数和满足系数,即可确定对比方案的价值,计算公式为:

Vi=∑Wj Sij i=1,2,…(对比方案数) j=1,2,…(评价因素数)

式中:Wj是第j个评价因素的重要性权数;

Sij 是第i个方案对第j个评价因素的满足系数。

根据以上公式,计算出对比方案的评价值,比较所有对比方案的评价值大小,即可进行价值评判,价值大的方案为系统最优方案。

六、应用举例

1.建立层次结构模型

某物流中心需进行投资分析,现有两个对比方案。方案一建设有8个子系统,基本涵盖了物流系统功能所要求的子系统,自动化、机械化和普通仓库按1:2:3的比例修建;方案二建设6个子系统,自动化立体仓库改为普通仓库,削减了流通加工及包装系统,投资少。两方案的财务分析指标如下:

表1对比方案的财务分析指标表

若根据常用财务分析方法进行投资分析,很难比较出两方案的优劣。现采用层次―价值分析法进行优选。

由于两方案在货运场站功能、第三方物流服务功能、物流信息系统功能以及系统的完整性等许多方面存在差异,因此在进行投资分析时既要考虑这些因素,又要考虑财务收益问题。由于我国物流产业刚刚起步,极其缺乏该行业的准确统计数据和基准的市场效益等标准,在对矩阵进行标度时,只根据有关专家、财务人员及投资分析人员对各因素相对重要性的不同认识进行统计而确定标度值。

根据上述指导思想,从货运场站性能、第三方物流服务性能、物流信息性能、财务性能、系统完整性五个方面入手,设置5个二级指标,18个三级指标。

构建物流中心的评价指标层次结构模型(见下图)。

图2 某物流中心的层次结构模型

P1货运场站功能分解为机械化、自动化、可拆装化及适应性等四个三级评价因素。P2第三方物流服务性能分解为多样性、准时性、快速性、灵巧性等四个三级评价因素。P3物流信息功能分解为共享性、先进性、可靠性、维护升级可能性等四个三级评价因素。P4财务性能分解为投资回收期、投资额、内部收益率、净现值、效益成本比等五个三级评价因素。P5系统完整性主要考察系统是否完备了物流功能、是否协调统一,不再分解三级指标。

2.构造判断矩阵

根据有关专家及参与筹建物流中心的有关人员对各因素重要性的不同认识,采用1-9及其倒数的标度方法,构造判断矩阵。

(1)构造第二子目标层判断矩阵

以同为第二层的评价因素排成横排和竖排,分别两两对比,第一横排P1相对P1的重要程度为1,P1相对P2的重要程度为P2的一半,相对P3的重要程度为P3的三分之一,相对P4的重要程度为P4的三分之一,相对P5的重要程度为P5的二倍。依此类推得出判断矩阵。取P5列的标度相加求得标度和,再将P1―P5对应的标度除以标度和,即为重要性权数。

表2第二子目标的重要性权数判断矩阵

(2)构造第三层次对P1、P2、P3、P4的判断矩阵

第三层判断矩阵的标度方法和重要性权数的计算方法与第二目标层的方法相同。但在第三层次中还需计算判断因素的总权数,用该判断因素的重要性权数乘上对应的P1或P2或P3或P4的重要性权数,即可得出总权数。计算值见表3、表4、表5、表6。

3.确定各因素对两个比较方案的满足系数Sij

运用环比法,将每一个评价因素分别放到对比方案中计算对其方案的满足程度。对于具体数据的评价因素可以直接计算,对于没有具体数据的评价因素应根据有关专家及参与筹建物流中心的有关人员对方案的满足程度统计得到。具体计算结果见表7。

表7满足系数判断表

4.价值评判

利用以上的重要性权数和满足系数,即可计算两个对比方案的价值(具体见表8)。

表8对比方案价值评判表

根据层次―价值分析,方案一的评价值V1为0.57902,方案二的评价值V2为0.42098,结果表明方案一略优于方案二。因此,方案一为物流系统的最优方案。

参考文献:

[1]吕志良编译:经济决策分析[M].北京:机械工业出版社,1990.18~25

[2]杨青:投资评价[M].北京:中国经济出版社,2000.7~16

数据分析解决方案范文7

DSS(DecisionSupportSystem,决策支持系统)是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。它是管理信息系统(MIS)向更高一级发展而产生的先进信息管理系统。它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。是给某个特定的行业的领导层提供辅助决策的软件系统,主要是以管理学、运筹学、控制论和行为科学为基础,以计算机技术模拟技术和信息技术为手段,面对半结构化和非机构化的决策问题,支持决策活动的具有智能作用的人机系统。它能为决策者提供决策所需要的数据、信息和背景资料。帮助决策者明确决策的目标和进行问题的识别,建立或修改决策模型,提供各种备选方案,并对各种方案进行评价和选优,通过人机对话进行分析、比较和判断,为正确决策提供有益的帮助。

2、系统分析

1.海口房地产投资系统目标

房地产投资决策支持系统的作用主要在于为投资者提供项目内部和市场现状与变化预测的信息及其应采取的策略、方案和措施等。因此,海口房地产投资决策支持系统的目标,即系统要解决的问题主要在于:(1)借助过去和现时海口房地产业经营状况及其它相关资料和数据,通过科学方法,对项目目标市场的未来发展趋势进行分析和预测。(2)以过去和现时海口房地产开发投资资料和数据,采用有效方法,对项目开发投资的资金需求情况和开发周期等进行预测。(3)通过测算模型库,将海口房地产投资管理的成熟经验和方法融入系统,为项目开发投资的成本费用、运营能力、盈利能力和风险等提供固定和半固定的预测和分析。(4)充分利用计算机的强大数据处理能力,为某一目的开发投资决策提供多个预选方案,并分析、预测和模拟每一个方案的执行效果。(5)建立决策模型库,将房地产投资决策成熟经验和方法及专家的知识融入系统,为投资提供固定和半固定的决策方法。(6)对房地产投资项目及方案测算和决策结果等,进行汇总、查询和输出。

2.系统功能要求

为实现上述目标,海口房地产投资决策支持系统应该由海口市场分析、项目(或方案)开发经营测算分析及其优劣评价、比较和决策分析等三大业务功能以及系统维护、初始化和结果输出两大辅助功能组成。遵循目标明确,体现系统总体功能;结构先进合理,考虑各方面主客观因素的限制;数据流程简单、明了、快捷;独立性、内聚性强,尽量减少不同功能间的耦合性和关联性等原则。

3、系统设计

1.系统总体结构

本系统采用结构化程序设计方法,其基本思想结构化、模块化、自顶向下、逐级细化、逐级抽象,切断每一层次与较低层次的联系,由这种方法设计出来的系统,既可作为单独的子系统存在,也可受上级模块调用和控制。

根据上述设计思想和系统分析的要求,可以将海口房地产投资决策支持系统总体结构设计图设计为:

海口房地产投资决策支持系统总体结构图,很清晰的反应了四库的耦合以及之间的联系,可以看出海口房地产投资决策支持系统由海口房地产投资信息模型、海口市场分析模型、方案测算和分析模型、方案决策分析模型和结果输出模型五部分组成,如上图所示。

2.人机对话系统设计

人机界面,就要从用户着手,满足基本的一些要求:

(1)在与决策者交互的过程中,起辅助作用。(2)作为数据库、模型库、知识库以及方法库的中枢。(3)提供友好的,便于理解的对话过程。(4)协调用户和系统各模块的控制操作,随时能提供使用帮助。

人机界面主要作用有3个:①接受处理决策者提出的请求;②与四库系统交互得到决策信息;③返回辅助信息给用户

3.模型及模型库设计

(1)海口房地产投资信息模型。包括数据编辑、信息浏览、索引查询。数据编辑模块用以实现所有市场信息的数据追加、修改和删除;信息浏览模块用以浏览指定的市场信息内容,市场信息包括土地供给、建筑材料、施工队伍、基础设施等;索引查询模块可以根据用户的需求,检索出特定的市场信息供使用者参考。

(2)海口市场分析模型。包括市场供给分析模块,市场需求分析模块,市场供需平衡分析模块,方案规划设计和分析模块四个模块。其中,市场供给分析模块用以按时序、地域、工程进度、物业类型等对海口房地产市场供给进行分析、统计和预测。市场需求分析模块用以按时序、地域、人群、物业类型等对海口房地产市场供给进行分析、统计和预测。市场供需平衡分析模块用以在供给和需求分析基础上,按不同组合进行供需平衡分析。方案规划设计和分析模块用以根据海口本地和投资者等的有关规定和要求,对投资开发地块进行规划和设计;然后采用多种模型,以项目(方案)收益最大化为准则,对项目(方案)物业类型和档次比例等进行初步分析和决策。

(3)方案测算和分析模型。方案测算和分析模型主要对海口房地产投资进行方案测算和投资分析。包括土地投资测算和分析模块,建设投资测算和分析模块,经营销售估算和分析模块,财务估算、评价和分析模块,风险不确定性测算和分析模块五个模块。土地投资测算和分析模块用以采用成本法、比较法和剩余法等多模型对项目(方案)土地获取成本、开发成本和总成本等进行测算与分析。建设投资测算和分析模块用以首先对项目(方案)建设项目、子项目及其建设计划等进行分割和确定;然后采用价格指数法、比较法和简化工程概预算法对项目(方案)建设成本进行测算和分析。经营销售估算和分析模块用以采用比较法、回归分析预测法等对项目(方案)各物业销售价格、进度进行分析和预测;项目经营方案和策略的效果模拟、比较和决策。财务估算、评价和分析模块用以项目财务及主要报表的生成,投资评价指标的测算和分析。风险不确定性测算和分析模块包括项目(方案)单变量和三项预测值灵敏度分析;损益分歧点分析;蒙特卡洛风险模拟分析。

(4)方案决策分析模型。方案决策分析模型主要返回给决策者简要的结果报告。它包括单项目(方案)决策分析模块和多项目(方案)比选和决策分析模块。其中单项目(方案)决策分析模块是根据在决策人员人工干预下确定海口房地产投资决策评价的标准,对项目(方案)投资可行性进行决策和分析,并生成简要的结果报告。多项目(方案)比选和决策分析模块则首先对决策人员所定决策的定性准则进行数值量化,然后对各项目(方案)优劣状况进行分析和决策,并生成简要的结果报告。

(5)结果输出模型。分析结果的输出,结果(包括文字和图表)查询和打印。

(6)以上模型都以数据的形式存放在数据库中。结构如下:

4.数据库设计

本系统处理的项数多,为保证以最优的方式组织数据,提高完整性、一致性和可修改性,形成合理流程,可设计多种数据库。通过对数据库的调实现数据的传递和存贮,同时设置少量内存变量对系统过程进行控制。按照规范化数据库设计原理,结合本系统的需要,共设置项目概况、建筑类型、成本费用、财务指标、敏感分析等五类,共9种数据库。其中:项目概况数据库作为系统维护时对旧有项目查询的一种标识;建筑类型数据库用于各种类型的选择及各类建筑参数的输入与输出;成本费用数据库作为投资估算的基础;财务指标的数据库是各种类型数据库的核心,它将成本分析与盈亏分析的各阶段成果加以汇总、传递、反馈,在此基础上进行敏感性分析,起到一种枢纽作用;敏感分析数据库的作用是便于用各种表格形式将各类敏感性分析结果打印输出。

5.知识库设计

随着时间的变化,投资都会有不同的经验和技巧知识,可以把积累的知识以库存储,并按照简单的表示格式,可以将知识保存在知识库中,积累多了知识库获取的知识也越多,一些问题可直接进行推理求解。

知识库的结构如下:

6.方法库设计

首先将海口房地产投资数据输入到内部数据库中,然后方法库管理系统中的数据处理程序从内部数据库中提取数据并从方法字典中选择要用的方法,再把数据放入方法体进行加工处理,最后将数据送出到数据库,最终输出数据。

4、系统实现

1.开发环境

系统主要采用VC为开发工具,在windows平台下,以ms-sql2005为数据库支撑数据和模型都保存在数据库中。

2.开发计划

本系统开发期计划在6个月之内完成,前1个月进行系统整体框架构建,中期需要3个月时间设计和开发数据库。程序块和模型库要1个月左右,最后一个月主要目的就是进行测试和一般的维护阶段。

5、结束语

总之,本决策支持系统将按照需求分析、常规的软件开发程序,预计将达到以下功能:

1.能较精确地完成海口房地产开发项目的投资评估、成本分析、现金流计算、财务指标计算、敏感性分析。

2.系统既可用于单项工程投资评估,也可用于多项工程的比较。

3.系统操作方便,并具有良好的扩充和维护功能。

参考文献:

[1]张春元:《决策支持系统讲义》

[2]陈文伟:《决策支持系统教程》.清华大学出版社,2005-8-1

数据分析解决方案范文8

关键词:企业组织 决策 企业发展 核心竞争力

企业组织决策是掌握企业重大问题决策权并对其他组织可以制约的管理机构针对企业发展的实际需要解决某些特定问题,而提出的各种解决构想和方案,并从中选择出一种切实可行的方案的选择过程。

科学高效的企业组织决策程序可以为企业带来新的经济增长点,同时提升企业的核心竞争力和社会影响力,有助于企业的做大做强,因而需要进一步优化我国企业组织决策程序,需要从企业问题的认知和分析、根据问题总结出几套解决方案,利用科学的数据分析平台进行处理,最后得到适合企业实际情况的预案,同时进行实施效果的跟踪评估和监管。具体的优化策略可以从以下几方面采取对策:

一、强化识别企业存在问题的能力,准确确定决策目标

强化识别企业存在问题的能力可以将企业存在的问题更加准确高效地发现,同时提升决策分析的敏感度。认知掌握企业重大问题决策权并对其他组织可以制约的管理机构对企业中需要解决的问题认识清楚并明确做出决策。

外部竞争环境的改变或者企业组织决策者意识到企业内部效益低于既定发展目标时就出现了通过决策改变现状的需求,决策者需要强化认知直到出现必须明确解决出现的问题的形势。强化认知企业问题的同时要进一步明确企业决策需要满足的主观诉求,同时要不违背客观实际情况,收集各方面相关信息,统一进行综合整合分析,最终确定决策的目标、思路、步骤、策略以及辅助措施。

二、拟定科学决策方案选择,整合出多种解决思路

由于企业组织决策正确与否关乎甚大,决策前需要拟定解决方案。注意发挥集体智慧,根据企业实际情况,以发展的眼光看问题,综合分析拟订科学合理的决策方案,全面考虑和预见未来将会出现的阻碍和困难,制定适当的应急措施。

拟定解决方案也就是围绕企业既定的发展目标,根据企业实际情况规划出决策方案思路,同时分析可能出现的突发状况和风险,设计制定出多个可行性、科学性、实效性相对较高的方案,易于被采纳的解决方案,以备评估和选择。拟定科学决策方案至少有如下作用:首先,它是对企业当前所能遇到的环境条件的一个有效归纳;其次,它是多中选一、好中选优的必经途径,为实现科学方案的制定提供保证;再次,科学决策方案的罗列,为企业发展提供了可选择性的发展空间与发展方向,为企业创新与开拓发展创造契机。

三、根据实际情况和需要,建立固定评估系统,科学选择解决方案

正确评估当前企业现状和发展需求,建立健全适合企业本身的决策评估系统,搭建科学的决策数据智能分析平台,将决策的多种拟定方案上传评估分析系统,经过科学的数据分析,将就拟定方案的科学性、可行性、时效性、风险性、经济价值等方面进行综合评估。

在评估的初步结果得出之后,企业决策者需要根据既得数据在企业内外部进行调研和审核,将拟定方案的预知阻碍和危险进行现实检测和评估,根据信息的反馈对决策内容进行完善和修改,尽量降低可能遇到的风险,同时提升企业的经济效益,最终整合出有效信息综合成评估报告。

将评估报告整合处理之后,企业决策者集中进行开会讨论,针对决策的可行性进行有效分析和综合评估,适时加入决策者的管理和实践经验是十分必要的,可以进一步降低风险,保证预案的顺利实施。在综合以上三部分的评估分析结果的前提下,进行科学选择最适合的备案,并最终将决策方案进行实施和执行。

从多个决策方案中选择其中最为有效、最适合企业、效益最大化的方案,其方法众多。一般情况下,可采用专家咨询法与层次分析法相结合,从而确定最优方案;也可以在建立目标模型的基础上,依据所限制的各项因子,利用线性规划理论予以实现。除此之外,数理统计中的其他方法亦能为此提供良好的解决方案。

四、试行选定方案并对决策结果进行深层次的跟踪和监管

决策者根据企业发展现状和对未来的构想和预测,从拟定的多种决策方案中选择出最适合的方案投入实施。与此同时,对最终决策方案的实施情况进行有效跟踪和合理评估分析,记录下有效信息和数据。如果发现弊端和不足,及时采取补正决策的措施进行补救。另外,还需要对实施决策的过程进行严格监管和适时调试,保证决策的有效开展,从而切实为企业的发展带来助动力。

总之,在优化企业组织决策程序的时候要企业决策者注意发挥集体力量,切实实现企业利益的同时兼顾人文理念的渗透,强化识别和确定企业发展存在问题的能力,建立健全科学严谨的预案评估分析平台,将预案的前期评估进一步科学化、系统化;为企业的立体式发展做出可持续发展的决策;优化和提升企业组织决策程序的过程中需要不断摸索和研究,在理论水平和实践经验方面都进行总结和累加,使企业真正实现经济利益的最大化和决策执行最优化,建立符合企业实际需求的组织决策程序。

参考文献:

[1]刘刚. 企业组织的决策过程及其效率分析[J]. 经济理论与经济管理, 2000, (3): 34-38.

[2]李中赋. 科学决策临界值探析――黄金分割率在决策中的应用[N]. 科技导报, 2003, (7): 25-27.

数据分析解决方案范文9

关键词:电子商务;“数据库”;数据分析;Excel;结构化查询语言

随着职业学校一体化课程体系改革的推进,“数据库”教学如何突破知识本身,让学生可以将数据库技术运用到具体的生活工作中,一直是一线“数据库”教师思考的问题。笔者提出问题解决模式的一体化教学思想,即将发现问题、分析问题、提出问题及解决问题运用到一体化项目任务中,但是该思想只能解决教学方法问题,就像写文章,只能算是文章结构的布局,让课堂可以井然有序地进行。一堂好课,最根本的是教学内容是否吸引学生;一门优秀的课程,最根本的是课程内容的安排是否能一直抓住学生的兴趣点,让学生内心想去学。所以,“数据库”课程整体内容的安排显得尤为重要,需要考虑专业方向、就业需求以及学生认知和兴趣等[1-2]。

南京技师学院电子商务专业需开设“数据库”课程,综合上述考虑,所开设的“数据库”课程应更加侧重于数据分析,而不是数据库安全维护方面的内容。但目前没有从分析数据角度学习结构化查询语言(StructuredQueryLanguage,SQL)的教材,本文提出的电子商务专业所开设的“数据库”课程,将计算机技术与统计学结合,课程内容中所有的实例都以统计学的方法进行分析,然后使用SQL实现,最后再用Excel以表格和图表的形式展示SQL的结果[3-4]。

课程内容的安排将始终围绕数据、代码以及展示的原则—将3个功能放在一起处理。所有的案例围绕着所提出的问题,让学生讨论分析这些问题的业务相关性和技术实现,通过SQL代码实现,并最终用Excel直观形象地展示数据模式。下面将以电子商务专业相关的零售订单业务为例,基于问题模式的教学方法,将统计、SQL和Excel这3方面的内容融入示例中。

1创设工作情景,学生自主发现问题

在网络电商平台中,每天客户往来以秒计算,从而产生大量的数据,对这些数据进行多角度的分析,将有利于商家对其进行管理,从而给商家带来更大的商机。其中零售订单数据集是非常普遍的信息,一般包括客户信息、产品信息、订单信息以及订单线信息(每一个订单线都是一个订单,而一个订单有一个或多个订单线)。

任务描述:对订单线表数据进行分析,从中获取已经发货并入账的订单明细,并用Excel将结果展现。订单线信息主要包括订单线编号、订单编号、产品编号、发货日期、账单日期、单价、数量、总价等,如图1所示。

2教师有效引导,促使学生分析问题

从统计分析角度引导学生的具体过程:从订单线表获取已经发货并入账的订单明细,需要获取每天发货的数目以及生产账单的数目。其中运货日期和账单日期都是订单线表中的列,从而可以采用两個查询解决该问题,但是两个查询会比较混乱,因为必须使用Excel将结果合并在一起;更好的方案是在一个查询中返回结果,采用数据库中的联接和聚合方法[5]。

3学生分组制定解决方案并实施

方案一:采用LEFTOUTERJOIN联接方式。

SQL代码:

SELECTs.ShipDateasthedate,s.numship,b.numbill

FROM(SELECTShipDate,COUNT(*)asnumship

FROMOrderLines

GROUPBYShipDate

)sLEFTOUTERJOIN

(SELECTBillDate,COUNT(*)asnumbill

FROMOrderLines

GROUPBYBillDate

)b

ONs.ShipDate=b.BillDate

ORDERBYthedate

Excel展示如图2所示。

方案二:采用FULLOUTERJOIN联接方式

SQL代码:

SELECTCOALESCE(s.ShipDate,b.BillDate)asthedate,COALESCE(s.numship,0)asnumship,COALESCE(b.numbill,0)asnumbill

FROM(SELECTShipDate,COUNT(*)asnumship

FROMOrderLines

GROUPBYShipDate

)sFULLOUTERJOIN

(SELECTBillDate,COUNT(*)asnumbill

FROMOrderLines

GROUPBYBillDate

)b

ONs.ShipDate=b.BillDate

ORDERBYthedate

Excel展示如图3所示。

4小组成果展示,教师点评总结

相关期刊