互联网 > 大数据

讲述SQL Server 2008 数据挖掘的概念

674人参与2018-06-01

  您必须了解数据,以便在创建挖掘模型时作出正确的决策。浏览技术包括计算最小值和最大值,计算平均偏差和标准偏差,以及查看数据的分布。例如,通过查看最大值、最小值和平均值,您可以确定数据并不能代表客户或业务流程,因此您必须获取更多均衡数据或查看您的预期结果所依据的假定。标准偏差和其他分发值可以提供有关结果的稳定性和准确性的有用信息。大型标准偏差可以指示添加更多数据可以帮助改进模型。与标准分发偏差很大的数据可能已被扭曲,抑或准确反映了现实问题,但很难使模型适合数据。

  借助您自己对业务问题的理解来浏览数据,您可以确定数据集是否包含缺陷数据,随后您可以设计用于解决该问题的策略或者更深入地理解业务的典型行为。

  BI Development Studio 中的数据源视图设计器包含数种可用于浏览数据的工具。

  此外,在创建模型时,Analysis Services 还会针对该模型中包含的数据自动创建统计摘要,您可以进行查询以便用于报告或进一步分析。

  生成模型

  如以下关系图中突出显示的那样,数据挖掘过程的第四步就是生成一个或多个挖掘模型。您将使用从浏览数据步骤中获得的知识来帮助定义和创建模型。

  

  通过创建挖掘结构定义要使用的数据。挖掘结构定义数据源,但只有对挖掘结构进行处理后,该结构才会包含任何数据。处理挖掘结构时,Analysis Services 生成可用于分析的聚合信息以及其他统计信息。基于该结构的所有挖掘模型均可使用该信息。

  在处理模型之前,数据挖掘模型只是一个容器,指定用于输入的列、要预测的属性以及指示算法如何处理数据的参数。处理模型也称为“定型”。定型表示向结构中的数据应用特定数学算法以便提取模式

您希望与广大热心网友互动!!点此进行留言回复

相关推荐

讲述SQL Server 2008 数据挖掘的概念

06-01

韩国首尔打造智慧都市 用大数据解决市民小烦恼

08-05

帝联:云时代的CDN让海量数据更加便捷安全

06-30

数据分析和挖掘将是O2O模式发展的核心要素

06-01

企业安全团队真的在意“大数据安全”吗?

06-16

2年生成人类史上9成数据,迅猛增长的“大数据”将改变未来

06-16

大数据时代 旅游业如何应对?

06-05

驾驭大数据 集体骑马舞

05-03

开源改变大数据和云未来 展望2013红帽五件大事

06-16

大数据潮流推动内容管理进入新行业

06-27

最近更新

数据挖掘文章-数据挖掘技术简介[转载]

06-02

《数据挖掘:概念与技术》前言

06-02

数据挖掘技术的算法与应用读书报告

06-01

用 WEKA 进行数据挖掘

06-01

数据挖掘前景与现状

06-01

有没有可能帮助我解决关于“数据挖掘”方面的问题

06-01

什么是数据挖掘?数据挖掘的详细解释!

06-01

中国数据挖掘市场被重视

06-01

转:数据挖掘可以做什么

06-01

数据挖掘在电子商务CRM中的三大金矿

06-01

网友评论

已有0条评论