原标题:数据产品经理必备技能のBI建设
BI的2种实现方式一种是类似 Tableau那种,一种是自己公司开发的那种在后台写死的如何能够把2种结合起来呢?用tableau
实现有问题,就是数据量超过100万以后就比较卡这种在前端实现的计算方式,需要把后端的细节数据抽取到前端做计算就会导致网络流量很大。实现比较好的方式就是在网页前端拖拽的时候就组合成SQL在后端用数据库或者是大数据平台计算,数据分析无非就是:聚合分类,排序条件,关联
現在已经进入了大数据时代,每个公司对数据的重视程度都提高到了前所未有的程度只要是进入到一定规模的公司,不论是考虑到数据嘚安全性还是数据的使用效率,都会搭建自己的BI平台来管理查看数据因此,掌握搭建BI平台的各种知识也是数据产品经理必备的一项技能。
下面按照BI平台的版本迭代路线,讲一下BI建设的四个阶段:实现可拓展的展示报表(1.0版本)、自助分析功能(2.0版本)、添加功能性汾析工具(3.0版本)、实现业务bi场景模板(4.0版本)
1.实现可拓展的展示报表
BI平台首先要完成的就是对指标的报表性展示,大家首先想到的解決方案无非是前端写页面后端接口在数据库查询相应字段,直接吐出数据可是,这种传统的方式太依赖于前端如果增加一个指标,湔后端修改的成本都比较高因此,为了以后BI平台的可扩展性可以通过前端配置json,并在API下一层添加了QueryAdapter来把Api的接口翻译成相应的Sql然后通過Sql查询数据库的形式,来提高前端的扩展性和报表的灵活性具体架构如下图所示:
图1 可扩展的报表架构
这里要讲两个概念,单图(chart)与看板(dashboard)
单图主要是对指标进行某种样式的展示,例如日活的折线图、日活的表格、多平台日活对比图等并可以对单图进行多个维度嘚查询操作,它提供了:
维度:可以选择多个维度向下进行钻取和上卷;
时间:可以选择昨天、过去7天、过去30天、过去90、过去180天、过去365忝以及自定义天数;
图表样式:目前支持折线图、横向柱图、竖向柱图、表格、地图、饼图等图表。
看板(dashboard)能够帮助将相互关联的单图集合在一起兼顾全面性与单独性,既能够从多个图表中发现关联也可以对单个图表进行深入分析,方便每天查看相应的数据 看板可鉯供不同的业务bi人员实现不同的使用场景:
产品经理的看板可能是项目的核心指标;
市场人员的看板可能是监控各个渠道来源指标;
销售嘚看板可能是潜在客户的活跃度…
对于支持自定义图表的单图(chart)而言,在前端配置的json格式中需要明确以下几个字段:
dataSource:数据源,也就昰单图(chart)要查询的数据库、数据表它包含了数据的地址、端口、数据库格式、数据库、数据表等,是数据展现的基础
metrics:这是是要展礻的指标,包括指标的计算类型、指标的id、指标名称、指标别名等
dimensions:指标的维度,也就是相当于Sql中的group也就是分析人员想按照什么样的汾组来查看数据。
filter:这部分是用来设置过滤器前端报表用来筛选查询条件的,它要规定每个维度应该以何种规则来过滤是等于、不等於、大于、小于还是包含,还要规定维度的查询字段和查询值简单表示下就是下面这种格式,当然还有很多字段可以添加以便进一步扩展功能具体filter的格式可以参考下图。
orders:输出结果应该以哪一个指标进行排序通常使用时间字段来进行排序设置。
除了以上几个重要字段外还可以设置time、limit等字段来扩展更多功能,这里就不一一详述了
看板(dashboard)的实现逻辑也与上面相似,不同的是还添加了看板中包含哪些單图(即包含的每个chart的id)以及这些单图在看板中的位置等信息。
有了上面的支持可拓展的json配置格式就可以在BI平台配置出符合自己需求嘚单图(chart)与看板(dashboard)了。至此已经能满足日常的报表展示需求,BI平台也完成了V1版本的迭代
以上只是满足固定数据的展示,可是数據产品经理经常面对的情况是,业务bi人员的需求是多种多样的如果这些需求都让负责BI平台的产品经理来配置的话,既增加工作量又有佷大的沟通成本,这时候业务bi人员就需要一个能够自己在平台上快速方便搭建报表的方式。
自助分析功能这部分主要包含创建单图(chart)囷创建看板(dashboard)两部分这两部分都是基于前期灵活可扩展的json图表配置,并在此基础上能够创建一些复杂的计算字段,例如想计算平均停留时长这个指标,它是由总停留时长除以dau计算而成的总停留时长和dau都是基础指标,在数据表中是已经存在的那么就可以定一个计算字段,命名为平均停留时长计算公式为sum(dwell/dau),如下图3所示:
自助分析功能的核心是创建单图功能使用人员可以选择图表样式,现在瑺用的图表类型有表格、折线图、柱状图(横向柱图、竖向柱图)、饼图、漏斗图、堆积图等然后选择数据源里的数据表,把对应的数據表中的字段拖拽到时间、维度、指标栏中然后选择查询便可以在显示区进行预览,还可以设置过滤条件进行一些维度的过滤,并可鉯设置是否在前后端显示具体功能见图4。
图4 创建单图(chart)页面
在基本功能的基础上还有一些细节功能需要去优化,例如有时候折线圖从0为Y轴为起点很难看出波动,这样就可以设置指标显示的范围让它在一定范围内显示,从而进一步缩小显示区间突出趋势变化,另外还可以支持一些实时数据的展示功能等。
完成创建单图功能后就可以基于已经创建的单图上,选择已经创建的单图动态拖拽到看板(dashboard)的合适位置,从而组成满足自己分析需求相关的看板形成日常性报表组合。
最后不得不提一下数据源管理功能因为所有的单图(chart)和看板(dashboard)都是基于数据源进行分析的,好的数据源管理可以提高数据源的利用率、降低重复创建数据源进一步提高效率,并且还鈳以进一步拓展数据的存储形式除了支持Mysql存储,还可以支持Druid、Phoenix等另外,数据源管理要考虑业务bi的复杂性能够满足复杂的多表join,支持洎定义SQL查询特别是效率的保障,而不需要人工干预最后,数据源管理也要注意对数据权限的控制最好能够做到对表中字段这种细粒喥的权限管理,进一步提高数据的安全性就是基于行的权限管理,比如一个公司有很多分工订单表肯定是存储在一张表中,一个分公司只能看到自己的数据特别是有全国性的销售体系那种,分地区分层级每个末端销售人员都可以看到自己关心的数据,就需要完善的權限管理功能
一个完善的BI平台,不仅仅是单纯展示数据的需要把分析产品化,和以系统无缝对接一般的CRM,推荐系统风控系统
都是廣义的数据产品。还要能够能为数据分析师、业务bi人员提供一些常用的数据分析工具例如用户行为路径、用户分群与用户详情、系统监控等工具,可以方便使用人员方便快捷的分析更精细的业务bi场景
以用户分群和用户细查为例,日常中经常需要把满足某个或者某些条件嘚用户区分出来然后查看这批用户的一些关键指标以及一些行为事件等,例如想了解iOS平台上,最近五天内连续沉默的用户使用人员選择这些条件组合后,就可以获取一批userid的列表让后查看每个userid的用户属性、用户行为轨迹、用户活跃度趋势、用户阅读文章列表等信息,甴于不方便透露一些用户信息用户细查页面就以原型图的形式给予示例,见图5当然获取某些条件下的userid对集群来说是有一定的计算压力嘚,要等一些时间计算完成后才能给用户显示
图5 用户细查原型页面
BI数据系统是要更方便的服务于不同的业务bi场景进行数据分析的,每个業务bi场景总会沉淀下来一套固定的分析思路和分析架构这套固定的分析架构就可以放在BI平台上来实现,例如渠道分析、用户留存分析、鼡户活跃分析及日常的周月报等通过分析模板,可以方便快速的查看数分析数据提高效率。
例如活跃用户分析来说根据平时的分析***惯,一般要将活跃用户拆解为不同的活跃用户群体进一步查看活跃用户的构成及这部分用户的变化情况,从而针对每部分的不同群体進行优化和分析例如可以按照下图的分析框架创建一个看板(dashboard),由一下七个单图(chart)组成一个日常的分析模板
图6 活跃用户构成分析模板
梳理好分析框架后,就可以在BI平台上建立起固定的模板很大的方便的满足了日常的业务bi场景分析。
搭建一个完善的BI平台是需要不斷打磨优化产品的,搭建平台的目的无非就是提高工作效率方便大家快捷高效的获取数据,以上只是我在搭建BI平台的一些经验心得分享出来与大家一起交流。
作为一名数据产品经理还需要多了解业务bi,多使用自己的产品如果BI平台自己使用都不方便,那么更何况数据汾析师乃至数据经验比较少的业务bi相关人员呢?另外对于BI平台,以上四个阶段并不是适用于所有公司不同的业务bi阶段的需求都是不┅样的,初创公司没有太多的人力和时间来搭建自己的平台可以引用市面上的第三方产品,例如友盟、BDP、Finebi、Tableau 等以及云厂商 比如阿里云,网易
都有自己成熟的商业数据产品还是要针对每个公司的具体阶段而定。
摘要: 这次故事的主角还是小D小D笁作在一家传统公司的信息部门,负责数据仓库系统的运维和开发 话说有一天,小D被教导老板的office老板给布置了一个任务,让小D在现有數据仓库里接入刚上线的两个系统的数据 于是小D找到了对应系统的开发团队。可能是对方刚上线的缘故最终也没有人搭理小D,于是直接把数据
摘要: 作为甲方对于乙方派来的开发人员,我是会自己面一下总体来说遇到的水平不一,于是经过这三年多的面(cui)试(can)总结了一套自己的面试套路,中间也遇到过很多想吐槽的东西于是大概记录了下来。在后面 也写了些关于这方面的职业发展和我个人的建议。
摘要: 此篇描述如何在Datazen中使用自定义地图
摘要: 此篇介绍如何将数据关联到Datazen地图图表。我们会将数据库中的数据映射到地图上
摘要: 本篇主偠介绍Datazen对于地图图表的支持,这里你可以看到Datazen目前所支持的地图图表类型以及其自带的地图数据。
摘要: SQL Server的维护计划Maintenance Plan是一个非常实用的维護工具可以完成大多数的数据库维护任务,通过对这些功能的封装可以省去很多的代码编写时间。网络上完整介绍的不是很多特此補上一篇。
摘要: 在第一篇中简单介绍了PowerShell包含基本的一些命令,以及如何打开PowerShell并且导航到SSAS对象。第二篇中学习了如何使用变量根据当前ㄖ期创建SSAS备份以及如何运行MDX和XMLA脚本。
摘要: 上一篇中简单的介绍了SSAS下的PowerShell这一篇会演示更多的操作,比如根据当前时间创建备份使用变量去指定处理哪一个分区,以及用XMLA脚本去创建分区和在PowerShell中调用PowerShell脚本。
摘要: 操作SSAS数据库的方法有很多是否有一种可以方法可以通过脚本洎动去做这些事呢,比如处理分区创建备份以及监视SSAS的运行状况。
摘要: 本文介绍如何配置SSAS数据库和cube相关维度的安全设置
摘要: 在有些场景下,数据中心会分为不同的服务器场:数据库场和应用程序场服务器场间有严格的防火墙控制,其中数据库场只能建立从应用程序场嘚防火墙穿越也就是说不允许任何客户端直接连接到防火墙。
这种策略对于数据库引擎来说没什么问题但是对于分析服务来说就被完铨限制住了,通常我们都是通过Excel直接连接分析服务数据库的并且通过分析服务的角色来控制对数据的访问权限。那么是否有什么方法可鉯解决这个问题呢
摘要: 从SQL Server 2005开始,分析服务就支持了同步的功能本文将介绍如何在SQL Server 2012下同步Adventureworks的分析服务数据库。通过同步的功能,我们就来鈳以弥补分析服务在差异备份以及全量备份上的不足从而间接的实现类似故障转移这样的功能。
摘要: 情人节伴随着元宵节刚刚过去Power BI团隊就送给我们一份大礼,利用来自NRF(national retail foundation)和Bing搜索的数据在Power BI中帮助我们发现在美国那边,关于情人节的数据
BI里的大多数组件目前还都是预覽版的阶段,但是我们已经可以从程序员都有可能会用到SSIS包来处理一些数据流程上的任务可以说SSIS作为BI下的一个ETL工具,方便易学而且功能也确实很强大。于是开发OLTP的同事总会到我们这边寻求技术上的支持更多的时候会问我,当一个SSIS包开发完成之后都有哪几种方式可以讓它运行起来。一直以来我都想把这个问题总结下来今天在MSSQLTIPS网站上看老外写了一个现成的总结,于是加上自己的理解简略的对其进行叻翻译,并且加以补充
摘要: 提到SSRS那么就不得不提一下自定义代码的功能,通过自定义代码有时候可以解决一些比较复杂的问题,比如將让指定的数据行应用指定的属性值此篇将演示如何通过简单结构的自定义代码进行报表样式的基本设计。
摘要: 伴随着数据量的日益增長通过自服务式的商业智能把数据转换成辅助决策支持的工具,越来越成为迫切的需求在以前,处理这些数据往往只是IT人员范围内的倳但是通过Power BI for Office 365里面的新功能喝服务,微软降低了这个门槛它里面都是基于大多数人已经非常熟悉的工具,包括Excel和Sharepoint
摘要: 在Power Query中,你不但可鉯搜索线上的数据也可以把自己的数据发布到线上供其它人检索。Power Query通过Power BI站点提供了这种内置的分享功能在Excel中,Anna打开了她想要进行分享嘚工作簿这个工作簿里包含了她先前在Power Query中下载的2009年NASDAQ数据。接下来她决定把这份自己组织的数据发布到Power
BI站点中供其他同事能够检索到
摘偠: 报表分享是Power BI for Office 365比较关键的一个功能,其中提供的Power BI站点将给这些报表一个安全的“归宿”同时也可以跟任何想要分享的人进行协作------无论是茬办公室里,还是在移动环境 从此篇开始你将看到Anna是如何在Power BI进行工作簿的协作分享,以及在下一篇中通过Power Query如何共享以及管理查询
摘要: 洳果说Power BI中最给力的功能是什么,我觉得是Power MapPower Map第一次是出现在SQL Server 2014的新特性里被提及,前身就是GeoFlow在Power Map下可以很容易的将基于地址的信息转变成非瑺酷炫的3D模式的地图图表,并且也可以基于时间维度来观察数据随时间而发生的变化
摘要: 继续上一篇Power View 报表的创建, Anna觉得为每一个大类创建一张单独的报表似乎很不现实所以她决定按照另外一种方式来设计报表,从而满足最终用户想要查看不同大类下的数据的要求
摘要: Power View昰一种可以创建动态的交互式报表的工具,并且支持丰富多样的图表类型在Power View中创建的报表可以很容易地进行分享,以及供查看报表的用戶对Power View报表进行交互从这一篇开始,Anna将利用她在Power Query中得到的数据组织到Power Pivot之后在Power View中制作动态报表。
摘要: 在Power Pivot中可以从各种数据源中根据你的需求来创建数据模型并且可以根据需要随时刷新这些数据。在上一篇中Anna已经准备好了加载到Power Pivot中的数据。Power Pivot就是这样一个在Excel中创建并且管理表格数据以及表之间的关系的一个工具
摘要: 在上一篇中我们看到了Power BI在移动端的支持,从这一篇起降依次介绍Power BI中的各个功能组件此篇讲通过一个故事来介绍如何在Power Query中获取并且组织数据。
摘要: 借助Power BI我们可以很容易的和同事共享工作簿的数据。在Windows移动端的Power BI应用下我们可以以非常熟悉的方式操作Excel报告因为在Power BI移动端操作报告跟Excel Web App是非常相似的。
摘要: 假如你有一个购物类的网站那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有那么,通过SQL Server Analysis Services的数据挖掘功能你也可以轻松的来构建类似的功能。 上一篇中介绍的是如何通过DMX来创建挖掘模型这一篇讲简单介绍如何通过编程的方式来创建挖掘模型。
摘要: SSRS是一个功能丰富的报表平台我们可以在这个平台上实现各种鈈同需求的报表应用,所以这个平台也吸引了很多.net框架之外的技术希望能在应用中引入SSRS的报表,比如JSP或者PHP页面这个时候系统往往会有這种需求,就是通过程序能够直接访问到SSRS的报表而不让其弹出身份验证框。
摘要: QA是Power BI for Office 365的一个功能它允许用户通过自然语言的方式对数据進行检索。微软一直致力于降低商业智能的门槛从QA这个功能特性中真的可以看到其诚意,这个门槛的降低可以让更多更接近业务bi的业务bi笁作人员通过自服务式的商业智能深度的去洞悉业务bi中的数据
摘要: Power BI目前我们已经目睹了它的魔力,在Office 365中它将更值得我们的期待
CTP1里都有提到。结合Power Pivot和Power View这四大功能组成了微软最新的Power BI系列。 本文源自微软商业智能官方博客里的内容主要演示一个简单的示例,通过Power Query和Power Map获取并苴展示数据找到周围适合你的餐馆。首先将从Yelp API来检索餐馆的评分和评论
摘要: 平时总被问到一些跟商业智能相关的很多问题,有些问题吔是我当初入行的时候经常问的经过时间的积累,自己总结出了这些问题的***也许我个人的理解还没有达到那种"境界",但还是更愿意拿出来分享一下并且跟大家一起探讨一下
摘要: Data Explorer和GeoFlow作为Excel的新功能被写入到即将发布的SQL Server 2014当中。Data Explorer为业务bi分析人员提供了一种数据获取整理鉯及组织的方式,通过GeoFlow功能数据将被形象地展现在3D地球中,使数据中蕴含的信息更形象更有说服力
摘要: Data Explorer是即将发布的SQL Server 2014里的一个新特性,借助这个特性讲使企业中的自助式的商业智能变得更加的灵活从而也降低了商业智能的门槛。
摘要: 在我以前的随笔中做过介绍这一爿主要看看在Tabular Model模式下这个对象架构是否有什么不同。
摘要: 作为微软平台下的数据展示工具Power View是一个不错的选择。而在Excel 2013下即使你没有SharePoint的实唎那么你也可以玩转它。此篇讲对Excel 2013下的Power View做简单的介绍
摘要: 上一篇介绍如何在SSRS中以共享目录的方式来订阅报表。由于SSRS对于邮件的方式订阅報表有些特殊所以此篇将介绍如何以变通的方式实现报表邮件订阅。
摘要: SSRS提供基本的报表订阅功能此篇讲演示如何订阅一个报表。
摘偠: 上一篇介绍了客户端报表的基本开发此篇讲介绍如何给客户端报表自定义开发数据源。
摘要: 有些时候你需要在程序中使用报表的功能,但是又不想去部署和维护一台报表服务器这个时候你可以考虑使用客户端报表。 客户端报表与前面提到的SSRS报表略有不同SSRS报表是需偠部署在报表服务的实例中以供其它平台使用,而客户端报表不需要报表服务实例它直接在相应的webform或者 winform程序中解析运行。
摘要: 报表服务昰微软SQLSERVER商业智能其中的一个组件借助报表服务,用户可以制作各种各样的报表无论是简单的还是复杂的报表,同时系统提供订阅功能方便用户对报表进行订阅此外,开发人员也可以很容易地把一个SSRS报表集成到自己的winform或者webform程序中 此篇将介绍如何在应用程序中使用报表垺。
摘要: 此篇将在上一篇的基础之上介绍如何为报表添加更多的功能你会对格式,分组以及展开和发布有简单的了解
摘要: 此篇将介绍洳何建立简单的报表,通过此篇你将对建立报表项目的步骤有一个了解
摘要: 此篇介绍在***好报表服务之后,如何配置报表服务通过這一篇您会对如何在本地搭建和配置分析服务实例有一个了解。
摘要: 如何定位目标用户在任何一个业务bi单元中都是一个很重要的话题,尤其在预算有限的情况下如何获得活动的最大收益,目标用户的定位都是很重要的手段 本文将介绍如何通过SQL Server分析服务(SSAS)中的数据挖掘功能根据历史记录信息来定位目标用户。
摘要: 提到SQL Server 2012的分析服务那么不得不先说下商业智能,它是一个由数据转换成知识的过程此篇将对SQL Server 2012嘚分析服务(Analysis Services)以及跟其相关的商业智能做一个简要的介绍,将以一个普通开发人员的角度去阐述和介绍分析服务以及商业智能
摘要: 假洳你有一个购物类的网站,那么你如何给你的客户来推荐产品呢这个功能在很多电商类网站都有,那么通过SQL Server Analysis Services的数据挖掘功能,你也可鉯轻松的来构建类似的功能
前几篇中,简要的介绍如何建立挖掘模型并且编写程序用简单的DMX查询挖掘模型从而实现预测然后简要介绍洳何在Excel中独立地进行预测分析。此篇讲简单介绍如何通过DMX语句创建挖掘结构和挖掘模型并且训练模型,然后进行预测查询
摘要: 多维数據集是一种特殊的数据库,按照默认的模式(MOLAP)它把数据仓库里事实表和维度表的数据经过聚合存储在另外一套独立的文件系统中。经過聚合的数据在统计性能上会得到提升并且可以让用户通过很简单的前端工具,比如Excel来生成很简单的报表 这里将介绍如何制作一个简單的多维数据集。
摘要: 今天又有朋友遇到SSAS数据库处理速度慢的情况主要是由于数据聚合量确实很大,每次处理都要超过三十分钟有没囿什么方法能让处理的时间少一些呢?
传统透视表的数据来源可以是Excel工作表也可以是分析服务中的多维数据集这两种主要的方式。相对湔者由于数据是存储在Excel的工作表中所以业务bi操作人员很容易上手,很适合小规模的数据统计分析后者分析服务的多维数据集这种方式,由于数据是以一种特殊的方式聚合在独特的文件系统中所以适合大规模的数据量分析,缺点是分析服务的开发对于IT的要求比较高只能由IT人员完成,所以业务bi人员的一个需求往往会等待很长的时间才会得到响应
那么,业务bi操作人员是否可以有一种高性能的去分析稍微夶一点的规模的数据呢PowerPivot就是微软提供的一个方案。在这个方案中数据直接加载到内存当中,并且经过一定的优化保证了通过透视表嘚统计有一个很高的性能。
摘要: 俗话说忘记历史就是背叛自己,今天这篇用此做开场再合适不过 这一篇将根据一个虚拟的故事,来介紹如何通过历史数据来帮助一个销售人员发现规律信息从而辅助他来做一些决策信息
摘要: 假如你有一个购物类的网站,那么你如何给你嘚客户来推荐产品呢这个功能在很多电商类网站都有,那么通过SQL Server Analysis Services的数据挖掘功能,你也可以轻松的来构建类似的功能此篇承接上篇,主要演示如何根据工具的要求组织数据然后在Excel中做挖掘预测分析。
摘要: 假如你有一个购物类的网站那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有那么,通过SQL Server Analysis Services的数据挖掘功能你也可以轻松的来构建类似的功能。此篇独立于前三篇主要介绍洳何通过Excel的数据挖掘来独立的实现商品推荐功能,将通过微软提供的示例数据来进行演示
摘要: 假如你有一个购物类的网站,那么你如何給你的客户来推荐产品呢这个功能在很多电商类网站都有,那么通过SQL Server Analysis Services的数据挖掘功能,你也可以轻松的来构建类似的功能此篇为三篇文章的索引,综合介绍商品推荐功能的基本过程
摘要: 假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢这个功能在佷多电商类网站都有,那么通过SQL Server Analysis Services的数据挖掘功能,你也可以轻松的来构建类似的功能此篇为第三篇,编写前端推荐程序
摘要: 假如你囿一个购物类的网站,那么你如何给你的客户来推荐产品呢这个功能在很多电商类网站都有,那么通过SQL Server Analysis Services的数据挖掘功能,你也可以轻松的来构建类似的功能 此篇为第二篇,编写服务层代码
摘要: 假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢这个功能在很多电商类网站都有,那么通过SQL Server Analysis Services的数据挖掘功能,你也可以轻松的来构建类似的功能
摘要: 微软在最新版本的SQL Server中加入了Tabular Model,目的在於降低数据分析的门槛使各个业务bi部门的人员通过简单的IT培训,制作出符合自己需要的分析模型 由于其降低了操作门槛,所以各个部門的业务bi人员可以不用等IT部门的长时间响应就可以制作出简单的分析模型
摘要: 如果你要学习微软SQLServer的分析服务,那么官方的示例和教程绝對是个很好的学习和参考的资料这篇文章通过文字加图片的方式向你介绍如何获取并且部署微软的相关示例,希望对大家学习分析服务嘚过程有所帮助
摘要: 看看跟上一个版本有啥不一样的。每个技术领域关注的角度可能都略有不同这里主要从一个BI从业人员的角度来观察SQLServer2012在***以及第一印象上有什么变化。
摘要: 最近总被问到相关的类似问题所以平时就总结了一些,逐渐有了不成形的积累大致记录如丅。
摘要: 增量处理概述: 通常来说Cube会随着时间的积累而日渐增长这样一来如果每次都是全量处理的话会导致处理时间逐渐变长。所以对于夶规模的 Cube为了追求处理时间和性能,都会采取增量处理的方案 场景: 根据数据仓库的数据结构以及业务bi含义的不通,数据的组织会有差异这里讨论的是增量处理的其中一个场景,其中: 事实表是以日期键为主键(数据的生成日期)根据日期有建立为月的分区。
并且倳实数据是不发生变化的只随日期的增长而增长。Cube的处理周期为天Cube的分区是按月进行的分区。 这种场景多发生在分析状态数据比如汾析IIS日。 问题: 关于增量处理的一般过程可以参考我的这篇笔记。 在SSI
摘要: SSAS中的聚合方式设定: SSAS一个Cube中的一个度量的聚合方式设置方法: 吔就是说Cube中的聚合方式是针对度量来指定的。 问题: 针对一种特殊的需求要求先按照时间做平均聚合运算,再根据空间做求和运算 其实这种说法字面上看起来本身就很矛盾,所以得套到一个具体的场景中
比如:我有一个数据仓库统计某几个小区的某一时间粒度(这裏定义成季度)的住户数量,里面的数据格式大致如下: 2011年1季度,1100,A小区 2011年2季度,1000,A小区 2011年3季度,1100,A小区 2011年4季度,1000,A小区 2011年1季度,1200,B小区 2011年2季度,\) 指定应用程序池:
摘要: Analysis Services不同于数据引擎有自己的sa方式的验证,而我们在实际生产环境部署的时候不可能应用程序服务器和分析服务器都在同一台物理机器上,这个时候就需要配置分析服务的远程方式访问.目前网上资料最多的就是通过http的方式,本文主要描述sqlserver 2005 analysis services在vista平台下的配置方法.
摘要: 用silverlight展现多维數据集一直是我的一个想法,因为纯走RIA要比javascript要稳定的多,而且展现效果也要好很多.刚刚看到radarsoft发布了相关的产品,应该说是第一家吧.
摘要: 以上是在測试数据库中使用的两个维度.目前来说还是有点限制,比如每个轴上只能放一个维度,但是从目前的设计来看drilldown,drillup和drilltodetail应该都没问题. 从效果来看还是佷不错的,而且很稳定.
摘要: visifire是silverlight下很不错的一套开源组件,最近其发布了下的资源文件一样,可以根据客户端的语言来显示相应的名称的. 第二点 維度中该隐藏的隐藏 维度下,...
摘要: 不是很理解为什么在2008中会加入"阻止保存要求重新创建表的更改"这个选项.症状表现为修改表结构的时候会"阻圵"你.而且我遇到的情况是居然有的时候阻止你,有的时候不阻止你,摸不到头脑.建议初学数据库的朋友在使用的时候取消这个选项,方式是在Management
Studio里找菜单栏上的"工具"然后点击下面的选项,在出现的下面的这个界面中展开Designers,选中"表设计器和数据库设计器",把"...
摘要: 原文地址:/blog//visifire-v113-released/ 这个版本对异常的报告方式进行了改进,可以捕获并显示Silverlight内部所抛出的异常,具体到哪一行的哪一个位置. 这回如果图表有异常的话就不用看着白屏发呆了.
摘要: 地图找到一个现成的图片然后在上面描的.粒度到省,理论上可以到区或者县,不过工作量实在太大.和作GIS的朋友探讨过,他们的GIS用户通常要求精确到街噵,甚至是马路上的一个下水井井盖.所以,我做的这个算什么呢?肯定不是一个GIS,加入数据只需要精确到省的话,当然了,是目前,那么它就是一个还算嘚过去的报表展现组件.
通过前三个图,可以统计类似如下的信息,比如博客园用户在全国的分布.看地图有点乱?把地图...
Works就竟是错误.一来是因为自巳开发的时候试验用的多维数据集过于简单,二来是由于自己对多维数据集很多地方都没有理解上去,所以也就造成了代码上的缺陷.虽然是个佷失败的尝试,不过终究还是有收获的,比如对于多维数据集以...
引本山大叔一段小品台词:
小崔:这回咱们改改规矩,大叔您先说.
黑土:昨天,数据四千萬,今天数据来了,明天,数据五千万,谢谢.
小崔:大叔,我说的不是昨天.
小崔:不是哪天,我的意思就是咱们一起评说一下数据的过去,分析一下数据的现狀,再展望一下数据的未来.
黑土:啊~~~那叫数据的过去,现在和将来……