tableau笔记

tableau文件类型

Tableau中的数据分析结果可以以各种格式保存并保存和分发。这些各种格式被称为不同的文件类型,并且它们由不同的扩展标识。它们的格式取决于它们的生产方式和使用目的。它们都存储为XML文件,可以打开和编辑。
每种文件类型及其用法的描述如下:

文件类型 文件扩展名 目的
Tableau工作簿 .twb 它包含工作簿中每个工作表和仪表板的信息。它包含在每个视图中使用的字段的详细信息以及应用于度量的聚合的公式。它还应用了格式和样式。它还包含数据源连接信息和为该连接创建的任何元数据信息。
Tableau打包工作簿 .twbx 此文件格式包含工作簿的详细信息以及在分析中使用的本地数据。其目的是与其他Tableau桌面或Tableau读者用户共享,前提是它不需要来自服务器的数据。
Tableau数据源 .tds 用于创建tableau报表的连接的详细信息存储在此文件中。 在连接细节中,它存储源类型(excel / relational / sap等)以及列的数据类型。
Tableau打包的数据源 .tdsx 此文件与添加数据以及连接详细信息的.tds文件类似。
Tableau数据提取 .tde 此文件包含高度压缩的柱状数据格式的.twb文件中使用的数据。这有助于存储优化。它还保存在分析中应用的聚合计算。此文件应刷新以从源获取更新的数据。
Tableau书签 .tbm 这些文件包含一个易于共享以粘贴到其他工作簿中的工作表。
Tableau偏好设置 .tps 此文件存储所有工作簿中使用的颜色首选项。它主要用于在用户之间保持一致的外观和感觉。

tableau 数据类型

作为数据分析工具,Tableau将每个数据分为四个类别之一,即 - String,Number,Boolean和datetime。从源加载数据后,tableau会自动分配数据类型,但如果满足数据转换规则,也可以更改某些数据类型。此外,用户必须指定计算字段的数据类型。
Tableau支持的数据类型的描述如下:

数据类型 描述 例子
STRING 任何零个或多个字符的序列。 它们用单引号括起来。 引号本身可以通过写两次来包含在字符串中。 \’Hello\’ \’Quoted\’ \’quote\’
NUMBER 这些是整数或浮点数。 建议在计算中使用浮点数的四舍五入。 3 142.58
BOOLEAN 它们是逻辑值。 TRUE FALSE
DATE & DATETIME Tableau以几乎所有格式识别日期。 但是,如果我们需要强制tableau将字符串识别为日期,那么我们在数据之前放一个#符号。 “02/01/2015” “#3 March 1982”

tableau 术语

作为强大的数据可视化工具,Tableau有许多独特的术语和定义。在开始使用Tableau中的功能之前,我们需要熟悉它们的含义。以下术语列表是全面的,并解释最常用的术语。

术语 含义
alias 可以分配给字段或维度成员的备用名称。
bin 用户定义的数据源中的度量分组。
bookmark Tableau存储库中“书签”文件夹中包含单个工作表的.tbm文件。 很像Web浏览器书签,.tbm文件是快速显示不同分析的一种方便的方法。
calculated field 通过使用公式修改数据源中的现有字段创建的新字段。
crosstab 文本表视图。 使用文本表显示与维成员关联的数字。
dashboard 在单个页面上排列的几个视图的组合。 使用仪表板同时比较和监视各种数据。
data pane 工作簿左侧的窗格,其中显示与Tableau连接的数据源的字段。 字段分为维和度量的数据窗格还显示自定义字段,如计算,合并字段和组。 通过将字段从“数据”窗格拖动到作为每个工作表的一部分的各个货架上,可以构建数据视图。
data Source page 可在其中设置数据源的页面。 “数据源”页面通常由四个主要区域组成:左窗格,联接区域,预览区域和元数据区域。
dimension 分类数据字段。 维度通常保存离散数据,例如无法聚合的层次结构和成员。 维度的示例包括日期,客户名称和客户群。
extract 可用于提高性能和离线分析的数据源的已保存子集。 您可以通过定义包含提取中所需数据的过滤器和限制来创建提取。
filters shelf 工作簿左侧的架子,您可以使用它通过使用度量和维度过滤视图来从视图中排除数据。
format pane 一个窗格,其中包含控制整个工作表的格式设置,以及视图中的各个字段。 打开时,“格式”窗格将显示在工作簿的左侧。
level of detail (LOD) expression 支持除视图级别之外的维度上的聚合的语法。 使用详细信息表达式级别,可以将一个或多个维附加到任何聚合表达式。
marks 视图的一部分,可视地表示数据源中的一行或多行。 标记可以是例如条,线或正方形。 您可以控制标记的类型,颜色和大小。
marks card 视图左侧的卡片,您可以拖动字段以控制标记属性,如类型,颜色,大小,形状,标签,工具提示和详细信息。
pages shelf 视图左侧的架子,可用于根据离散或连续字段中的成员和值将视图拆分为一系列页面。 向页面货架添加字段就像在Rows货架上添加一个字段,只是为每个新行创建了一个新页面。
rows shelf 工作簿顶部的架子,可用于创建数据表的行。 货架接受任何数量的尺寸和措施。 在“行”功能区上放置尺寸时,Tableaus会为该尺寸的成员创建标题。 将度量放在“行”功能区上时,Tableau会为该度量创建定量轴。
shelves 命名区域在视图的左侧和顶部。 通过将字段放在货架上来构建视图。 有些货架仅在选择某些标记类型时可用。 例如,仅当您选择形状标记类型时,形状支架才可用。
workbook 具有.twb扩展名的文件,其中包含一个或多个工作表(可能还包括仪表板和故事)。
worksheet 通过将字段拖动到货架上来创建数据视图的工作表。

tableau 数据源

Tableau可以连接到广泛使用的所有常用数据源.Tableau的本机连接器可以连接到以下类型的数据源。

  • 文件系统,如CSV,Excel等。
  • 关系系统如Oracle,Sql Server,DB2等。
  • 云系统如Windows Azure,Google BigQuery等。
  • 其他源使用ODBC。

    连接Live

    连接实时特性用于实时数据分析。在这种情况下,Tableau连接到实时数据源并继续读取数据。所以分析的结果是第二次,最新的变化反映在结果中。但在不利方面它负担源系统,因为它必须继续发送数据到Tableau。

    内存

    Tableau还可以通过将内存缓存在内存中来处理内存中的数据,并在分析数据时不再连接到源。当然,根据内存的可用性,缓存的数据量将有限制。

    组合数据源

    Tableau可以同时连接到不同的数据源。例如,在单个工作簿中,您可以通过定义多个连接来连接到平面文件和关系源。 这用于数据混合,这是Tableau中非常独特的功能。