[ = 数据源与目标 :page-aliases: v1.0@data_science:ROOT:Component_Configuration.adoc

本页目录


读数据表

截屏2020-01-15下午3.08.08.png
组件说明:选择数据表,做为算法流程的数据源,选择范围为该项目Hive数据库下的Hive表。可通过组件看到输入数据表的字段以及对应的数据类型。
组件输入:项目自带的Hive库或本地数据上传(csv、txt格式)或外部数据。
组件输出:算法平台需要待处理的数据表。

输入桩input

  • input:输入表

输出桩output

  • output:待处理数据表

表选择

  • 表名

写数据表

image.png

组件说明:将其他算法组件输出的临时数据表存入数据库中。可以通过本组件创建新表,也可以将要保存的数据写入现有表的指定分区。另外,还可以通过组件设置数据表的生命周期。
组件输入:待保存的临时数据表,表存储格式为Hive的text类型表。
组件输出:经过数据科学平台计算处理后的结果表

输入桩input

  • input:经过数据科学平台处理后的待保存的临时数据表

输出桩output

  • output:输出的结果表可以写入至该项目下的已有表中或新建表中

表选择

  • 表名

  • 表生命周期