什么是数九 什么是数学

昭棠笔记 2023-01-26

钢琴价格表-justbefriends

2022年5月1日发

(作者:豆瓣音乐)

维普资讯

计算机科学2007Vo1.34No.1 

ETL执行过程的优化研究 ) 霹

吴远红 

(浙江海洋学院信息学院 舟山316004) 

摘要提出了一个ETL(Extraction-Transformation-Loading)优化框架并对ETL过程的逻辑优化进行了研究百度站长工具,把优 

化问题建模成状态空间搜索问题。每个ETL工作流看作一种状态,通过一系列正确的状态变换来构造状态空间白帽,并 

且提出算法来获得最小执行时间的ETI 工作流竞价单页。理论分析和实践表明其具有良好效果。 

关键词ETL,工作流,优化 

The Research of Optimizing ETL Execution Process 

WU Yuan-H'ong 

(Information College of Zhejiang Ocean University网站 流量,Zhoushan 316004) 

Abstract An optimization framework is provided in the paper,and the logical optimization of ETL processes is re— 

searched.The optimization problem is modeled as a state-space search problem,Each ETL workflow is considered as a 

state and the state space is fabricated through a set of correct state transitions.Moreover,algorithms are provided to— 

wards the miniimzation of the execution cost of an ETL workflow.The theory and experiment result prove it to be effi— 

cient. 

Keywords ETL,Workflow,Optimization 

1前言 

算法,理论和实践表明这种方法对于海量数据的处理很有效。 

ETL过程不能单纯地作为一个大的查询交给数据库去 

数据仓库作为一种数据密集型应用,由两部分构成;静态 处理、去优化。为此提出如图1所示的ETL执行优化框架旺道seo优化软件, 

部分和动态部分网络营销专业,静态部分是指数据仓库的体系架构和实例 

它由ETL过程设计器、优化器、调度、抽取、转换、加载等几种 

数据最新关键词,动态部分是构建和维护数据仓库的各种进程,负责加 类型的活动组成网站优化公司,其中ETL执行优化主要是寻求一个和原 

载、刷新等,这主要由ETL工具完成乌鲁木齐网站建设。ETL负责将分布的、 ETL过程等价的、最小执行代价的El"L过程软文发布平台。其处理过程 

异构的数据源数据(如关系数据、文本数据、xML、HTML等) 如下:由ETL过程设计器设计好ETL过程如何推广一个app,提交给优化器, 

抽取到临时中间层(Data Staging Area)电驴搜索关键词,在中间层进行清洗、 通过转换规则进行等价状态变换生成状态空间,再由算法根 

转换、集成,然后加载到数据仓库松原网,成为决策支持(如OLAP, 据代价模型进行状态空间搜索获得最小执行代价ETL工作 

数据挖掘)的基础黑链购买。ETL作为一种数据转换和集成的工具, 流。 

是构建数据仓库的基本工具。 

2问题建模 

脚 执行优化器 

等价状杏的状杏空间生成 i转换拽则 ETL工作流的优化问题可建模成状态空间搜索问题:每 

' .…… … 一个状态是一个ETL工作流图济宁网,对每个状态采用状态变换产 

状态空间搜索最小代价状志 _;代价横!室! 

。 …r一 一 。 

● 生所有可能的等价状态,从中出代价最小的状态即为更优 

:_¨~…一 .…=.. J= “¨l… : …一” 

转换栝动调度嚣  i

ETL执行过程。 

一i .: . 。 j.4… 

2产品网络推广。1 ETL工作流的形式化定义 

转换警  :加藏碧 

: .1Ⅲ: 一~. … ……: 一:… 

活动是一个四元组A一(jD,Iwww baiducon,O,s)自媒体博客,ID是活动标识符, 

r baidu ocm。’_l j是输入模式的集合柳州建设网,O是输出模式的集合,S是一个或多个 

扩展的关系代数表达式,表示每个输出模式的语义帮站效果好。 

、.一

-一—— 

一/、— 

———

一/ 、———— 每个ETL工作流看作一个状态也就是一个有向无环图 

图1 ETL执行优化框架图 

(DAG图)荥阳seo,图的节点可以是ETL活动和记录集,边代表数据 

供给关系佛山百度推广。 

目前对它的研究主要在ETL过程的建模 如何注销域名备案,但对ETL 

假定有活动集A,记录集RS南昌网站优化,供给关系集Pr,ETL工作 

过程优化的研究却不多来宾网,它不同于多查询优化m金兰企划网,因为多查询 流可以看作有向无环图(DAG图),G(V,E),V=AURS,E— 

优化主要着眼于将各个不同的查询语句局部更优化zhibo8 cc,而在 

Pr。G(V,E)可以拓扑排序,因此可以给每一个活动赋值唯 

ErL过程中淮南网,各个活动相互关联,全局优化是必须考虑的百度关键词竞价。 一的执行优先权作为活动标示符莱芜网络推广。 

本文提出一种ETL优化执行框架怎么建立自己的博客,并给出具体的优化过程和 2.2转换规则 

*)基金项目:浙江省教育厅项目(20050113)#浙江海洋学院项目(XO5LQ07)危机公关处理方案。昊远红讲师,硕士,研究方向:数据抽取、数据挖掘。 

・8l ・ 

渭南网站建设-什么也不说伴奏