EtL是将业务系统的数据经过抽取?
Extract?清洗转换?
transform?
之后加载?
Load?到数据仓库的过程Y目的是将企业中的分散零乱
标准不统一的数据整合到一起Y为企业的决策提供分析依据
EtL是指从原系统中抽取数据Y并根据实际商务需求对数据进行转换Y然
后把转换结果加载到目标数据存储结构中源和目标通常都是数据库和文
件Y也可以是消息队列等。
数据抽取
可以采用周期性的pull机制或者事件驱动的push机制
pull机制支持数据整合Y通常以批处理的方式工作
push机制通常采用在线方式工作Y可以把数据变化传播到目标数据存储
结构。
数据转换
包括数据重构和整合数据内容清洗或集成
数据加载
对整个目标数据存储结构进行刷新Y或者只是对目标数据存储进行增量更
新。
早期的EtL解决方案通常以固定的周期运行批处理工作Y从平面文件和
关系数据库中捕捉数据Y并把这些数据整合到数据仓库中最近这几年Y
商业EtL工具供应商已经对产品做了很大的改进Y对产品功能进行了扩
展Y具体如下x
1额外的数据源
2额外的目标
3改进的数据转换功能
4更好的管理
5更好的性能
6改进的可用性
7增强的安全性
8支持基于数据联邦的数据集成方法
数据抽取模块的功能x
1确定数据源Y即从哪些源系统进行数据抽取。
2定义数据接口Y对每个源文件及系统的每个字段进行详细说明。
3确定数据抽取的方式x是主动抽取还是由源系统推送Y是增量抽取。
还是全量抽取Y是每日抽取还是每月抽取。
数据清洗与切换
数据清洗与转换x
数据清洗主要是对不完整数据错误数据重复数据进行处理
数据转换包括如下操作
请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。
www.baquge.cc www.cwzww.com www.9kutxt.com www.shuhuangxs.com www.du8.org相邻推荐:失败者重生记 一本书带你读懂中国史 流放?不知道啊?天道喊我去玩的 强制宠!她一吻,太子爷就失控 斗魂卫 欲罢不能!王府宠妾她腰肢细软 神豪:开局打赏梦泪媳妇 元旦晚会罗生门,一生只爱一个人 异类者浊修 谍战大后方 替嫁弃女是魔帝,强亿点点怎么了 如何拯救德意志 真没开!我的植物和僵尸太强了! 修真不要太简单 召唤第四天灾拯救精灵 开局成为漫威幕后黑手 收徒系统,徒弟不太正常咋办? 溪午未闻钟 持敬斋随笔 超级提取系统制霸都市