etl是企业数据仓库构建过程中的一个核心步骤y我们可以借助于etl
工具来高效地完成数据抽取转换和加载工作之所以需要etl工具y
主要有以下几个原因x
?
1?当数据来自不同的物理主机y这时候如果使用sql语句去处理的
话y就显得比较吃力且开销也更大]
?
2?数据来源可以是各种不同的数据库或者文件y这时候需要先把它
们整理成统一的格式后才可以进行数据的处理y这一过程用代码实现
显然有些麻烦]
?
3?在数据库中我们当然可以使用存储过程去处理数据y但是y处理
海量数据的时候y存储过程显然比较吃力y而且会占用较多数据库的
资源y这可能会导致数据库资源不足y进而影响数据库的性能。
。
在选择etl工具时主要考虑如下因素x
?对平台的支持程度]
?抽取和装载的性能是不是较高y且对业务系统的性能影响大不
大,高不高]。
?对数据源的支持程度]。
?是否具有良好的集成性和开放性]。
?数据转换和加工的功能。
?是否具有管理和调度的功能。
cdc解决方案包括变化捕捉代理变化数据服务和变化分机制三个
组成部分
?
1?变化捕捉代理变化捕捉代理是一个软件组件y它负责确定和捕
捉生在操作型数据存储源系统中的数据变化可以对变化捕捉代理
进行专门优化y使它适用于特定的源系统y比如使用数据库触器]
也可以使用通用的方法y比如数据日志比较。
变化数据服务变化数据服务为变化数据捕捉的成功实现提供了
请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。
相邻推荐:我为道士的最后十年 逍遥小阎王 丞相有喜以后 领域之主 重生在东京渔村当海王 妹妹死后,我化身阎罗杀戮世界 穿书成吃瓜群众后,女总裁盯上我 黑色笔记之都市猎人 悟性逆天,清扫雕像领悟道法三千 [咒回]向5t5告白失败后 重生断绝关系,家人们全都泪崩了 裴总又在明撩暗哄 龙王成了配角,那我还算反派吗? 断点续传 年代文家庭食物链顶端[空间] 夏安安霍初尧 杨辰傅春和 超度 叶迟秦始皇 异界领主:种田,工业与魔法
好书推荐:揉碎温柔为夫体弱多病和情敌在古代种田搞基建我有了首都户口暗恋指南星际双修指南我只是一朵云瑜伽老师花样多妈宝女她躺平爆红了你不能这么对我带着战略仓库回大唐背叛宗门,你们后悔什么?重生之护花痞少许你三世民国重生回到古代当夫子太子殿下躺平日常我的外甥是雍正公主 驸马 重生重生宠妻时光盗不走的爱人古穿今之甜妻混世小术士高手她带着全家翻身借一缕阳光路过爸爸偷了我的女朋友的东西后妈卷走40万失踪后续