ETL测试面试常见问题
2023-08-11
未来随着大数据和人工智能的进一步发展,ETL测试在国内的需要必然会从0到有的突破,下面我们就未来国内求职ETL测试岗位可能碰到的面试题进行说明。
问:什么是ETL?
答:ETL是Extracting-Transfroming-Loading的缩写,指从任何外部系统提取、转换、载入数据到目标地。这是数据集成过程的三大基本步骤。 Extracting:从源数据中提取目标数据集 Transfroming:将目标数据集进行业务逻辑转换 Loading:以合适的格式将经过业务逻辑转换的`数据集载入到目标地
问:为什么ETL测试是必须的?
答:
为了对从源到目的转换过程中的数据进行检查
跟踪整个ETL过程的效率和速度
熟悉ETL过程,才能更好的服务于我们的企业实践
问:ETL测试工程师的主要职责是什么?
答:
深入理解ETL工具和过程
为ETL测试各阶段设计测试场景
针对各阶段的测试场景实施不同类型的测试
对数据质量进行检查
问:在ETL过程中,维度指什么?
答:维度指汇总数据时进行的排序的组或类别
问:在ETL过程中,什么是Staging Area?
答:Staging Area至在ETL过程中临时存储的地方,在这里,我们通常会进行数据清理和重复检查等处理
问:请解释下ETL Mapping Sheets(ETL映射表)
答:ETL映射表包含了从源中提取的行和列的所有的信息。该表能帮助我们更好的完成整个ETL过程和ETL测试。
问:请列举几个ETL测试常见的用例并解释说明
答:
ETL映射表验证:验证映射表中的各项信息是否正确
数据检查:验证数据的准确性、数值、null检查等等
正确性问题: 验证数据的拼写是否有错、数据是否有错和是否存在空数据等问题
问:请列举你所知道的ETL bug类型
答:计算错误、用户界面bug、源数据错误、边界错误等