拉链表的实现的方法:
准备一份测试数据(原始表),拉链表核心思想,像个拉链,支持开链,支持闭链,支持退链,我们通常将最新的数据称为开链数据,历史数据称为闭链数据,拉链表支持历史数据查询,且空间占用较小,但是数据加工处理较为繁琐,属于时间换空间的设计方式,拉链表一个时间维度中同一个用户只保存一条用户状态。拉链表通常会增加三个技术字段“开始日期starttime、结束日期endtime、状态标识mark”。通过主键(PK)与历史数据进行对比,判断当前数据与历史数据是否发生变化,如果发生变化或者新增则进行相应的开链、闭链操作。导入hive数据库 1.准备数据有两种方法: 1)直接在linux目录下创建文件: cd/home/atstudy/data vim test_data.txt 然后在文件中插入样例数据: 1,2021-11-20,2021-11-20,新建 2,2021-1