史上最简单的数据抽取


史上最简单的数据抽取做为一名全职DBA,在之前的工作中,常会收到这样的需求,需要我配合开发定时的从几张目标表取出他们需要的数据,并存放到临时表中,开发们再从临时表中取出数据展现给前端页面。收到这样的需求,我觉得应该考虑以下几点:(1)目标表有哪几张,它们的关联关系如何,这决定了我如何取数据(2)定时抽取,意味着要周期性的提取数据,此抽取周期是多少?每次抽取数据的频率是多久?(3)周期性的抽取数据,那么临时表的命名要有规则,通过就是”临时表名_日期时间”,这样命名方便开发前端取数(4)周期性的抽取数据,那么临时表的保留及清理也要考虑一下,防止表空间使用率过高(5)如果每一次抽取数据消耗的时间比较长,那么要有1个监控的手段,方便查看本次抽取数据的进度(跑到第几个功能点了)(6)数据抽取的过程中,如果本次抽取数据时发现有问题,那么你抽数的存储过程要可以复用。 也就是说,当前你第2次执行抽数的存储过程时,本次操作之前抽取出的脏数据要清空掉。那么什么是数据抽取?最简单的解释就是,从原始数据中抽取出感兴趣数据的过程。针对上面我总结出的6点,咱们开始模拟一套最简单的数据抽取案例。(一)、表结构及字段说明(二)、模拟业务需求(三)、给出解决方案既然全想清楚了,那么我们就开始操练起来吧 1、创建日志表(存储抽取进度) 2、创建监控进度的存储过程 3、创建抽取数据的存储过程 4、使用sys用户显示授权给scott,防止dbms_job调用存储过程时报没有权限 5、查看监控日志表(新表什么也没有) 6、手工执行抽取数据的存储过程 7、查看监控日志表(记录得比较详细)朋友们,咱们的数据抽取功能、监控抽取进度、业务的需求咱们基本就全完成了。现在还差1项就是把抽取数据的存储过程设置成定时任务,然后周期性的执行。常用的定时任务有2种:a.crontab (操作系统层面的)b.dbms_job (oracle自带的)将咱们的数据抽取存储过程加入到定时任务,让它自己周期性的执行就可以了。 8、我使用的是dbms_job,详细如下图好了,朋友们至此,本套史上最简单的数据自动抽取文章就结束了!此篇文章中涵盖了以下知识点:1、SQL多表联合查询 2、关于业务的分析及思考 3、数据的自动抽取4、数据抽取的进度监控5、定时任务6、表的管理结束语:相信大免费云主机域名家已经发现了,本次文章中使用到的操作用户是scott,咱们oracle中基础练习的用户。本篇文章是我上课的一个小案例,我的学生们反应不错,他们说接受起来比较容易。所以我就把这个小案例移植到了51的博客上,分享给更多需要的朋友们!其实每个人都有拖延症,都会害怕去尝试新鲜事物,所以我想说本篇文章:送给想做数据抽取的朋友们、送给对数据处理感兴趣的朋友们、送给想学习oracle开发方向的朋友们、送给想和做不同步的朋友们、送给想学习的朋友们附:本篇文章中的代码,全部手工测试过没有问题。如果朋友们在操作过程中发现报错,请好好检查一下代码。

相关推荐: hbase中的位图索引–布隆过滤器

在hbase中,读业务是非常频繁的。很多操作都是客户端根据meta表定位到具体的regionserver然后再查询region中的具体的数据。 但是现在问题来了,一个region由一个memstore以及多个filestore组成,memstore类似缓存在服…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 01/20 20:11
下一篇 01/20 20:12