浅谈Ruby on Rails下的rake与数据库数据迁移操作
作者:日拱一卒
不知道你有没有把数据迁移写入Migration文件的经历,相信无论是老鸟还是新手都这样干过吧。事实上,这样做并不是行不通,只不过这样的实践慢慢会给你引入一些不必要的麻烦。
一般认为db/migrate文件夹里的内容是关于你数据库Schema的演变过程,每个新的开发或线上环境都要通过这些Migration来构建可用的数据库。但如果这里装入了,负责细节的业务代码,比如一些历史遗留数据的迁移代码之类的,当一段时间后,数据库的结构变化了,但Migration没有跟着变化,渐渐的曾经的辅助代码,就成了垃圾代码,不仅不能帮忙构建环境,还会让rake db:migrate的执行过程异常中断,无形中增加了新环境的构建成本。
所以正确的做法应该是,Migration只负责Schema相关的事宜,而不该过问数据的细节,具体的数据细节,全部交由rake任务来做,并且这些rake任务也不是一成不变的,随着时间的推移它们也会废弃掉,但因为它们与系统的其它部分不想管,所以直接删掉即可。不过使用Rake做数据迁移也是有讲究的,具体如下:
Bad Rake Task
# lib/tasks/temporary/users.rake namespace :users do task :set_newsletter => :environment do User.all.each do |user| if user.confirmed? user.receive_newsletter = true user.save end end end end
任务会遍历所有用户,想想如果数据集很大会怎样
通过ActiveRecord更新数据,会触发模型中的验证和创建回调方法
通过if条件语句来判断是否需要更新数据
不能直观的看出这个任务是干什么的,没有一个desc,所以也无法通过rake -T找到它
Good Rake Task
# lib/tasks/temporary/users.rake namespace :users do desc "Update confirmed users to receive newsletter" task set_newsletter: :environment do users = User.confirmed puts "Going to update #{users.count} users" ActiveRecord::Base.transaction do users.each do |user| user.mark_newsletter_received! print "." end end puts " All done now!" end end
通过desc我们可以清楚的知道任务的意图,并且它也会显示在rake -T中
通过scope解决了if语句的问题
引入了计数器,以及执行状态显示,能让我们了解到程序运行时的情况
把数据的更改放到了事务中执行,可以语法因为数据异常,奔溃导致的不一致问题
最后要补充说明的一点是,有时候,可能直接用SQL语句更简单有效,特别是在数据集比较大的情况下,一条SQL能帮你省去不少无谓的循环!另外,记得上开发环境之前,最好预先检测一下Rake任务的有效性。