dataclean_KR_SBT <- function(dat, endyr = 2017) { # hist(dat$hbf,nclass=400) if(sum(is.na(dat$alb))>0) dat[is.na(dat$alb),]$alb <- 0 if(sum(is.na(dat$bet))>0) dat[is.na(dat$bet),]$bet <- 0 if(sum(is.na(dat$blm))>0) dat[is.na(dat$blm),]$blm <- 0 if(sum(is.na(dat$bum))>0) dat[is.na(dat$bum),]$bum <- 0 if(sum(is.na(dat$mls))>0) dat[is.na(dat$mls),]$mls <- 0 if(sum(is.na(dat$oth))>0) dat[is.na(dat$oth),]$oth <- 0 if(sum(is.na(dat$sbt))>0) dat[is.na(dat$sbt),]$sbt <- 0 if(sum(is.na(dat$sfa))>0) dat[is.na(dat$sfa),]$sfa <- 0 if(sum(is.na(dat$sha))>0) dat[is.na(dat$sha),]$sha <- 0 if(sum(is.na(dat$skj))>0) dat[is.na(dat$skj),]$skj <- 0 if(sum(is.na(dat$swo))>0) dat[is.na(dat$swo),]$swo <- 0 if(sum(is.na(dat$yft))>0) dat[is.na(dat$yft),]$yft <- 0 dat <- dat[!is.na(dat$hooks),] # Clean up 294 NAs dat <- dat[dat$hooks<5000,] # clean up outliers dat <- dat[dat$hooks>200,] dat <- dat[is.na(dat$hbf)==F,] dat <- dat[dat$hbf < 40,] # dat <- dat[dat$op_yr > 1976,] dat <- dat[dat$yrqtr < endyr,] # dat <- dat[dat$EW==1,] dat <- dat[dat$hooks >= 1000,] dat <- dat[dat$hbf >= 5,] return(dat) }