ansaurus

Question

Find a duplicate entry in a large SQL script

Answer 1

A:

Assuming that Perl is acceptable:

#!/usr/bin/perl

use strict;

my %zips;
my $lineNum = 0;
while (<STDIN>)
{
    chomp;
    $lineNum++;
    if(/INSERT INTO ZIPCODE \(ZIPCODE, CITY, STATE, STATECODE, COUNTY, COUNTYCODE\) VALUES \(N'(\d{5})'/)
    {
        if($zips{$1})
        {
            print "Found duplicate zipcode at $lineNum (first instance $zips{$1}): $1";
        }
        else
        {
            $zips{$1} = $lineNum;
        }
    }
}

This is untested.

Dancrumb 2010-03-09 18:05:54

Few minor changes, but that worked.. so Perl is close enough....

Earlz 2010-03-09 19:11:04

I'm interested... a few minor changes to port to Ruby? Or you have to change the script to make it work?

Dancrumb 2010-03-09 20:40:42

Answer 2

+1 A:

Here's a Ruby version:

#!/usr/bin/env ruby

seen = {}
line_num = 0
$stdin.each_line do |line|
  line_num += 1
  next unless line.start_with?('INSERT INTO ZIPCODE')
  zip = line.scan(/\d{5}/).first
  if seen[zip]
    puts "Line #{line_num} is a duplicate of line #{seen[zip]}"
  else
    seen[zip] = line_num
  end
end

Lars Haugseth 2010-03-10 08:10:42

It's why I love Ruby and will move from doing Web project on Java to RoR. +1. :)

dimitko 2010-03-10 09:50:00

ansaurus

tags:

views:

answers:

Find a duplicate entry in a large SQL script

related questions