ansaurus

Question

Sequence file name being used as key in Hadoop output?

Answer 1

A:

I made the following tweaks to the first mapper and everything started working.

#Original version
@opt("addpath", "yes")
def mapper1(key, value):
    for word in value.split():
        yield (key[0], word), 1

#Edits version
def mapper1(key, value):
    for word in value.split():
        yield (key, word), 1

erikcw 2010-07-02 22:04:26

ansaurus

tags:

views:

answers:

Sequence file name being used as key in Hadoop output?

related questions