Re: Index population over table contains 2.3 x 10^10 records

Josh Elser Thu, 22 Mar 2018 09:24:45 -0700

Hard to say at a glance, but this issue is happening down in theMapReduce framework, not in Phoenix itself.

It looks similar to problems I've seen many years ago aroundmapreduce.task.io.sort.mb. You can try reducing that value. It also maybe related to a bug in your Hadoop version.


Good luck!

On 3/22/18 4:37 AM, Margusja wrote:

Hi
Needed to recreate indexes over main table contains more than 2.3 x10^10 records.
I used ASYNC and org.apache.phoenix.mapreduce.index.IndexTool


One index succeed but another gives stack:
2018-03-20 13:23:16,723 FATAL [IPC Server handler 0 on 43926]org.apache.hadoop.mapred.TaskAttemptListenerImpl: Task:attempt_1521544097253_0004_m_000008_0 - exited :java.lang.ArrayIndexOutOfBoundsException atorg.apache.hadoop.mapred.MapTask$MapOutputBuffer$Buffer.write(MapTask.java:1453)atorg.apache.hadoop.mapred.MapTask$MapOutputBuffer$Buffer.write(MapTask.java:1349)at java.io.DataOutputStream.writeInt(DataOutputStream.java:197) atorg.apache.hadoop.hbase.io.ImmutableBytesWritable.write(ImmutableBytesWritable.java:159)atorg.apache.hadoop.io.serializer.WritableSerialization$WritableSerializer.serialize(WritableSerialization.java:98)atorg.apache.hadoop.io.serializer.WritableSerialization$WritableSerializer.serialize(WritableSerialization.java:82)atorg.apache.hadoop.mapred.MapTask$MapOutputBuffer.collect(MapTask.java:1149)atorg.apache.hadoop.mapred.MapTask$NewOutputCollector.write(MapTask.java:715)atorg.apache.hadoop.mapreduce.task.TaskInputOutputContextImpl.write(TaskInputOutputContextImpl.java:89)atorg.apache.hadoop.mapreduce.lib.map.WrappedMapper$Context.write(WrappedMapper.java:112)atorg.apache.phoenix.mapreduce.index.PhoenixIndexImportMapper.map(PhoenixIndexImportMapper.java:114)atorg.apache.phoenix.mapreduce.index.PhoenixIndexImportMapper.map(PhoenixIndexImportMapper.java:48)at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:146) atorg.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:787) atorg.apache.hadoop.mapred.MapTask.run(MapTask.java:341) atorg.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:170) atjava.security.AccessController.doPrivileged(Native Method) atjavax.security.auth.Subject.doAs(Subject.java:422) atorg.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1866)at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:164)
Is here any best practice how to deal with situations like this?

Br, Margus

Re: Index population over table contains 2.3 x 10^10 records

Reply via email to