银行Hadoop hbase 网卡假死

hbase在做count时，一个hadoop的datanode节点出现网卡假死

hbase在做count时，一个hadoop的datanode节点出现网卡假死，count超时后网卡又恢复正常，datanode节点得日志报如下错误：
org.apache.hadoop.hdfs.server.datanode.DataNode: PacketResponder: BP-1965446308-192.168.15.35

-1498918077927:blk_1073743652_2952, type=HAS_DOWNSTREAM_IN_PIPELINE
java.io

.EOFException: Premature EOF: no length prefix available

at org.apache.hadoop.hdfs.protocolPB.PBHelper.vintPrefixed(PBHelper.java:2282)
at org.apache.hadoop.hdfs.protocol.datatransfer.PipelineAck.readFields(PipelineAck.java:244)
at org.apache.hadoop.hdfs.server.datanode.BlockReceiver$PacketResponder.run(BlockReceiver.java:1285)
at java.lang.Thread.run(Thread.java:745)

2017-07-12 22:51:48,354 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Exception for BP-1965446308-192.168.15.35

-1498918077927:blk_1073743652_2952
java.io

.IOException: Premature EOF from inputStream

at org.apache.hadoop.io

.IOUtils.readFully(IOUtils.java:201)

at org.apache.hadoop.hdfs.protocol.datatransfer.PacketReceiver.doReadFully(PacketReceiver.java:213)
at org.apache.hadoop.hdfs.protocol.datatransfer.PacketReceiver.doRead(PacketReceiver.java:134)
at org.apache.hadoop.hdfs.protocol.datatransfer.PacketReceiver.receiveNextPacket(PacketReceiver.java:109)
at org.apache.hadoop.hdfs.server.datanode.BlockReceiver.receivePacket(BlockReceiver.java:501)
at org.apache.hadoop.hdfs.server.datanode.BlockReceiver.receiveBlock(BlockReceiver.java:897)
at org.apache.hadoop.hdfs.server.datanode.DataXceiver.writeBlock(DataXceiver.java:802)
at org.apache.hadoop.hdfs.protocol.datatransfer.Receiver.opWriteBlock(Receiver.java:137)
at org.apache.hadoop.hdfs.protocol.datatransfer.Receiver.processOp(Receiver.java:74)
at org.apache.hadoop.hdfs.server.datanode.DataXceiver.run(DataXceiver.java:253)
at java.lang.Thread.run(Thread.java:745)

2017-07-12 22:51:48,356 WARN org.apache.hadoop.hdfs.server.datanode.DataNode: IOException in BlockReceiver.run():
java.io

.InterruptedIOException: Interrupted while waiting for IO on channel java.nio.channels.SocketChannel[connected local=/192.168.15.31:50010

remote=/192.168.15.32:43398

]. 480000 millis timeout left.

关注2

参与3

1同行回答
全部行业
全部行业 互联网服务
|
按赞同排序
按时间排序

美国队长研发工程师Alibaba

你这个问题造成的原因很多，我觉得最大的可能是节点之间网络连接超时，但是用hbase进行数据统计，你可以采用hbase的协处理器，每次做个累积，这样速度会快一些，

收起

互联网服务 · 2017-07-26

hbase在做count时，一个hadoop的datanode节点出现网卡假死

1同行回答
全部行业
全部行业 互联网服务
|
按赞同排序
按时间排序

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

hbase在做count时，一个hadoop的datanode节点出现网卡假死

1同行回答全部行业全部行业互联网服务|按赞同排序按时间排序

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

1同行回答
全部行业
全部行业互联网服务
|
按赞同排序
按时间排序