<tbody> <tr> <th>Storm</th> <th>Hadoop</th> </tr> <tr> <td>实时流处理</td> <td>批量处理</td> </tr> <tr> <td>无状态</td> <td>有状态的</td> </tr> <tr> <td>具有基于 ZooKeeper 协调的主/从架构。主节点称为<b translate="no">nimbus</b>和从节点称为<b translate="no">supervisors</b>.</td> <td>具有/不具有基于 ZooKeeper 的协调的主从架构。主节点是<b translate="no">job tracker</b>从节点是<b translate="no">task tracker</b>.</td> </tr> <tr> <td>Storm 流式处理可以在集群上每秒访问数万条消息。</td> <td>Hadoop 分布式文件系统 (HDFS) 使用 MapReduce 框架来处理需要数分钟或数小时的大量数据。</td> </tr> <tr> <td>Storm Topology会一直运行,直到用户关闭或出现不可恢复的意外故障。</td> <td>MapReduce 作业按顺序执行并最终完成。</td> </tr> <tr> <td colspan="2" style="text-align:center;"><b translate="no">两者都是分布式和容错的</b></td> </tr> <tr> <td>如果 nimbus / supervisor 死了,重新启动会使其从停止的地方继续,因此不会受到任何影响。</td> <td>如果 JobTracker 死了,所有正在运行的作业都将丢失。</td> </tr> </tbody>
版权声明:
本文来源网络,所有图片文章版权属于原作者,如有侵权,联系删除。
本文网址:https://www.bianchenghao6.com/h6javajc/13871.html