Hadoopによる分散処理入門 | Data Driven Knowledgebase
近年、ビッグデータの処理はますます重要になっています。そこで登場するのがHadoopです。Hadoopは大量のデータを効率的に処理するためのオープンソースフレームワークであり、そのコアコンポーネントとしてMapReduce、HDFS、YARNがあります。本記事では、これらのコンポーネントと分散処理の仕組みについて解説します。
https://blog.since2020.jp/data_analysis/hadoop/