• ストリームデータ処理は、次々と生成される大量のデータをリアルタイムで処理します
  • ストリームデータ処理で扱うデータは、メモリ上に置かれて保管されません
  • データの発生時間を重視します

 

ストリームデータ処理とは

次々と生成される大量のデータをリアルタイムで処理するのが、ストリームデータ処理の目的です。
ただデータを受け取るだけではなく、ある条件を満たした時にアラートを発生させる処理も行います。

ストリームデータ処理は、
・センサーからの出力
・サーバーの稼働情報
・データベースのレーコード情報
など、コンピュータに入力可能なもの全てを対象としています。

 

 

 

 

古いデータは廃棄される

ストリームデータ処理で扱うデータは、メモリ上に置かれて保管されません。

ディスクにアクセスすると処理時間が大幅に増加しますので、ストリームデータ処理ではメモリにデータを置いて処理を行います。

処理が済んだデータは一定時間メモリ上に保管されていますが、保管する時間が過ぎれば廃棄されます。

次々に新しいデータが生成されるので、古いデータを処分しても問題ないのです。

 

 

 

データが発生した時間を重視される

データが生成された時間を重視するのも、ストリームデータ処理の特徴です。

各データが、生成された時刻を属性として持っています。

生成された時刻は重視されるのは、リアルタイムというストリームデータ処理の性質上、時間軸を条件とした分析クエリを頻繁に利用するためです。

 

 

本サイト上に掲載されているまとめ記事が、毎週ステップメールで受け取ることもできます。

 

 

参考文献