データ分類に関する情報サイト

ビッグデータのデータ分類

ビッグデータのデータ分類 ビッグデータは大きなデータや膨大なデータといったイメージをもつデータになりますが、実際に多量・多種・リアルタイムという特徴があると言われます。このビッグデータは、毎日毎日たくさん生み出されたり蓄積される多様な種類や形式のデータのことです。このようなデータの種類は、データ分類の仕方によって複数あり、定量データや定性データといったカテゴリーなどがあります。
毎日生成されるデータですので、時間がたてばどんどんと蓄積されていき、膨大な量のデータとなりますし、いろいろな種類のデータが形成されます。こうしたデータ分類を専門的に行っている研究者たちもおり、膨大なデータを解析して、新しい発見や物事の傾向を見出す事が出来、私たちの生活にその研究成果が還元されてます。このように、このデータは日々多く生み出されるデータで、様々な種類のものがあり、こうした研究も今後ますます盛んに行われるようになっていくことでしょう。

表計算ソフト/サービスのデータ分類における誤判定

表計算ソフト/サービスのデータ分類における誤判定 Microsoft ExcelやGoogleスプレッドシート等の表計算ソフト/サービスは、ユーザーの使い方によっては、データ分類にお
ける誤判定が発生し得ます。
例えば、データ分類に用いたい指標が複数ある場合に、1つずつ絞り込み条件を指定することが可能ですが、指定方法によっては、ユーザーの意図しない集計結果となる場合があります。
具体例としては、以下の会員で集計結果の取りこぼしをしたくない場合、
 ①「顧客属性」が「ゴールド会員」は全て対象
以下の指定をする必要があります。
 ・指標に「顧客属性」、絞り込み条件に「ゴールド会員」を指定 
 ・他の指標は指定しない
この時、ユーザーが誤って以下のような指定をした場合、
 ・1つ目の指標に「顧客属性」、絞り込み条件に「ゴールド会員」を指定
 ・2つ目の指標に「都道府県」、絞り込み条件に「東京都」を指定
 ・3つ目の指標に「年齢」、絞り込み条件に「20代以上」を指定
以下のように、ユーザーの期待値に沿わないような集計結果となる場合があり得ます。
 ・「顧客属性」が「ゴールド会員」で、「都道府県」が「東京都」で、「年齢」が「20代以上」
データ分類を行う場合は、絞り込み条件に注意して、適切な設定を行う必要があるといえるでしょう。