Excelの「データベース」とは?
データベースとは「集計しやすいように整っているデータの集まり」のことです。
このデータベースを作る際に大事になってくるのが、データ入力の統一ルールです。以前、総務省の統計局が示した、データ入力の統一ルールについてのツイートがバズりました(図表1)。
これは国の各省庁がネット上に統計情報を公開する際に、コンピューターですぐに使えるデータにするためのチェック項目です。せっかく公開された情報も、使えなければ全く意味がありませんからね。
たくさんのチェック項目が掲載されていますが、中でも気をつけたいポイントをピックアップして紹介します。具体的な操作は本記事の後半で説明します。
これだけは守ってほしい「Excelの入力ルール」
【ポイント】1セル1データか? 文字列を含んでいないか?
まず次の2つ(図表2)。なにがダメかわかりますか?
左の例では、1つのセルに複数のデータが含まれていて、データが文字列になっています。右の例も、データに「円」や「▲」といった文字列が含まれていて、データ自体が文字列となっています。そのため、右の表ではSUM関数の結果や足し算の結果がおかしくなっています。
正しく入力したテーブルはこちらです(図表3)。右の表の計算結果も正しく出ています。
「いや『1セル1データ』がいいのはわかるけど、普段扱ってるデータが『1セル複数データ』だから困ってるんだよ!」←わかります。そうですよね。そんなときは、記事後半で説明する「区切り位置」を使いましょう。
【ポイント】セルの結合をしていないか
「セル結合ダメ!」←これ、ネットやSNSではめちゃくちゃよく話題になります。ですが、私はリアルで言われたことも言ったこともありません。おそらくExcelができる人は内心「やめてくれ~」って思っていることでしょう。
たとえばこんな感じです(図表4)。
左は【市区町村】と【ふりがな】を上下に並べ、【生産本数】が1つのセルに結合されています。こうすると、「ちよだく」「58406」のセットなのか「千代田区」「58406」のセットなのか、対応関係が不明確となり、読み取りに支障が出てきます。正しく入力するには、右のように【ふりがな】の列を作り、1行のデータにしましょう。
【ポイント】スペースや改行等で体裁を整えていないか
見た目を整えるためにスペースを入れて「 A」としたり、「鎮静剤」と「A-1」の間に改行を入れたりすると、「A」や「鎮静剤A-1」とは別のデータになってしまいます(図表5)。つまり、「鎮静剤A-1」と検索しても見つからないのです。
「はいはい、スペースと改行ね。確かにダメだよね。でも扱ってるデータが…」←そんなときは置換しましょう。
【ポイント】項目名等を省略していないか
これも似たような問題です(図表6)。同じ単語を何度も繰り返すのって、確かに気になりますよね。気持ちはよくわかります。でも、使うときのことを考えると全くの逆効果なのです。
【鎮静剤A-1】以降はすべて番号の部分しか記載されていません。2とか3といった数字だけでは何のことかわかりませんし、実際の数値データと区別がつきません。
こんなときのためのオートフィルです。オートフィルの詳しい話は前回の記事で紹介しましたが、改めて説明しましょう。「鎮静剤A-1」のセルにカーソルを移動して、右下の■を下にドラッグしてみてください。ほら、連続データになりましたよね。誰も「鎮静剤A-2」「鎮静剤A-3」ってすべて手で入力しろって言っているわけではないですからね。
【その他の事項】
総務省が示したルールには、今回紹介した項目も含めて、こんな注意事項が記載されています(省庁向けの独自ルールもあるので、そういったものは除外しています)。
--------------------------------------------------
□1セル1データとなっているか
□数値データは数値属性とし、文字列を含まないこと
□セルの結合をしていないか
□スペースや改行等で体裁を整えていないか
□項目名等を省略していないか
□数式を使用している場合は、数値データに修正しているか
□オブジェクトを使用していないか
□データの単位を記載しているか
□機種依存文字を使用していないか
□数値データの同一列内に特殊記号(秘匿等)が含まれる場合
□データが分断されていないか
□1シートに複数の表が掲載されていないか
※総務省資料より(https://www.soumu.go.jp/menu_news/s-news/01toukatsu01_02000186.html)
--------------------------------------------------
この一覧は、Googleなどの検索サイトで「総務省 データ統一 ルール」と検索すると、トップに出てきます。具体的な例を交えて「こういうふうに入力しましょう」と紹介されているので、ぜひ読んでみてください。どんな考え方に基づいて作られているのか、自分なりに考えてみるのもいいと思います。