ウェブサイト上のフォームを通じて収集したEメールアドレスのリストがあるとします。受け取ったEメールアドレスの数を知りたいのですが、誰かがフォームを2回入力して、数値が実際よりも多くなってしまうのではないかと心配しています。
スプレッドシートで大量のデータを扱う場合、重複したレコードが存在するのは必然です。重複が人為的なミスであれロボットによるものであれ、これらの重複はワークフロー、ドキュメント、データ分析に支障をきたす可能性があります。
ここでは、Google スプレッドシートで重複を見つける方法を説明します。これにより、重複を自分で削除するかどうかを判断できるようになります。さらに、数回クリックするだけで重複を自動的に削除し、一意の値のリストを作成する方法も学習します。
Googleスプレッドシートで重複データを見つける方法
データのドッペルゲンガーだけを見つけたい場合は、条件付き書式とカスタム数式を使用して重複するコンテンツをすべて強調表示するのが最善策です。数式は、繰り返される値を含む列の数によって若干異なります。
Googleスプレッドシートで単一列内の重複をハイライト表示する方法
重複データを含む列が 1 つだけの場合は、次の手順に従って繰り返し値を簡単に見つけてください。
重複情報をチェックするデータ範囲を強調表示します。次に、[ 書式設定] > [条件付き書式] を選択します。
表示される[条件付き書式ルール]ウィンドウで、 [書式ルール]の下のドロップダウン メニューをクリックし、 [カスタム数式が] を選択します。
カスタムの重複チェック数式を [値] または数式 バーに入力します。この例では、セル B2:B15で重複を探しているため、カスタム数式は
=COUNTIF($B$2:$B$15,B2)>1
です。重複が異なるデータ範囲にある場合 (たとえば、 A 2 :A 15 )、カスタム数式は=COUNTIF($A$ 2 :$A$ 15 ,A 2 )> 1
なります。書式設定スタイルで、重複がスプレッドシートにどのように表示されるかをカスタマイズします。デフォルトでは、Google スプレッドシートは重複データを緑色で強調表示します。次に、 「完了」をクリックします。(ヒント: 塗りつぶしの色を変更する場合は、読みやすくするために、 薄い黄色の 3などのコントラストの高い配色を選択してください。
ここで、重複データ (強調表示) を確認し、冗長な情報を削除する必要があるかどうかを判断できます。
Googleスプレッドシートで複数の行または列の重複をハイライト表示する方法
複数の行または列に重複データがある場合は、上記の手順1~3を繰り返しますが、カスタム重複チェック数式を=COUNTIF($A:$Z,Indirect(Address(Row(),Column(),)))>1
に変更します。
ヒント: 特定の行または列内の重複のみをスキャンする場合は、 [範囲の適用]の下のデータ範囲を更新して、繰り返しをチェックするセル範囲と一致させます。

書式設定スタイルで、重複がスプレッドシートにどのように表示されるかをカスタマイズします。次に、 「完了」をクリックします。

Googleスプレッドシートで重複データを削除する方法
事前に手動で確認せずに冗長なデータをすぐに削除したい場合は、Google がこれを非常に簡単に実現できるようにしています。Google スプレッドシートで重複データを削除する方法は次のとおりです。
データが含まれている任意のセルをクリックします。次に、 [データ]タブ > [データのクリーンアップ] > [重複の削除] を選択します。
表示される「重複の削除」ウィンドウから、重複データの検索に含める列を選択します。[重複を削除]をクリックします。
注: スプレッドシートにヘッダー行が含まれている場合は、必ず[データにヘッダー行があります]を選択してください。これにより、Google スプレッドシートは重複を削除するときにこの行を無視します。
Google スプレッドシートでは、削除された重複値の数がわかります。

ボーナス: Googleスプレッドシートで一意の値を見つける方法
元のデータを保持し、データ範囲から一意の値(重複していないデータ)のリストを取得する場合は、Google スプレッドシートの UNIQUE 関数を使用できます。
これを行うには、スプレッドシート内の空の列を選択します。次に、重複をスキャンするセル範囲を使用して UNIQUE 関数を入力し、一意の値のみを残します。たとえば、 =UNIQUE(A2:B15)
です。

関連資料:
この記事はもともと Deb Tennen によって 2018 年 5 月に公開されたものです。最新のアップデートは 2024年6月。