コンテンツをスキップ
  • ホーム

  • 生産性

  • アプリのヒント

アプリのヒント

3分で読めます

Googleスプレッドシートで重複データを見つけて削除する方法

カスタム数式と組み込みのツールを利用して、データのドッペルゲンガーを見つけ出しましょう。

投稿者: Jessica Lau · 2024年6月23日
緑色の背景にGoogleスプレッドシートのロゴをあしらった、Googleスプレッドシートアプリのヒントのヒーローイメージ

ウェブサイト上のフォームを通じて収集したEメールアドレスのリストがあるとします。受け取ったEメールアドレスの数を知りたいのですが、誰かがフォームを2回入力して、数値が実際よりも多くなってしまうのではないかと心配しています。 

スプレッドシートで大量のデータを扱う場合、重複したレコードが存在するのは必然です。重複が人為的なミスであれロボットによるものであれ、これらの重複はワークフロー、ドキュメント、データ分析に支障をきたす可能性があります。

ここでは、Google スプレッドシートで重複を見つける方法を説明します。これにより、重複を自分で削除するかどうかを判断できるようになります。さらに、数回クリックするだけで重複を自動的に削除し、一意の値のリストを作成する方法も学習します。

Googleスプレッドシートで重複データを見つける方法 

データのドッペルゲンガーだけを見つけたい場合は、条件付き書式とカスタム数式を使用して重複するコンテンツをすべて強調表示するのが最善策です。数式は、繰り返される値を含む列の数によって若干異なります。 

Googleスプレッドシートで単一列内の重複をハイライト表示する方法

重複データを含む列が 1 つだけの場合は、次の手順に従って繰り返し値を簡単に見つけてください。 

  1. 重複情報をチェックするデータ範囲を強調表示します。次に、[ 書式設定] > [条件付き書式] を選択します。

    列 B のデータが強調表示された Google スプレッドシートのワークシートの一部。ドロップダウン メニューの条件付き書式設定オプションを指す矢印で書式タブが選択されます。

  2. 表示される[条件付き書式ルール]ウィンドウで、 [書式ルール]の下のドロップダウン メニューをクリックし、 [カスタム数式が] を選択します。

  3. カスタムの重複チェック数式を [値] または数式 バーに入力します。この例では、セル B2:B15で重複を探しているため、カスタム数式は=COUNTIF($B$2:$B$15,B2)>1です。重複が異なるデータ範囲にある場合 (たとえば、 A 2 :A 15 )、カスタム数式は=COUNTIF($A$ 2 :$A$ 15 ,A 2 )> 1なります。

    Google スプレッドシートのワークシートの条件付き書式ルール ウィンドウ。書式設定ルール セクション タイトルが強調表示され、カスタム数式の一部が値または数式バーに表示されます。

  4. 書式設定スタイルで、重複がスプレッドシートにどのように表示されるかをカスタマイズします。デフォルトでは、Google スプレッドシートは重複データを緑色で強調表示します。次に、 「完了」をクリックします。(ヒント: 塗りつぶしの色を変更する場合は、読みやすくするために、 薄い黄色の 3などのコントラストの高い配色を選択してください。

    Google スプレッドシートのワークシートの条件付き書式ルール ウィンドウの一部。書式設定スタイルのセクションタイトルが強調表示されます。

  5. ここで、重複データ (強調表示) を確認し、冗長な情報を削除する必要があるかどうかを判断できます。

    列 B の重複データが強調表示された Google スプレッドシートのワークシートの一部。

Googleスプレッドシートで複数の行または列の重複をハイライト表示する方法 

複数の行または列に重複データがある場合は、上記の手順1~3を繰り返しますが、カスタム重複チェック数式を=COUNTIF($A:$Z,Indirect(Address(Row(),Column(),)))>1に変更します。 

ヒント: 特定の行または列内の重複のみをスキャンする場合は、 [範囲の適用]の下のデータ範囲を更新して、繰り返しをチェックするセル範囲と一致させます。 

左側のセル A 2 :D 5でデータが選択され、右側に条件付き書式ルール ウィンドウが表示された Google スプレッドシートのワークシートの一部を示す GIF。データ範囲 A 2 :D 5内の重複データの 4 つのセルが強調表示されています。条件付き書式ルール ウィンドウのデータ範囲が A 2 :D 5から A 2 :B 5に変更されます。現在、強調表示されている列 A と列 B には重複データのセルが 2 つだけあります。

書式設定スタイルで、重複がスプレッドシートにどのように表示されるかをカスタマイズします。次に、 「完了」をクリックします。 

Google Sheets ワークシートの一部。データ範囲 A 2 :D 5内の重複データの 4 つのセルが強調表示されています。

Googleスプレッドシートで重複データを削除する方法 

事前に手動で確認せずに冗長なデータをすぐに削除したい場合は、Google がこれを非常に簡単に実現できるようにしています。Google スプレッドシートで重複データを削除する方法は次のとおりです。

  1. データが含まれている任意のセルをクリックします。次に、 [データ]タブ > [データのクリーンアップ] > [重複の削除] を選択します。

    列 A と列 B(それぞれ出席者の名前と出席者の Google Eメールアドレス)に Google データが含まれる Google スプレッドシートのワークシート。リボンのデータ タブが強調表示されます。データ タブのドロップダウン メニューから、矢印がデータ クリーンアップ オプションを指し、別の矢印が重複の削除オプションを指します。

  2. 表示される「重複の削除」ウィンドウから、重複データの検索に含める列を選択します。[重複を削除]をクリックします。 

    Google スプレッドシートのワークシート内の重複を削除するポップアップ ウィンドウ。次の項目が選択されています: データには分析するヘッダー行と列があります: すべて選択します。重複を削除ボタンはポップアップ ウィンドウの右下にあります。

    注: スプレッドシートにヘッダー行が含まれている場合は、必ず[データにヘッダー行があります]を選択してください。これにより、Google スプレッドシートは重複を削除するときにこの行を無視します。 

  3. Google スプレッドシートでは、削除された重複値の数がわかります。 

Google スプレッドシートのポップアップ ウィンドウに、「 4の重複行が見つかり、削除されました。」というテキストが表示されます。10 ユニークな行が残っています。」

ボーナス: Googleスプレッドシートで一意の値を見つける方法

元のデータを保持しデータ範囲から一意の値(重複していないデータ)のリストを取得する場合は、Google スプレッドシートの UNIQUE 関数を使用できます。 

これを行うには、スプレッドシート内の空の列を選択します。次に、重複をスキャンするセル範囲を使用して UNIQUE 関数を入力し、一意の値のみを残します。たとえば、 =UNIQUE(A2:B15)です。 

列 A と列 B に元のGoogleデータ(それぞれ出席者の名前と出席者のEメール)が含まれる Google スプレッドシートのワークシート。列 D と E には、列 A と列 B の一意のデータのみが表示されます。セル D 2が選択され、数式バーには =UNIQUE(A 2 :B 15 ) と表示されます。

関連資料:

  • Excel で重複を見つけて削除する方法

  • Googleスプレッドシートにドロップダウンメニューを追加する方法

  • Googleスプレッドシートで列を固定する方法

  • Googleスプレッドシートでセルを結合する方法

  • Googleスプレッドシートで並べ替える方法

  • GoogleスプレッドシートでIMPORTRANGEを使う方法

  • Google スプレッドシートのキーボード ショートカットでスプレッドシートを強化

この記事はもともと Deb Tennen によって 2018 年 5 月に公開されたものです。最新のアップデートは 2024年6月。

生産性向上のヒントをメールで直接お届けします

Zapierは週に1~3回Eメールをお送りします。お客様の情報を共有することはありません。

タグ
言及アプリ

関連記事

あなたの生産性を自動的に向上させます。Zapierを使用してアプリを連携させましょう。

サインアップ
Zapierの仕組みを見る
「Facebookから新しい見込み客を受け取ったとき」トリガーと「Slackでチームに通知する」アクションを含むZap