(Duplicate)Excelワークシートの値が重複していると、データが混乱する可能性があります。重複が意図的でない限り、それらは不正確さや偏った報告を引き起こす可能性があります。
このチュートリアルでは、Excelドキュメント内の重複を見つけて削除する方法を説明します。
重複する行またはデータを見つける方法
最初に、どの行(または列)が同一の情報を持っているかを確認することが重要です。したがって、Excelで重複を削除する方法を説明する前に、シートに重複データがないかどうかを確認するプロセスについて説明します。
方法1:ワークシート全体を検索する(Method 1: Search Entire Worksheet)
Excelには、データから結論を識別、視覚化、および引き出すのに役立つ条件付き書式ツールがあります。(Conditional Formatting tool)このツールを使用して、Excelドキュメント内の重複する値を強調表示する方法は次のとおりです。
- Control + Aを押して、リストまたはテーブルを選択します。または、テーブルの左上隅にある[すべて選択(Select All)]アイコンをクリックして、ワークシート全体を選択します。
- [ホーム(Home)]タブに移動し、 [条件付き書式(Conditional Formatting)]ドロップダウンボタンをクリックします。
- カーソルを[セルルールの強調表示]に移動し、[(Highlight Cell Rules)値の複製](Duplicate Values)を選択します。
- (Make)最初のドロップダウンボックスに「複製」と表示されていることを確認します。2番目のドロップダウンメニューで、好みのハイライトカラーを選択することもできます。
- [ OK]を選択して続行します。
Excelは、重複する値を持つ行と列をすぐに強調表示します。
方法2:行を組み合わせる(Method 2: By Combining Rows)
この方法は、すべての列またはセルで値が重複している行を見つけるのに最適です。まず(First)、Excelの「連結」機能を使用して、各行のコンテンツを結合する必要があります。次に、結合された値を保存する列を選択し、以下の手順に従います。最初の行の最後の値の横にある列の値を組み合わせることをお勧めします。
- =CONCAT(と入力または貼り付け、行の最初のセルを選択し、列(:)を入力して、行の最後のセルを選択します。その後(Afterward)、かっこで数式を閉じて、Enterキー(Enter)を押します。
サンプルワークシート(下の画像を参照)では、最初の行の最初と最後のセルに、それぞれ参照A2とD2があります。したがって(Hence)、式は次の形式になります:=CONCAT(A2:D2)。
セル(Remember)参照は、テーブルの行と列の数によって異なることに注意してください。
- 最後の行に到達するまで、数式を列の下にコピーします。これを行うには、数式を含むセルを選択し、マウスカーソルをセルの左下隅に移動し、塗りつぶしハンドル(Fill handle)アイコン(つまり、プラスアイコン)を押したまま、列の下にドラッグします。
- 列全体を選択します。列の上部にある文字をクリックするか、列のセルをクリックして、Control + Spaceを押します。
- [ホーム(Home)]タブに移動し、 [条件付き書式(Conditional Formatting)]を選択します。
- [セルルールの強調(Highlight Cell Rules)表示]にマウスカーソルを合わせ、[値の複製](Duplicate Values)を選択します。
- [ OK]を選択して続行します。
Excelは、重複する値で列を強調表示します。これにより、ワークシートの別の行として値が重複している特定の行のセルがわかります。
上の画像をよく見ると、条件付き書式設定(Conditional Formatting)ツールで行4(Row 4)と行13(Row 13)が強調表示されていないことがわかります。両方の行の[名前(Names)] 、 [スコア(Scores)] 、および[ ID ]列の値は重複していますが、[(ID)日(Day)]列の値は異なります。
両方の行の4列のうち3列だけが重複情報を持っています。これが、条件付き書式(Conditional Formatting)ツールが両方の行の連結値または結合値を強調表示しなかった理由を説明しています。「日」列に識別情報があるため、両方の行(行4(Row 4)と行13 )は一意です。(Row 13)
Excelで(Excel)重複する行(Duplicate Rows)を削除する方法
Excelワークシートに重複する情報を含む複数の行が見つかりました。2つのExcel(Excel)ツールを使用してこれらの重複行を削除する方法を示しましょう。
1.「重複の削除」ツールを使用します(1. Use the “Remove Duplicates” Tool)
このツールの役割は1つだけです。それは、 Excel(Excel)ワークシートにクリーンなデータがあることを確認することです。これは、ワークシートで選択した列を比較し、値が重複している行を削除することで実現されます。ツールの使用方法は次のとおりです。
- テーブル上のセルを選択し、キーボードのControl + Aを押してテーブルを強調表示します。
- [データ(Data)]タブに移動し、 [データツール]セクションの[重複の削除]アイコンをクリックします。(Remove Duplicates)
PCの画面が小さい場合、またはExcelウィンドウが最小化されている場合は、[データツール(Data Tools)]ドロップダウンボタンをクリックして、[重複の削除(Remove Duplicates)]を選択します。
- [列](Columns)セクションに目を通し、すべての列を選択します。テーブルにヘッダーがある場合は、[マイデータにヘッダーがあります]チェックボックスをオンにします。これにより、ヘッダー行またはシートの最初の行の選択が解除されます。[ (Click) OK]をクリックして続行します。
クイックヒント:(Quick Tip:)Excelワークシートの最初の行をヘッダーにするには、[表示(View)]タブに移動し、[ペインのフリーズ]を選択して、[一番(Freeze Panes)上の行(Freeze Top Row)のフリーズ]を選択します。
- Excelは、シートから検出および削除された重複値の合計を通知するプロンプトを表示します。[ (Click) OK]をクリックしてワークシートに戻ります。
2.高度なフィルターツールを使用します(2. Use the Advanced Filter Tool)
「高度なフィルター」は、Excelでデータをクリーンアップするの(clean your data in Excel)に役立つもう1つの優れたツールです。このツールを使用すると、ワークシート上のデータを表示、編集、グループ化、および並べ替える(group and sort data on your worksheet)ことができます。このツールを使用してExcel(Excel)ワークシートから重複する行を削除する方法については、以下の手順に従ってください。
- (Select)テーブル上の任意のセルを選択し、 Control + Aを押してテーブル全体を強調表示します。
- [データ(Data)]タブに移動し、 [並べ替えとフィルター]セクションで[詳細]を選択します。(Advanced)
- [一意のレコードのみ(Unique records only)]チェックボックスをオンにして、[ OK ]をクリックします。
テーブルまたはワークシートに同様の情報または値を持つ複数の行が含まれている場合、Excelは重複の最初の出現を除くすべてを削除します。
注:(Note:)高度なフィルター(Advanced Filter)ツールは、最初の行をヘッダーとして自動的に扱います。これは、重複する情報が含まれている場合でも、ツールが最初の行を削除しないことを意味します。たとえば、次の表では、高度なフィルタツールの「(Advanced Filter)一意(Unique)のレコードのみ」機能を実行しても、すべての列で値が重複している場合でも、最初と最後の行は削除されませんでした。
したがって、Excelワークシートまたはテーブルにヘッダーがある場合は、「重複の削除」ツールを使用して重複行を削除することをお勧めします。
クイックヒント:(Quick Tip:)誤って重複する行または値を削除しましたか?Control + Zを押して変更を元に戻し、重複データを元に戻します。
Excelでの重複の削除:制限
アウトラインデータまたはグループ化され(outlined or grouped data)たデータを含むワークシートから重複する行または値を削除することはできないことに注意してください。したがって、Excelワークシートの行と列を(grouped the rows and columns in your Excel worksheet)(おそらく合計と小計に)グループ化した場合、重複をチェックする前にデータのグループ化を解除する必要があります。Excelで重複を削除し、一意の値をフィルタリングする方法の詳細については、Microsoftのこの公式ドキュメントを(this official documentation from Microsoft)参照してください。
How to Remove Duplicate Rows in Excel
Duplicate νаlues in your Excel worksheet can mess up your data. Unless duplicates are intentional, they can cause inaсcυracies and skewed reрorting.
In this tutorial, we’ll show you how to find and remove duplicates in your Excel document.
How to Find Duplicate Row or Data
It’s essential to first check which rows (or columns) have identical information. So before we show you how to remove duplicates in Excel, let’s walk you through the process of checking your sheet for duplicate data.
Method 1: Search Entire Worksheet
Excel has a Conditional Formatting tool that helps to identify, visualize, and draw conclusions from data. Here’s how to use the tool to highlight duplicate values in your Excel document.
- Press Control + A to select your list or table. Alternatively, click the Select All icon at the top-left corner of the table to select the entire worksheet.
- Go to the Home tab and click the Conditional Formatting drop-down button.
- Move your cursor over Highlight Cell Rules and select Duplicate Values.
- Make sure the first drop-down box reads “Duplicate.” You can also select your preferred highlight color in the second drop-down menu.
- Select OK to proceed.
Excel will immediately highlight rows and columns with duplicate values.
Method 2: By Combining Rows
This method is perfect for finding rows with duplicate values across all columns or cells. First, you’ll need to use Excel’s “Concatenate” function to combine the content of each row. Then, select the column where you want the combined values stored and follow the steps below. We recommend combining the values in a column next to the last value on the first row.
- Type or paste =CONCAT( in the cell, select the first cell on row, type a column (:), and select the last cell on the row. Afterward, close the formula with a parenthesis and press Enter.
In our sample worksheet (see image below), the first and last cells on the first row have the reference A2 and D2, respectively. Hence, the formula will be this form: =CONCAT(A2:D2).
Remember, the cell references will vary depending on the number of rows and columns on the table.
- Copy the formula down the column until you get to the last row. To do this, select the cell with the formula, move your mouse cursor to the bottom-left corner of the cell, hold the Fill handle icon (i.e. the plus icon), and drag it down the column.
- Select the entire column—click the letter at the top of the column or click on a cell in the column and press Control + Space.
- Go to the Home tab and select Conditional Formatting.
- Hover your mouse cursor on Highlight Cell Rules and select Duplicate Values.
- Select OK to proceed.
Excel will highlight the column with duplicates values. That tells you to the cells in that particular row that have duplicate values as another row on the worksheet.
If you look closely at the image above, you’ll notice that the Conditional Formatting tool did not highlight Row 4 and Row 13. Both rows have duplicate values in the Names, Scores, and ID columns, but different values in the Day column.
Only 3 out of 4 columns in both rows have duplicate information. That explains why the Conditional Formatting tool didn’t highlight the concatenated or combined values for both rows. Both rows (Row 4 and Row 13) are unique because there’s distinguishing information in the “Day” column.
How to Remove Duplicate Rows in Excel
You’ve found multiple rows containing duplicate information in your Excel worksheet. Let’s show you how to remove these duplicate rows using two Excel tools.
1. Use the “Remove Duplicates” Tool
This tool has only one job: to ensure you have clean data in your Excel worksheet. It achieves this by comparing selected columns in your worksheet and removing rows with duplicate values. Here’s how to use the tool:
- Select a cell on the table and press Control + A on your keyboard to highlight the table.
- Go to the Data tab and click the Remove Duplicates icon in the “Data Tools” section.
If your PC has a small screen or the Excel window is minimized, click the Data Tools drop-down button and select Remove Duplicates.
- Go through the Columns section and select all columns. If your table has a header, check the box that reads “My data has headers.” That’ll deselect the header row or the first row on the sheet. Click OK to proceed.
Quick Tip: To make the first row of an Excel worksheet a header, go to the View tab, select Freeze Panes, and select Freeze Top Row.
- Excel will display a prompt notifying you of the total duplicate values found and removed from the sheet. Click OK to return to the worksheet.
2. Use the Advanced Filter Tool
“Advanced Filter” is another brilliant tool that helps you clean your data in Excel. The tool lets you view, edit, group and sort data on your worksheet. Follow the steps below to learn how to use this tool to remove duplicate rows from your Excel worksheet.
- Select any cell on the table and press Control + A to highlight the entire table.
- Go to the Data tab and select Advanced in the “Sort & Filter” section.
- Check the Unique records only box and click OK.
If the table or worksheet contains multiple rows with similar information or values, Excel will remove all but the first occurrence of the duplicates.
Note: The Advanced Filter tool automatically treats the first row as a header. This means that the tool won’t remove the first row, even if it contains duplicate information. For instance, in the table below, running the “Unique records only” feature of the Advanced Filter tool did not remove the first and last rows—even though they both have duplicate values across all columns.
So, if your Excel worksheet or table has a header, it’s best to use the “Remove Duplicates” tool to eliminate duplicate rows.
Quick Tip: Removed duplicate rows or values by accident? Press Control + Z to revert the change and get back the duplicate data.
Removing Duplicates in Excel: Limitations
We should mention that you cannot remove duplicate rows or values from a worksheet containing outlined or grouped data. So if you grouped the rows and columns in your Excel worksheet, perhaps into Totals and Subtotals, you’ll have to ungroup the data before you can check for duplicates. Refer to this official documentation from Microsoft to learn more about removing duplicates in Excel and filtering unique values.