Alisin ang Mga Duplicate Records ng Data sa Excel
Ang mga programang spreadsheet tulad ng Excel ay kadalasang ginagamit bilang mga database para sa mga bagay tulad ng mga inventory na bahagi, mga talaan ng benta, at mga mailing list.
Ang mga database sa Excel ay binubuo ng mga talahanayan ng data na karaniwang nakaayos sa mga hilera ng data na tinatawag na mga talaan.
Sa isang talaan, ang data sa bawat cell o field sa row ay kaugnay - tulad ng pangalan, address at numero ng telepono ng kumpanya.
Ang isang karaniwang problema na nangyayari bilang isang database ay lumalaki sa laki ay ang dobleng mga tala o mga hilera ng data.
Ang pagkopya na ito ay maaaring mangyari kung:
- Ang lahat ng mga talaan ay pumasok sa database ng higit sa isang beses na nagreresulta sa dalawa o higit pang magkatulad na mga talaan
- Maramihang talaan ay may isa o higit pang mga patlang - tulad ng isang pangalan at address - na naglalaman ng parehong data.
Sa alinmang paraan, ang mga duplicate na tala ay maaaring maging sanhi ng isang buong host ng mga problema - tulad ng pagpapadala ng maraming kopya ng mga dokumento sa parehong tao kapag ang database ng impormasyon ay ginagamit sa isang mail merge - kaya magandang ideya na i-scan at alisin ang mga duplicate na talaan sa isang regular na batayan.
At habang madaling pumili ng mga dobleng rekord sa isang maliit na sample tulad ng isa sa larawan sa itaas, ang mga talahanayan ng data ay maaaring madaling naglalaman ng daan-daang kung hindi libu-libong mga rekord ang napakahirap upang pumili ng mga dobleng talaan - lalo na ang tumutugma sa mga talaan.
Upang gawing mas madali upang maisagawa ang gawaing ito, ang Excel ay may built in na data tool na tinatawag na, hindi nakakagulat, Alisin ang Mga Duplicate, na maaaring magamit upang mahanap at alisin ang magkapareho pati na rin ang bahagyang pagtutugma ng mga talaan.
Gayunpaman, ang paraan ng Alisin ang Mga Duplicate Ang tool ay idinisenyo, ang magkaparehong at bahagyang pagtutugma ng mga rekord ay dapat isaalang-alang nang hiwalay.
Ito ay dahil ang Alisin ang Mga Duplicate Ipinapakita ang kahon ng dialogo ang mga pangalan ng patlang para sa napiling data table at pipiliin mo kung aling mga field ang isasama sa paghahanap para sa mga tumutugma sa mga tala:
- Para sa mga magkaparehong tala, hanapin ang lahat ng mga patlang - iwanan ang mga marka ng tsek sa tabi ng lahat ng mga haligi o mga pangalan ng patlang;
- Para sa bahagyang pagtutugma ng mga tala - iwanan ang mga marka ng check sa tabi lamang ng mga patlang na matugtog.
Mga Pangalan ng Field kumpara sa Mga Hanay ng Haligi
Tulad ng nabanggit, ang Alisin ang Mga Duplicate Ang kasangkapan ay binubuo ng isang dialog box kung saan pipiliin mo kung aling pagtutugma ng mga patlang upang maghanap sa pamamagitan ng pagsuri sa nais na mga pangalan ng field o haligi.
Ang impormasyon na ipinapakita ng dialog box - mga pangalan ng field o mga titik ng haligi - ay depende kung ang iyong data ay naglalaman ng isang hilera ng mga heading - o mga header - sa tuktok ng talahanayan ng data na nakikita sa larawan sa itaas.
Kung ito ay - siguraduhin ang opsyon sa kanang bahagi ng dialog box - Ang aking data ay may mga header - ay naka-check off at ipapakita ng Excel ang mga pangalan sa hanay na ito bilang mga pangalan ng field sa dialog box.
Kung ang iyong data ay walang row header, ipapakita ng dialog box ang naaangkop na mga titik ng hanay sa dialog box para sa napiling hanay ng data.
Magkakaugnay na Saklaw ng Data
Para sa Alisin ang Mga Duplicate kasangkapan upang gumana nang maayos, ang data table ay dapat na isang magkadikit na hanay ng data - na ito ay hindi dapat magkaroon ng anumang mga walang laman na hanay, mga haligi, at, kung posible, walang mga walang laman na mga cell na matatagpuan sa loob ng talahanayan.
Ang hindi pagkakaroon ng mga blangko sa loob ng talahanayan ng data ay isang mahusay na kasanayan pagdating sa pamamahala ng data sa pangkalahatan at hindi lamang kapag naghahanap ng duplicate na data. Ang ibang mga tool ng data ng Excel - tulad ng pag-uuri at pag-filter - pinakamahusay na gumagana kapag ang data table ay isang magkadikit na hanay ng data.
Alisin ang Duplicate Records Data Halimbawa
Sa larawan sa itaas, ang data table ay naglalaman ng dalawang identical records para sa A. Thompson at dalawang bahagyang pagtutugma ng mga tala para sa R. Holt - Kung saan ang lahat ng larangan ay tumutugma maliban sa numero ng mag-aaral.
Ang mga hakbang na nakalista sa ibaba ay detalyado kung paano gamitin ang Alisin ang Mga Duplicate tool ng data sa:
- Alisin ang pangalawang ng dalawang magkatulad na rekord para sa A. Thompson .
- Alisin ang ikalawang bahagyang pagtutugma ng tala para sa R. Holt .
Pagbukas ng Alisin ang Duplicate Dialog Box
- Mag-click sa anumang cell na naglalaman ng data sa database ng sample.
- I-click ang Data tab sa laso.
- Mag-click sa Alisin ang Mga Duplicate icon upang i-highlight ang lahat ng data sa talahanayan ng data at upang buksan ang Alisin ang Mga Duplicate dialog box.
- Ang Alisin ang Mga Duplicate Ipinapakita ng kahon ng dialogo ang lahat ng mga heading ng hanay o pangalan ng field mula sa aming sample ng data
- Ang mga marka ng tsek sa tabi ng mga pangalan ng patlang ay nagpapahiwatig kung aling mga haligi ang Excel ay susubukan upang tumugma sa paghahanap ng mga dobleng talaan
- Sa pamamagitan ng default, kapag ang dialog box ay bubukas ang lahat ng mga pangalan ng patlang ay naka-check off
Paghahanap ng Mga Katulad na Mga Rekord
- Dahil kami ay naghahanap ng ganap na magkaparehong mga tala sa halimbawang ito ay iiwan namin ang lahat ng mga heading ng hanay na naka-check
- Mag-click OK
Sa puntong ito ang mga sumusunod na resulta ay dapat makita:
- Ang dialog box ay dapat isara at mapalitan ng isang mensahe na nagsasabi: 1 nahanap na mga duplicate na halaga at inalis; 7 natatanging halaga ang mananatiling.
- Ang hilera na naglalaman ng duplicate A. Thompson ang rekord ay inalis mula sa database
- Kahit na may dalawang bahagyang pagtutugma ng mga tala para sa R. Hol t, dahil hindi lahat ng mga patlang ay naitugma - ang mag-aaral na numero para sa dalawang mga tala ay naiiba - Excel isinasaalang-alang ito upang maging isang natatanging rekord ng data
Hanapin at Alisin ang mga Talaan ng Pagtutugma ng Bahagyang na Mag-delete ng Mga Duplicate
Sinusuri ang Isang Patlang sa Isang Oras
Dahil ang Excel ay nag-aalis lamang ng mga talaan ng data na eksaktong tumutugma sa mga piniling larangan ng data, ang pinakamahusay na paraan upang mahanap ang lahat ng bahagyang tumutugma sa mga tala ng data ay upang alisin ang check mark para sa isang patlang lamang sa isang pagkakataon, tulad ng ginagawa sa mga hakbang sa ibaba.
Ang mga kasunod na paghahanap para sa mga tala na tumutugma sa lahat ng larangan maliban sa pangalan, edad, o programa ay mag-aalis ng lahat ng posibleng mga kumbinasyon para sa bahagyang pagtutugma ng mga tala.
Paghahanap ng Bahagyang Pagtutugma ng Mga Talaan
- Mag-click sa anumang cell na naglalaman ng data sa talahanayan ng data kung kinakailangan
- I-click ang Data tab sa laso.
- Mag-click sa Alisin ang Mga Duplicate icon upang i-highlight ang lahat ng data sa talahanayan ng data at upang buksan ang Alisin ang Mga Duplicate dialog box.
- Ang lahat ng mga pangalan ng field o mga heading ng hanay para sa talahanayan ng data ay pinili.
- Upang mahanap at alisin ang mga tala na walang tugma sa bawat larangan, alisin ang check mark mula sa bukod sa mga pangalan ng patlang na ang Excel ay huwag pansinin.
- Para sa halimbawang ito mag-click sa check box sa tabi ng ID ng Mag-aaral haligi ng haligi upang alisin ang check mark.
- Ang Excel ay maghanap at mag-alis ng mga rekord na tumutugma sa data sa Huling pangalan , Paunang , at Programa mga patlang.
- Mag-click OK
- Ang dialog box ay dapat isara at mapalitan ng isang mensahe na nagsasabi: 1 nahanap na mga duplicate na halaga at inalis; 6 natatanging halaga ang mananatiling.
- Ang hilera na naglalaman ng ikalawang talaan para sa R. Holt kasama ang Student ID ng ST348-252 ay tinanggal mula sa database.
- Mag-click OK upang isara ang kahon ng mensahe
Sa puntong ito, ang sample na data table ay dapat na libre ng lahat ng dobleng data.