Skip to main content

Paano Gamitin ang 'Ngram Viewer' na Tool sa Google Books

The Great Gildersleeve: Investigating the City Jail / School Pranks / A Visit from Oliver (Hunyo 2025)

The Great Gildersleeve: Investigating the City Jail / School Pranks / A Visit from Oliver (Hunyo 2025)
Anonim

Ang isang Ngram, karaniwang tinatawag na isang N-gramo, ay isang istatistikal na pagtatasa ng teksto o nilalaman ng pagsasalita upang mahanap n (isang numero) ng ilang uri ng item sa teksto.

Ang item sa paghahanap ay maaaring lahat ng uri ng mga bagay, tulad ng phonemes, prefix, parirala, o mga titik. Kahit na ang N-gram ay medyo nakakubli sa labas ng komunidad ng pananaliksik, ginagamit ito sa iba't ibang mga larangan at maraming mga implikasyon para sa mga nag-develop ng mga programa sa computer na nauunawaan at tumutugon sa likas na pasalitang wika.

Sa kaso ng Google Books Ngram Viewer, ang teksto na pinag-aralan ay mula sa malawak na halaga ng mga libro na na-scan ng Google mula sa mga pampublikong aklatan upang populate ang kanilang Google Books search engine. Para sa Google Books Ngram Viewer, sumangguni sila sa teksto na iyong susuriin bilang corpus . Ang Ngram Viewer ay pinagsama-sama sa pamamagitan ng wika, bagama't maaari mong hiwalay na pag-aralan ang Ingles at Amerikanong Ingles o magkasama silang magkasama.

Paano Gumagana ang Ngram

  1. Pumunta sa Google Books Ngram Viewer sa books.google.com/ngrams.

  2. I-type ang anumang parirala o parirala na nais mong pag-aralan. Paghiwalayin ang bawat parirala na may kuwit. Nagmumungkahi ang Google, "Albert Einstein, Sherlock Holmes, Frankenstein" upang makapagsimula ka. Ang mga item ay sensitibo sa kaso, hindi katulad ng mga paghahanap sa web ng Google.

  3. Mag-type ng hanay ng petsa. Ang default ay 1800 hanggang 2000.

  4. Pumili ng isang corpus. Maaari kang maghanap ng mga teksto ng wikang banyaga o Ingles, at bilang karagdagan sa mga karaniwang pagpipilian, maaari mong mapansin ang mga bagay tulad ng "Ingles (2009) o American English (2009)" sa ibaba. Ang mga ito ay mas lumang korporasyon na na-update na ng Google, ngunit maaari kang magkaroon ng ilang kadahilanan upang gawin ang iyong mga paghahambing laban sa mga lumang hanay ng data. Maaaring balewalain ng karamihan ng mga user ang mga ito at tumuon sa pinakabagong corpora.

  5. Itakda ang iyong antas ng smoothing. Ang pagpapaputi ay tumutukoy sa kung gaano kaayon ang graph sa dulo. Ang pinaka-tumpak na representasyon ay magiging isang smoothing na antas ng 0, ngunit ang setting na ito ay maaaring mahirap basahin. Ang default ay naka-set sa 3. Sa karamihan ng mga kaso, hindi mo kailangang baguhin ito.

  6. pindutin ang Maghanap ng maraming mga libro na pindutan.

Pinapayagan ka ng Google na mag-drill ka ng kaunti sa Ngram Viewer. Kung nais mong maghanap ng isda ang pandiwa sa halip na isda ang pangngalan, magagawa mo ito sa pamamagitan ng paggamit ng mga tag. Sa kasong ito, maghanap ka ng "fish_VERB"

Ang Google ay nagbibigay ng isang kumpletong listahan ng mga utos na maaari mong gamitin at iba pang mga advanced na dokumentasyon sa kanilang website.

Ano ang Ipinapakita ng Ngram?

Ang Google Books Ngram Viewer ay magpapadala ng isang graph na kumakatawan sa paggamit ng isang partikular na parirala sa mga aklat sa pamamagitan ng oras. Kung nakapasok ka ng higit sa isang salita o parirala, makikita mo ang mga linya ng naka-code na kulay upang i-contrast ang iba't ibang mga term sa paghahanap. Ito ay medyo katulad sa Google Trends, tanging ang paghahanap ay sumasaklaw sa mas matagal na panahon.

Pag-aaral ng Kaso

Isaalang-alang ang case study ng mga pie ng suka. Nabanggit ang mga ito sa Laura Ingalls Wilder Little House sa Prairie serye. Ang pagtuklas sa paghahanap sa Web ng Google upang matuto nang higit pa tungkol sa mga pie ng suka ay nagpapakita na ang mga ito ay itinuturing na bahagi ng American Southern cuisine at talagang ginawa mula sa suka. Sila ay nakikinig muli sa mga oras na hindi lahat ay may access sa sariwang ani sa lahat ng oras ng taon. Ngunit ang buong kuwento ba?

Maghanap sa Google Ngram Viewer para sa suka pie at makatagpo ka ng ilang pagbanggit ng pie sa parehong maaga at late na 1800s, maraming mga pagbanggit sa 1940s, at isang pagtaas ng bilang ng mga pagbanggit sa kamakailang mga oras. Gayunpaman, sa isang antas ng smoothing ng 3 makikita mo ang isang talampas sa mga pagbanggit sa 1800s. Sapagkat walang maraming mga libro na inilathala sa panahong iyon, at dahil ang aming data ay nakatakda upang makinis, pinipihit nito ang larawan. Marahil ay may isang libro na binanggit ang suka pie, at nakuha lamang ang average na ito upang maiwasan ang isang pako. Sa pamamagitan ng pag-set ng smoothing sa 0, maaari naming makita na ito ay eksakto ang kaso. Ang spike center sa 1869, at mayroong isa pang pako sa 1897 at 1900.

Ito ay malamang na walang sinuman ang nagsalita tungkol sa suka ng pie sa natitirang panahon: May mga malamang na mga recipe na lumulutang sa buong lugar, ngunit ang mga tao ay hindi lang isulat tungkol sa mga ito sa mga libro, at iyon ang isang mahalagang limitasyon ng mga paghahanap sa Ngram.