Hur man använder Ngram Viewer Tool i Google Böcker

Innehållsförteckning:

Hur man använder Ngram Viewer Tool i Google Böcker
Hur man använder Ngram Viewer Tool i Google Böcker
Anonim

Vad att veta

  • I Google Books Ngram Viewer skriver du en fras, väljer ett datumintervall och korpus, ställer in utjämningsnivån och klickar på Sök i massor av böcker.
  • Du kan gå ner i data. Till exempel, för att söka efter verbformen av fisk, istället för substantivet fisk, använd en tagg: sök efter fish_VERB.
  • Ngram Viewer visar en graf som representerar frasens användning genom tiden. För flera fraser representeras var och en av en färgkodad linje.

Den här artikeln förklarar hur du använder Ngram Viewer-verktyget i Google Böcker för att göra research och avancerade sökningar.

Image
Image

Så fungerar Ngram Viewer

Ett Ngram, även kallat ett N-gram, är en statistisk analys av text- eller talinnehåll för att hitta n (ett tal) av någon sorts objekt i texten.

Sökobjektet kan vara alla möjliga saker, inklusive fonem, prefix, fraser och bokstäver. Även om ett Ngram är oklar utanför forskarsamhället, används det inom en mängd olika områden och har många konsekvenser för utvecklare som kodar datorprogram som förstår och svarar på naturligt talat språk.

I fallet med Google Books Ngram Viewer kommer texten som ska analyseras från det stora antalet böcker i den offentliga egendomen som Google skannade för att fylla sin sökmotor för Google Böcker. För Google Books Ngram Viewer hänvisar Google till den text du ska söka efter som korpusen. Ngram Viewer aggregeras efter språk, även om du kan analysera brittisk och amerikansk engelska separat eller klumpa ihop dem.

  1. Gå till Google Books Ngram Viewer på books.google.com/ngrams.
  2. Skriv valfri fras eller fraser som du vill analysera. Separera varje fras med ett kommatecken. Google föreslår "Albert Einstein, Sherlock Holmes, Frankenstein" för att komma igång.

    I NGram Viewer-sökningar är objekt skiftlägeskänsliga, till skillnad från i Googles webbsökningar.

  3. Välj ett datumintervall. Standard är 1800 till 2000.
  4. Välj en korpus. Du kan söka i främmande språk eller engelska texter, och utöver standardvalen kan du lägga märke till poster som "English (2009)" eller "American English (2009)" längst ner i listan. Dessa är äldre korpus som Google har uppdaterat sedan dess, men du kan ha någon anledning att göra dina jämförelser mot gamla datamängder. De flesta användare kan ignorera dem och fokusera på de senaste korporna.
  5. Ställ in utjämningsnivån. Utjämning hänvisar till hur jämn grafen är i slutet. Den mest exakta representationen återspeglar en utjämningsnivå på 0, men den inställningen kan vara svår att läsa. Standardinställningen är 3. I de flesta fall behöver du inte justera den.

  6. Tryck Sök i massor av böcker.

Med Googles Ngram Viewer kan du gå ner i data. Om du vill söka efter verbet fisk istället för substantivet fisk kan du göra det genom att använda taggar. I det här fallet skulle du söka efter fish_VERB.

Google tillhandahåller en komplett lista över kommandon annan avancerad dokumentation för användning med Ngram Viewer på sin webbplats.

Bottom Line

Google Books Ngram Viewer visar en graf som representerar användningen av en viss fras i böcker genom tiden. Om du skrev in mer än ett ord eller en fras representeras var och en av en färgkodad linje för att kontrastera med de andra söktermerna. Detta liknar Google Trends, endast sökningen täcker en längre period.

Fallstudie

Tänk på fallstudien av vinägerpajer. De nämns i Laura Ingalls Wilders Little House on the Prairie-serien. Att utforska med Googles webbsökning för att lära dig mer om vinägerpajer visar att de anses vara en del av det amerikanska köket från södra köket och verkligen är gjorda med vinäger. De lyssnar tillbaka till tider då inte alla hade tillgång till färskvaror under alla tider på året, men är det hela historien?

Sök i Google Ngram Viewer efter vinägerpaj så kommer du att stöta på några omnämnanden av pajen både i början och slutet av 1800-talet, många omnämnanden på 1940-talet och ett ökande antal omnämnanden på senare tid. Men med en utjämningsnivå på 3 ser man en platå över omnämnandena på 1800-talet. Eftersom det inte publicerades många böcker under den tiden och eftersom datan är inställd på jämn, förvrängs bilden. Förmodligen bara en bok nämnde vinägerpaj, och det var ett genomsnitt för att undvika en spik. Genom att sätta utjämningen till 0 kan du se att det är precis så. Piggen kretsar kring 1869, och det finns ytterligare en topp 1897 och 1900.

Det är osannolikt att ingen pratade om vinägerpajer resten av tiden: Det var förmodligen recept som flöt överallt, men folk skrev inte om dem i böcker, och det är en viktig begränsning av Ngram-sökningar.

Rekommenderad: