Carane Gunakake 'Ngram Viewer' Alat ing Google Buku

A Ngram, uga umum disebut N-gram yaiku analisis statistik saka isi teks utawa ucapan kanggo nemokake n (nomer) saka sawetara jinis item ing teks kasebut. Bisa uga kabeh jinis, kayata phonem, prefiks, frasa, utawa aksara. Senajan N-gram kaya-kaya ora katon ing njaba peneliti, iki bener-bener digunakake ing macem-macem kothak, lan nduweni akeh implikasi kanggo wong nggawe program komputer sing ngerti lan nanggapi karo basa lisan alam. Sing, saora-orane, bakal kapentingan Google ing gagasan kasebut.

Ing kasus Google Buku Ngram Viewer, teks sing bakal dianalisis bakal diwiwiti saka jumlah buku sing akeh Google wis mentas saka pustaka umum kanggo ngedol mesin telusur Buku Google . Kanggo Google Buku Ngram Viewer, padha ngrujuk ing teks sing arep digoleki minangka "korpus." Kopral ing Ngram Viewer dipérang dadi basa, senadyan sampeyan bisa nganalisis sacara teratur Inggris lan Inggris utawa nyusup bebarengan. Iku bakal luwih apik kanggo ngalih saka British menyang Amérika panggunaan istilah lan ndeleng owah-owahan grafik.

Cara Ngram Works

  1. Menyang Ngram Viewer Google Buku ing books.google.com/ngrams.
  2. Item sing beda-beda, ora kaya Google searches, supaya manawa arep nggabungake kata benda sing tepat.
  3. Ketik frase utawa frase sing pengin dianalisis. Aja nganti misahake saben ukara kanthi koma. Google nyaranake, "Albert Einstein, Sherlock Holmes, Frankenstein" kanggo njaluk sampeyan miwiti.
  4. Sabanjure, ketik rentang tanggal. Default punika 1800 kanggo 2000, nanging ana buku sing luwih anyar (2011 sing paling anyar sing didaftar ing dokumentasi Google, nanging bisa uga diganti.)
  5. Pilih corpus. Sampeyan bisa nelusur teks basa manca utawa basa Inggris, lan saliyane pilihan standar, sampeyan bisa sok dong mirsani "English (2009) utawa American English (2009)" ing ngisor. Iki minangka korpora lawas sing wis dianyari Google, nanging sampeyan bisa uga duwe sawetara alesan kanggo mbandhingake panyimpenan marang data data lawas. Paling pangguna bisa ngilangi lan fokus ing corpora paling anyar.
  6. Nyetel tingkat smoothing. Smoothing nggambarake manawa grafik kasebut ing pungkasan. Perwakilan yang paling akurat bakal tingkat smoothing 0, tapi mungkin sulit dibaca. Default disetel dadi 3. Ing kasus paling ora, sampeyan ora perlu nyetel iki.
  1. Pencet tombol Panelusuran akeh buku . (Sampeyan bisa uga mung mencet ketik ing pituduh panelusuran.)

Apa Ngram Nuduhake?

Buku Google Ngram Viewer bakal ngasilake grafik sing nggambarake nggunakake tembung tartamtu ing buku liwat wektu. Yen sampeyan wis ngetik luwih saka siji tembung utawa frase, sampeyan bakal nemokake garis sing nganggo kode warna kanggo mbentenake istilah sing beda-beda. Iki cukup mirip karo Google Trends , mung panelusuran sing nyakup wektu sing luwih suwe.

Punika tuladha nyata-nyata. Kita kepengin weruh cuka cuka bubar. Padha kasebut ing House Little Laura Ingalls Wilder ing seri Prairie , nanging kita wis tau krungu bab kuwi. Kita pisanan nggunakake pencarian Google Google kanggo sinau luwih akeh babagan cuka cuka. Ketoke, sing dianggep minangka bagian saka masakan Amérika Kidul lan digawe saka cuka. Padha ngrungokake maneh nalika ora kabeh wong bisa ngetokake asil seger ing kabeh wektu. Apa kabeh crita iki?

Kita nggolèki Google Ngram Viewer, lan ana sawetara nyebutake kue ing loro awal lan pungkasan taun 1800-an, akeh nyebutake ing taun 1940-an, lan tambah akeh nyebutake ing jaman anyar (mungkin sawetara nostalgia pie.) Inggih, ana sawetara masalah karo data ing tingkat smoothing 3. Ana papan sing dhuwur ing nyebutake ing taun 1800-an. Temtu ora ana sing sebutno jumlah sing padha karo pie saben taun limang taun? Apa sing kedadeyan iku amarga ora ana akeh buku sing diterbitake ing wektu kuwi, lan amarga data kita disetel dadi Gamelan, iku ngganggu gambar. Mbokmenawa ana kitab sing ngandhut kue cuka, lan mung diwenehi rata-rata supaya ora kena lonjakan. Kanthi nyetel smoothing ing 0, kita bisa ndeleng manawa iki pancen bener. Pusat lonjakan ing taun 1869, lan ana lonjakan liyane ing 1897 lan 1900.

Apa ora ana sing ngucapake cuka nalika isih enom? Dheweke mbokmenawa ngomong babagan pai. Ana resep-resep sing ngambang ing kabeh panggonan. Padha ora nulis babagan buku-buku kasebut, lan kuwi watesan nelusur Ngram iki.

Advanced Ngram Searches

Elinga carane kita nyatakake yen Ngrams bisa kalebu kabeh jinis panelusuran teks beda? Google ngidini sampeyan ngobrol rada adoh karo Ngram Viewer uga. Yen sampeyan kepengin nggoleki iwak tanpa katrangan tinimbang nate tembung, sampeyan bisa nggawe kanthi nggunakake tag. Ing kasus iki, sampeyan bakal nggoleki "fish_VERB"

Google menehi dhaptar lengkap printah sing bisa digunakake lan dokumentasi canggih liyane ing situs web.