4#

Что мы узнали из 5 миллионов книг - видеоролик

Изучайте английский язык с помощью параллельных субтитров ролика "Что мы узнали из 5 миллионов книг". Метод интервальных повторений для пополнения словарного запаса английских слов. Встроенный словарь. Всего 564 книги и 1815 познавательных видеороликов в бесплатном доступе.

страница 3 из 8  ←предыдущая следующая→ ...

00:04:15
It's four words; we call that a four-gram.
Это четыре слова, мы называем это 4-грамма.
We're going to tell you how many times a particular four-gram
Мы скажем, как часто именно эта 4-грамма
appeared in books in 1801, 1802, 1803,
появлялась в книгах в 1801-м, 1802-м, 1803-м,
all the way up to 2008.
и так далее вплоть до 2008-го.
That gives us a time series
Это даст временной ряд частоты использования
00:04:25
of how frequently this particular sentence was used over time.
именно этой фразы с течением времени.
We do that for all the words and phrases that appear in those books,
Мы проделываем это для всех слов и фраз, появляющихся в этих книгах,
and that gives us a big table of two billion lines
и это даёт большую таблицу в два миллиарда строк,
that tell us about the way culture has been changing.
которые говорят нам, каким образом изменялась культура.
ELA: So those two billion lines,
ЭЛА: Эти два миллиарда строк,
00:04:37
we call them two billion n-grams.
мы называем их два миллиарда N-грамм.
What do they tell us?
Что они нам говорят?
Well the individual n-grams measure cultural trends.
Отдельные N-граммы измеряют культурные тенденции.
Let me give you an example.
Позвольте привести пример.
Let's suppose that I am thriving,
Предположим, я процветаю сегодня,
00:04:47
then tomorrow I want to tell you about how well I did.
и завтра хочу рассказать вам, как мне было хорошо.
And so I might say, "Yesterday, I throve."
Я могу сказать: «Вчера я процветал [throve]».
Alternatively, I could say, "Yesterday, I thrived."
По-другому, я могу сказать: «Вчера я процветал [thrived]».
Well which one should I use?
Какой вариант мне использовать?
How to know?
Как узнать?
00:05:00
As of about six months ago,
Примерно шесть месяцев назад,
the state of the art in this field
положение дел в этой области
is that you would, for instance,
было таким, что можно было, например,
go up to the following psychologist with fabulous hair,
подойти к психологу с поразительной стрижкой
and you'd say,
и спросить:
00:05:10
"Steve, you're an expert on the irregular verbs.
«Стив, ты эксперт по неправильным глаголам.
What should I do?"
Как мне быть?»
And he'd tell you, "Well most people say thrived,
А он бы ответил: «Большая часть людей сказала бы процветал [thrive],
but some people say throve."
но некоторые скажут процветал [throve]».
And you also knew, more or less,
Как известно, более или менее,
00:05:22
that if you were to go back in time 200 years
если вернуться на 200 лет назад,
and ask the following statesman with equally fabulous hair,
и спросить вот этого политика, с не менее поразительной стрижкой,
(Laughter)
(Смех)
"Tom, what should I say?"
«Том, как нужно говорить?»
He'd say, "Well, in my day, most people throve,
Он бы ответил: «В мои дни большая часть людей процветала [throve],
00:05:35
but some thrived."
но некоторые процветали [thrived]».
So now what I'm just going to show you is raw data.
Я вам покажу необработанные данные.
Two rows from this table of two billion entries.
Две строки из таблицы в два миллиарда строк.
What you're seeing is year by year frequency
Здесь показана, год за годом,
of "thrived" and "throve" over time.
частота слов «процветал [thrived]» и «процветал [throve]».
00:05:50
Now this is just two
И это всего лишь два
out of two billion rows.
из двух миллиардов строк.
So the entire data set
Весь набор данных
is a billion times more awesome than this slide.
в миллиард раз круче, чем этот слайд.
(Laughter)
(Смех)
00:06:02
(Applause)
(Аплодисменты)
JM: Now there are many other pictures that are worth 500 billion words.
ЖМ: Есть много других картинок, которые стоят 500 миллиардов слов.
For instance, this one.
Например, вот эта.
скачать в HTML/PDF
share